Inzicht DWG-bestanden netwerkschijven
Bij het waterschap zijn we in bezit van grote hoeveelheden kunstwerken. De bouwtekeningen van deze kunstwerken staan voornamelijk opgeslagen in DWG-bestanden. We hebben grote hoeveelheden van deze bestanden staan op de netwerkschijven waarbij de vraag is of deze al geborgd zijn in archiefsysteem Meridian.
Vanuit het DEEP-programma (intodeep.AI) hebben we dit opgepakt en deze vraag hebben we opgedeeld in 2 deelvragen.
1. Staat precies hetzelfde bestand al in Meridian?
2. Is er een oudere of nieuwere versie al in Meridian?
We hebben deze analyse losgelaten op de folders (en subfolders) van Beheer waterketen, Informatievoorziening en Technische projecten. Goed voor 64000 bestanden. Daaruit bleek dat zo’n 13000 bestanden al opgeslagen waren in Meridian, 30000 bestanden een oudere of nieuwere versie in Meridian hebben, zo’n 9000 misschien een oudere of nieuwere versie hebben en de overige 12000 hoogstwaarschijnlijk geen match hebben.
Hieruit blijkt dat veel van de bestanden dubbel zijn opgeslagen en er ook nog grote hoeveelheden DWG-bestanden nog niet opgeslagen zijn in Meridian. Ook de grote hoeveelheden van verschillende versies opgeslagen op de schijf creëert het risico dat verouderde versies worden gebruikt.
Als eindresultaat hebben we een Excel file gemaakt waarin zowel een overzicht is van de totale resultaten als per individuele file met welke file die die de grootste overeenkomst toont. Dit kan gebruikt worden om oudere versies op te sporen en te verwijderen, en bestanden in Meridian zetten waarvan de nieuwste versie nog niet geborgd is. Verder is het proces zo opgezet dat de analyse herhaaldelijk kan worden uitgevoerd en dat het generiek genoeg is dat het met een paar aanpassingen uit kan worden gevoerd op andere type bestanden met tekst.