Dlouhodobé uchování digitálních dat – 5.

Dlouho odkládaný poslední díl seriálu o budování společného datového úložiště Moravského zemského muzea a Technického muzea v Brně popisuje organizační zajištění jeho fungování a pokusí se i kriticky zhodnotit zkušenosti získané v průběhu projektu.

Správou datového úložiště je na straně MZM pověřen pouze jeden pracovník – správce datového úložiště, který má jako jediný plný administrátorský přístup ke všem funkcím datového úložiště. Stejné pravomoce má pochopitelně z titulu správy systému, na kterém datové úložiště funguje, i systémový správce. V kompetenci správce datového úložiště je zejména:

  • zřizování a rušení uživatelských účtů pro jednotlivé zaměstnance MZM, kteří data ukládají,
  • převod kompetencí spojených se zrušenými účty na nové zaměstnance (v případě personálních změn na pracovištích),
  • kontrola kvality a obsahu dat deponovaných do úložiště,
  • revize úplnosti a validity doprovodné metadatové dokumentace.

Jednotliví zaměstnanci s přiděleným uživatelským účtem pak pomocí webového prohlížeče nebo FTP klienta samostatně nahrávají (uploadují) datové soubory do své podsložky datového úložiště. Po přihlášení do webového rozhraní datového úložiště se všechny takto nahrané soubory zobrazují v přehledném seznamu, kde lze zkontrolovat status souboru a posoudit zda je soubor způsobilý k odeslání do archivní části datového úložiště.

Podatelna

Metadatový popis lze vytvořit či upravit buďto přímou editací v tzv. metaeditoru, nebo (jsou-li metadata už připravena odjinud) připojit prostým uploadem stejně pojmenovaného souboru s doplněnou druhou příponou „.XML“. Metadatové informace jsou v systému ukládány pro jistotu duplicitně, v XML souborech v úložišti a v databázovém tvaru. Teprve po kliknutí na tlačítko „Odeslat“ dojde k definitivnímu přesunutí souborů i s jejich metadatovým popisem do vlastního úložiště, kde se systém automaticky postará o jejich zařazení do souborového systému a odzrcadlení na druhou část datového úložiště – tedy v našem případě na server Technického muzea v Brně.
Pro získání dat z úložiště musí být opět uživatel vybaven patřičnými právy. Obecně platí, že právo opětovně získat soubor z úložiště má kromě správce datového úložiště vždy jen ten, kdo soubor původně uložil, popřípadě jeho nástupce stanovený správcem datového úložiště. Ostatní uživatelé mohou pouze ověřit zda v úložišti existuje soubor odpovídající zadaným vyhledávacím kritériím; o jeho stažení a poskytnutí však musejí požádat vlastníka (repozitora). Vyhledávání má dvě podoby: prostý text (zadaný řetezec znaků se vyhledává napříč celými metadatovými popisy všech souborů) a podrobný (umožňuje kombinovat různá vyhledávací kriteria specificky podle polí vybraného metadatového standardu.

Podrobné hledání

Ve výpisu výsledků hledání se pak zobrazí nejen všechny uložené soubory vyhovující zadaným parametrům, ale je možné ke každému z nich zobrazit i všechny metadatové údaje. V případě že má přihlášený uživatel dostatečná práva, je mu umožněno i stažení souboru (nebo více vybraných souborů) do jeho podsložky datového úložiště.

výsledky hledání

Obslužný software datového úložiště dále poskytuje základní funkce pro monitoring a údržbu celého systému přímo z prostředí webového rozhraní. Co naopak zbývá doplnit jsou spolehlivé nástroje pro meziformátovou migraci dat a samozřejmě je plánován i základní audit datového úložiště podle metodiky DRAMBORA.

Některé zkušenosti získané v průběhu realizace a evaluace projektu:

  1. Opětovně se potvrzuje, že jakýkoli hardware velmi rychle zastarává – zejména po morální stránce. Zpočátku ohromující parametry datového úložiště se v dnešní době mohou jevit jako přízemní až směšné.
  2. Akceptace pouze otevřených a dokumentovaných technologií je silnou prevencí závislosti na konkrétním dodavateli (vendor lock-in). Ani to však nemusí úplně eliminovat vznik situace, ve které zajišťování náhrady za chybějící (byť dostatečně dokumentovaný) systémový prvek znamená velmi citelné finanční zatížení a dlouhodobý výpadek provozu.
  3. Bezpečnost dat stojí na solidním smluvním zajištění provozu úložiště. O to více, pokud se jedná o úložiště sdílené, které sestává ze dvou částí spravovaných různými institucemi.
  4. Nejslabším článkem systému je lidský faktor. Zatímco techniku lze doplnit diagnostickými prvky a řádně otestovat, drobná lidská selhání, opomenutí nebo nedůslednost setrvale ohrožují systém po celou dobu jeho životnosti a na předem těžko identifikovatelných místech.
  5. Po metodické stránce oprávněná snaha o podchycení maximálního množství metadat k ukládaným datovým souborům je v příkrém rozporu s uživatelskou přívětivostí systému. Základní metadatová sada v rozsahu Dublin Core se tedy osvědčuje jako přijatelně kompromisní a zároveň univerzální řešení.
  6. Navržený a realizovaný paralelní zápis metadat do databáze a XML souborů v datovém úložišti se zdá být dostatečně robustní a transparentní. Je možné počítat s bezproblémovou obnovou dat i metadat dokonce i v případě zachování pouhého souborového systému datových disků. Metadatový formát Dublin Core v XML souborech je jednoznačně interpretovatelný a pro znovusestavení databáze metadat nejsou nezbytné žádné speciální nástroje.

Demonstrace datového úložiště bude součástí prosincového semináře v Technickém muzeu v Brně, na který je zainteresovaná muzejní veřejnost srdečně zvána.