Dlouhodobé uchování digitálních dat – 4.

Po delší odmlce se znovu pouštíme do další fáze budování dlouhodobého úložiště digitálních dat. Hardware máme sestavený a zahořený, dnes z něj budeme potřebovat hlavně klávesnici a monitor 😉

Samozřejmou součástí každého počítače je operační systém. Ti znalejší správně tuší, že na stroj s vysoce kritickými požadavky na stabilitu a výkon nejspíš nebudeme instalovat v muzeích dosud časté „osmadevadesátky“, ale sáhneme po něčem kvalitnějším. Možností je celá řada, ale v zásadě se jedná o dva směry: serverový operační systém od Microsoftu (MS Windows Server) nebo alternativa vyrůstající z Unixových kořenů (zejména *BSD a Linux, snad i Solaris). Konkrétní rozhodnutí samozřejmě závisí z velké části na osobních preferencích správce IT – nemá smysl se pouštět do něčeho, co vůbec neznám a nejsem si jistý, zda to budu schopen v budoucnu spravovat a upgradovat. Pro platformu Windows hovoří široká komerční podpora a spřízněnost s majoritním prostředím drtivé většiny kancelářských stanic. Není tedy potřeba se učit příliš mnoho nového a i základní filozofie ovládání a nastavení je obdobná. Proti naopak stojí cena, která může být u alternativních produktů zcela nulová (jedná se povětšinou o open-source software) a vyšší nároky na dodatečnou antivirovou a vůbec bezpečnostní ochranu. Znovu je potřeba zdůraznit, že tato otázka by neměla být řešena na úrovni fundamentalistických slovních přestřelek mezi zastánci obou táborů, nýbrž formou věcného rozhodování co je v dané situaci nejvýhodnější. Každodenní zrcadlení úložiště Technického muzea v Brně (běžícího na MS Windows Server) a partnerského serveru Moravského zemského muzea s operačním systémem FreeBSD ukazuje technickou řešitelnost softwarově heterogenní sítě datových úložišť.

Jak bylo uvedeno, v MZM slouží na datovém úložišti operační systém FreeBSD. Kromě faktu, že je síťový administrátor s tímto systémem důvěrně obeznámen, rozhodla o této volbě i pověstná stabilita (počítače běžící na BSD derivátech pravidelně obsazují horní příčky žebříčku „top uptime“), nulová cena (open-source volně ke stažení) a podpora veškerého potřebného hardwaru i systémových rutin včetně moderního souborového systému ZFS. Instalována byla třetí betaverze FreeBSD 7.0 pro platformu AMD64. Pro samotný operační systém (root filesystem) + kompletní databázovou nadstavbu postačuje 400 GB disk, diskové pole v konfiguraci RAID5 bylo sestaveno ze 4 disků o kapacitě 400 GB. Vzhledem k faktu, že značnou část diskové kapacity pohltí bezpečnostní režie RAIDu, byly před několika týdny doplněny další 4 disky a celková kapacita úložiště tak aktuálně dosahuje 3,2 TB.

Kromě samotného operačního systému potřebujeme ještě sadu služeb a skriptů, které se postarají o vstup a výstup dat do/z úložiště, správu metadat a zrcadlení s partnerským serverem Technického muzea v Brně. K tomu slouží následující moduly:

  • FTP server (ProFTPD) – umožňuje upload dat, případně i externě připravených metadat, do vstupního adresáře datového úložiště,
  • uživatelské rozhraní (PHP) – je nejsložitější částí systému. Poskytuje přístup k funcím úložiště prostřednictvím webového prohlížeče – výběr metadatové struktury a zápis metadat ke konkrétnímu souboru ve vstupním adresáři, zaznamenání těchto údajů do databáze (MySQL) a zároveň do XML souboru připojeného k popisovaným datům, vyhledávání datových souborů podle metadatových atributů a jejich poskytování uživateli,
  • archivace (bash skripty) – sada skriptů zajišťujících přebírání připravených souborů ze vstupního adresáře a jejich ukládání do diskového pole úložiště, každodenní zrcadlení obsahu úložiště zabezpečeným internetovým spojením,
  • obnova (bash skripty) – sada skriptů, které bychom rádi využívali co nejméně, v ideálním případě nepotřebovali vůbec. Slouží k obnovení obsahu datového úložiště po havárii, po ztrátě konzistence zrcadel, při znovusestavení RAIDu atd.

V testovací fázi používají úložiště pouze dva pověření zaměstnanci CITeM, kteří postupně ukládají digitální data Moravského zemského muzea nahromaděná za několik posledních let, opatřují je popisnými metadaty a ověřují funkčnost úložiště. V budoucnu samozřejmě počítáme se zpřístupněním uživatelského rozhraní všem odborným pracovníků muzea, kteří by tak získali možnost sami ukládat svá data vznikající v průběhu jejich práce. Už nyní je proto webové rozhraní obdařeno přitažlivou vizuální podobou s intuitivním ovládáním a nápovědou.

V posledním dílu miniseriálu se seznámíme s organizací práce s datovým úložištěm a uzavřeme jej malou úvahou nad archivní budoucností digitálních dat.