Dlouhodobé uchování digitálních dat – 1.

Dnes se na našich webových stránkách setkáváte s prvním dílem slibovaného seriálu věnovaného konkrétnímu postupu při budování datového úložiště. Modelem bude systém určený pro dlouhodobé uchování digitálních dat Moravského zemského muzea a Technického muzea v Brně. Než se ale dostaneme ke konkrétnímu technickému řešení, ponoříme se alespoň v tomto prvním díle do teorie.

I. díl

Proč potřebujeme dlouhodobě uchovávat digitální data? Jak dlouho je chceme mít k dispozici? Která záznamová média pro tento účel využijeme?

Přesto, že označení „počítač“ nás odkazuje kamsi k počítacím strojům, dnešní využití výpočetní techniky ponechává tuto její prvotní funkci daleko v pozadí. V muzeích se stále častěji setkáváme s bezprostředním využitím počítače jako prostředku pro odborné zpracování, evidenci a dokumentaci sbírek. Tedy samozřejmě nejen sbírek, ale i všeho co do sbírek zařadit nelze a přesto si zaslouží býti zdokumentováno a uchováno pro budoucnost. Děje se tak prostřednictvím digitální dokumentace, nebo v přeneseném smyslu „digitalizace“, jejímž výsledkem jsou datové soubory uchovávající textovou, obrazovou, zvukovou nebo kombinovanou formu informace o dokumentovaném objektu. Stejně jako máme papírové inventární knihy a dokumentační karty uschované na bezpečném místě, musíme se podobně postarat i o trvalost těchto nehmotných souborů zapsaných na nestálých datových nosičích.

Prvně si musíme uvědomit, že u různých datových souborů předpokládáme různou dobu jejich životnosti a předpokládané využitelnosti. Obsah vyrovnávací paměti (cache) při prohlížení internetových stránek se plní soubory jejichž očekávaná životnost je několik minut až hodin. Pak nebudou potřeba a počítač si tento datový obsah znovu stáhne z internetu (odkud už ale mezi tím mohl klidně zmizet). Soubor s rozpisem otvíracích hodin, který v počítači vytvoříte, vytisknete a pověsíte na dveře vašeho muzea bude aktuální pravděpodobně celou sezónu nebo několik sezón. Může se tedy stát, že po důkladném srpnovém lijáku budete chtít ceduli znovu vytisknout z už dříve připraveného souboru a nahradit její rozpitou a potrhanou verzi na dveřích. Taková data si zaslouží uložit a především vědět kde je najdu. Cestovní zpráva z terénu může být zajímavá i po mnoha letech. Badatel zpracovávající pozůstalost díky ní získá nenahraditelné informace o tom, kde dotyčný onoho dne pobýval, které oblasti navštívil a může tak například ozřejmit spornou lokalizaci významného nálezu uchovávaného ve sbírkách. Využitelnost takových dat se tedy pohybuje v řádu minimálně desítek let. A nakonec tu máme data o sbírkách. Na sklonku druhé světové války byla část sbírkových fondů Moravského zemského muzea evakuována z Brna do Mikulova, kde měla být uchráněna před očekávaným spojeneckým bombardováním moravské metropole. Ironií osudu zůstaly historické muzejní budovy v Brně ušetřeny, zatímco depozitář v mikulovském zámku lehl popelem. Jedinými doklady například o sérii paleolitických archeologických nálezů z Předmostí u Přerova tak zůstává předválečná dokumentace těchto sbírkových předmětů, tehdy samozřejmě pořízená ještě klasickou formou na papírových kartách a pomocí černobílých fotografií. V roce 2000 se tak s využitím téměř sedmdesát let staré fotodokumentace podařilo „znovuobjevit“ zlomek lidské spodní čelisti (Předmostí 21) ve fondech Vlastivědného muzea v Olomouci. Nemusíme chodit ani do dávné minulosti. Stačí si vzpomenout na příklady odcizených uměleckých děl, která se do sbírek muzeí a galerií vrátila jen díky existující digitální dokumentaci umožňující její vypátrání. Tato data by tedy měla být bezpečně uchována minimálně po dobu existence příslušného sbírkového předmětu, lépe však ještě mnohem déle. Dostáváme se tím k navýsost choulostivé problematice uchování informace v horizontu stovek let!

Prvním místem kde se každá informace v počítači objeví po zpracování jeho procesorem, je operační paměť (RAM). Abychom o data nepřišli s vypnutím PC, ukládá se na různá záznamová média. Jejich vhodnost pro dlouhodobé uložení dat je různá a jak si vzápětí popíšeme, žádné ze stávajících médií nám samo o sobě nemůže garantovat čitelnost zapsané informace po uplynutí několika desítek až stovek let.

PEVNÝ DISK (harddisk)

Se zvyšující se kapacitou moderních disků se stále častěji setkáváme s dlouhodobým ukládáním i velkých objemů dat na tato média. Trvanlivost magnetického záznamu na plotnách pevného disku se pohybuje v řádu let až několika málo desítek let. Výhodou je však mimořádně snadná manipulace s daty a možnost jejich snadného kopírování, přesouvání, oživení záznamu. Disky jsou pevně spojené se zapisovacím a čtecím mechanismem. Tento celek může být přímo zabudován v počítači (notebook, PC), nebo v oddělené skříni (diskové pole u serverů), nebo zcela samostatně (tzv. externí pevné disky).

DISKETA

Dnes už prakticky mrtvé médium s nepatrnou záznamovou kapacitou. Trvanlivost záznamu je obdobná (nebo mírně nižší) než u pevného disku, manipulace s médii složitější. V moderních počítačích už dávno nenajdeme mechaniky umožňující čtení starých formátů disket (5,25″, 8″), ba dokonce i dodnes používaná disketa 3,5″ se stává anachronismem.

CD/DVD-ROM/RW/RAM

Tento typ médií býval po dlouhou dobu považován za téměř nezničitelný a jediným významnějším vlivem způsobujícím jeho poškození a následnou nečitelnost mělo být mechanické poškození, zejména poškrábání. Dnes víme o poškození záznamové vrstvy vyvolaném například i činností mikroorganismů, nebo fyzikálním stárnutí organických barviv. Rovněž masová produkce zaměřená na maximální kvantitu výroby při minimální možné ceně příliš nenahrává kvalitě médií. Předpokládaná trvanlivost se i při uložení v kontrolovaných podmínkách pohybuje v řádu 10-100let (podle typu média).

Flash-EPROM

Vzhledem k relativní modernosti média zatím chybějí relevantní údaje. Většinou výrobců je udávána minimální doba udržení dat v horizontu asi 10 let. „Flešky“ nebo „klíčenky“ vybavené pamětmi typu Flash postupně vytlačují diskety a v blízké budoucnosti je zřejmě zcela nahradí. Jako velkokapacitní médium pro dlouhodobé uchování digitálních dat se však dosud nepoužívají a v nejbližších letech ani používat nezačnou.

MAGNETOOPTICKÉ DISKY

I přes některé nesporné výhody (vysoká kapacita, značná trvanlivost záznamu) jsou dnes poměrně málo známým a polozapomenutým médiem. Vzhledem k absenci jednotného záznamového standardu a malému rozšíření může být problém s přečtením takto zapsaných dat v budoucnosti.

MAGNETICKÉ PÁSKOVÉ PAMĚTI

V prvopočátcích výpočetní techniky zdaleka nejrozšířenější magnetické médium. Dnes se používá především jako levná alternativa pro zálohování serverů, v rozsáhlých datových skladech i jako primární archivační médium. Předpokládaná trvanlivost záznamu závisí na provedení pásky a pohybuje se kolem 30 let.

A teď ještě malé srovnání s klasickými záznamovými médii:

PAPÍR, PERGAMEN

Média používaná od úsvitu evropské civilizace. Dobře skladovaný ruční papír nebo pergamen nese zapsanou informaci i po několika stovkách let a data není problém přečíst bez použití jakékoli techniky. Problémem může být pouze použitý formát dat (rozuměj jazyk, písmo), což se ovšem týká i všech digitálních médií. Oproti tomu životnost tisku ze soudobé termotiskárny je jen několik měsíců. Velmi totiž záleží i na vhodném barvivu (inkoust, tuš, klasická tuha nebo toner z laserové tiskárny) a jeho interakci s podkladem.

KOV, KERAMIKA, KÁMEN

Prakticky nezničitelné nosiče informací, jejichž životnost je omezena pouze působením základních fyzikálních a geologických faktorů. Lze předpokládat, že lidské výtvory z těchto materiálů několikanásobně přetrvají existenci naší civilizace. Proti jejich použití v roli záznamového média hovoří nízká kapacita a komplikovaný zápis dat.

Jako efektivní se v současnosti jeví strategie kombinující několik způsobů uložení, resp. záznamových médií. Poměrně obvyklé je například využití velkokapacitního diskového pole a paralelní ukládání bezpečnostních záloh na optické nosiče, tedy vypalování na CD/DVD. Jakou strategii ve spolupráci s CITeM zvolilo pro uložení svých dat Moravské zemské muzeum se dozvíte v příštím pokračování seriálu.