Databázové zpracování

Z WikiCITeM

Kapitola z příručky Digitální dokumentace objektů kulturní, historické a vědecké hodnoty

Cílem databázového zpracování digitálních dat je zejména připravit data k operativnímu využití, umožnit vyhledávání podle zadaných kritérií a zabezpečit je proti ztrátě.

Požadavky na databázový systém

Databázový systém musí umožňovat práci s heterogenními daty uloženými jak v textové podobě, tak i v binárních souborech různých formátů.

Součástí systému musejí být nástroje umožňující přinejmenším prohlížení (přehrání) připojených souborů s digitální dokumentací. U grafických formátů je velmi žádoucí možnost tisku.

Systém musí umožňovat export atributových dat alespoň do základních transportních formátů (dbf, text s oddělovači, formátovaný text) a jejich tisk ve formě katalogových karet i tabelárního seznamu

Podle Metodického pokynu MK ČR ze 13. 10. 2004 (platného pro jím zřizované organizace) musí základní soubor popisných atributů digitalizovaných předmětů obsahovat alespoň tyto:

Evidenční číslo

typicky inventární číslo nebo jiné jedinečné alfanumerické označení předmětu v rámci vlastnické instituce

  • např. "E43285", "OLM 11546", "15/1913"

Skupina

zařazení do skupiny předmětů téhož druhu

  • např. "linoryt", "vycpanina", "instalace"

Titul

slovní označení námětu nebo obsahu konkrétního předmětu

  • např. "P. Maria Sedmibolestná", "Galium boreale subsp. Exoletum", "bez názvu"

Autor

identifikace autora či původce předmětu

  • např. "neznámý", "J. Podpěra", "sign. DC"

Datace

alespoň přibližný údaj o době vzniku (u přírodnin době sběru) předmětu

  • např. "cca 17. stol.", "21. 6. 1936", "druhá polovina 90. let XX. Století"

Měřitelný atribut

název míry, její číselná hodnota a jednotka sloužící jako upřesňující charakteristika předmětu

  • např. "výška 275 cm", "hmotnost 47 kar.", "stopáž 108 min."

Vlastník

název a kontaktní adresa vlastnické instituce či osoby"

  • např. "Karel Mráz, nám. Přemysla Otakara 34, 682 01 Vyškov"

Depozice

místo trvalého (obvyklého) uložení předmětu; mimo sídlo vlastníka je třeba uvést přesnou geografickou lokalizaci

  • např. "geologický depozitář", "Bučovice, Zámek 1, 685 01", "Poděbrady, lázeňský park před vlakovým nádražím, SV část"

Dokumentace

jednoznačný odkaz na binární soubory s digitální dokumentací

  • např. ve formě URL, cesty v lokálním souborovém systému, nebo kombinace síťové adresy a jména souboru

Technika a materiál

obvykle vyplývá z pole Skupina

Popis

částečně duplikuje pole Titul a v menší míře i ostatní pole

Uvedené požadavky, z u nás běžně používaných databázových systémů, splňuje například Demus, ve většině oborů i Bach ProMuzeum.

Pro dokumentaci objektů (předmětů i jevů), které nejsou součástí sbírkového fondu, nestanovuje Ministerstvo kultury ČR žádná pravidla. Lze však jen doporučit maximální snahu o dodržení zmiňovaného souboru popisných atributů (byť v modifikované podobě) i pro tuto dokumentaci. Situace se totiž neustále vyvíjí a lze předpokládat, že i dokumenty uložené v digitální podobě se v budoucnu stanou plnohodnotnou součástí sbírkových fondů. Prosté hromadění digitálních fotografií, nahrávek atd. bez odpovídajícího popisu postrádá jakýkoli hlubší smysl a v zásadě odporuje metodám vědecké práce.

Pracovní postup

Z důvodu relativně snadného přerušení vazby mezi daty je žádoucí soubory s digitální dokumentací (obrazovou apod.) co nejdříve po jejich pořízení všechny přiřadit k doprovodné textové informaci. To se týká jak nativní, neupravené digitální dokumentace v archivní kvalitě, tak i všech následně odvozených datových souborů. Digitální textová data by měla být pořízena předem nebo současně s ostatní digitální dokumentací. Počet binárních souborů dosud nedokumentovaných požadovanou atributovou informací v databázi nesmí v průběhu žádné fáze digitalizačního projektu přesáhnout zároveň obě z hodnot stanovených v tabulce:

aktuálně zdigitalizované objekty dosud nedokumentované soubory
  max.počet kusů max. % binárních souborů
0 - 10 5 40 %
11 - 100 10 20 %
101 - 1 000 20 10 %
1 001 - 10 000 40 5 %
více než 10 000 80 2 %

Výjimkou jsou samozřejmě digitální data získaná před přijetím závazné institucionální směrnice a data pořizovaná v terénu, bez možnosti přímého transferu do počítače. Při terénní práci však obdobné požadavky platí i pro předběžné zajištění doplňujících dat formou zápisu v pracovní dokumentaci (výkopový deník, soupis fytocenologických snímků, "škrták" apod.).

V případě, že jsou databázově zpracovávána i doplňková metadata popisující jednotlivé binární soubory (snímky, záznamy ...), řídí se režim jejich pořizování a záznamu stejnými pravidly. Při výběru způsobu jejich uložení je velmi žádoucí dodržovat obecně uznávané mezinárodní standardy - např.:

Dublin Core (http://dublincore.org/documents),

CIMI (http://www.cimi.org/old_site/standards/index.html 2008-07-10 je nefunkční, náhrada: http://xml.coverpages.org/cimi.html)

SGML/XML (http://www.w3.org/XML),

RDF (http://www.w3.org/RDF) atd.