Databáze pro správu fotografií

Z WikiCITeM

Na textu se pracuje, nehotová místa jsou značena hvězdičkami ***.
Uvítám jakékoliv komentáře, opravy a zpřesnění textu.

Jan Hubička, Muzeum fotografie Šechtl a Voseček

Pátá kapitola z Digitalizace historických fotografických materiálů. Další kapitoly jsou:

  1. Volba hardware k digitalizaci
  2. V jaké kvalitě digitalizovat
  3. Základní postup digitalizace
  4. Tisk fotografií z digitálních předloh
  5. Databáze pro správu fotografií
  6. Zpřístupnění archívu
  7. Uložení a archivace digitálních dat

Pro správu digitalizovaných fotografií používáme vlastní databázi. Při návrhu databáze byl kladen důraz zejména na čitelnost dat v budoucnosti i možnosti práce bez přístupu ke všem zdigitalizovaným fotografiím naráz. Data jsou uložena ve standardním XML, které půjde zpracovat, i kdyby se aktuální software pro správu databáze přestal používat.

Na rozdíl od mnoha databází na správu fotografií nebylo pro uložení informace použito metadat původních souborů: informace lze uložit přímo do suborů s obrázky pomocí tzv. EXIF tagů. Problémem tohoto přístupu je, že data jsou k dispozici pouze spolu s fotografiemi a prostor pro uložení všech fotografií v plné kvalitě je značný a není praktické vyžadovat je všechny přístupné naráz.

Databáze používá zmenšené náhledy fotografií ve formátu standardního JPEG o šířce 1200 pixelů. Celá databáze obsahující cca 18 tisíc fotografíí se tak vejde i se zmenšenými náhledy do prostoru 4 GB. Náhledy jsou dále zmenšeny pro potřeby internetu do rozměru 480 pixelů po delší straně. Tato velikost byla zvolena jako kompromis mezi využitelností databáze a obavou z toho, že si lidé budou fotografie z databáze bez dovolení vypůjčovat pro různé účely.

Záznamy o fotografii

O každé fotografii udržujeme následující záznamy:

  • Materiál
    Materiál fotografie včetně rozměrů u materiálů, kde je běžné mít jen několik málo rozměrů (u skleněných negativů a moderních filmů). Při zadávání se materiál vybere z roletkového menu, které je průběžně doplňováno o nové materiály podle potřeby.
  • Lakování
    Skleněné negativy bývají lakovány. Tato informace je užitečná pro datování fotografií: většinou se lakovaly negativy jen před rokem 1900.
  • Minimální a maximální rok vzniku
    Rozmezí let, kdy mohla být fotografie pořízena. Do tohoto pole zadáváme datování buď podle popisku, nebo podle obsahu fotografie. U méně zjevných datování pak píšeme důvod datování do poznámek. Při automatickém zpracování fotografie ještě zúžit podle informací známých o využívání jednotlivých materiálů.
  • Vlastník a umístění
    Do databáze přidáváme nejen fotografie uložené v našem archívu, ale i v oblastním archívu v Táboře, a digitalizujeme i fotografie Šechtla a Vosečka zapůjčené ze soukromých vlastnictví. Tyto pozitivy velmi zajímavě dokumentují vyžití fotografií, které se nám zachovaly převážně jen na negativech.
  • Kvalita
    Hodnocení kvality fotografie ve stupnici od 1 do 5. Tato funkce vznikla jako výsledek původních diskuzí, jestli zveřejňovat vše nebo pouze kvalitní fotografie a jestli lepší fotografie v databázi upřednostňovat. Postupem času tato funkce přestala být používána a určuje pouze řazení fotografií v jednotlivých kategoriích.
  • Autor fotografie
    Autor fotografie, pokud je prokazatelně známý.
  • Český a anglický název
    Krátký název fotografie. Anglický název vyplňujeme jen u fotografií, které byly vystaveny a kde názvy byly přeloženy. V ostatních případech se cizojazyční zájemci musí spokojit se strojovým překladem klíčových slov.
  • Český a anglický popis
    Delší popis fotografie. Zde uvádíme původní popisky i nově zjištěné informace včetně zdrojů. Jedna z chyb naší databáze je, že původní údaje od nových nejsou nijak jednoznačně odděleny.
  • Texty na fotografii
    Aby bylo možné prohledávání, snažíme se zde opisovat veškeré texty objevující se na fotografii, jako například názvy obchodů apod. Toto pole neobsahuje texty napsané přímo na negativu tuží mimo obrazovou část nebo poznámky na přebalových papírech, které patří do sekce popis.
  • Poznámky
    Poznámky nejsou zveřejňovány a obsahují například záznam o změnách a další informace, které z nějakých důvodů nechceme zveřejnit.
  • Kategorie
    Seznam kategorií, do kterých fotografie patří.
  • Klíčová slova
    Původní představa byla uvádět v tomto políčku informace o objektech na fotografii v prvním pádě jednotného čísla. Ke klíčovým slovům existuje slovník, který umožňuje překlad do angličtiny i lepší kontrolu chyb. Bohužel se nepodařilo udržet konzistentní kvalitu a často klíčová slova obsahují jen kopii názvu a různě skloněná slova a seznamy jsou velmi neúplné. V budoucnu však doufáme, že se podaří situaci zlepšit. Klíčová slova se také automaticky doplňují podle kategorií: například kategorie portréty mužů doplní automaticky klíčová slova „portrét“ a „muž“.

Vyhledávání v databázi

Databáze je organizována do stromové struktury kategorií podobné jako u webových katalogů typu Yahoo nebo Seznam. Dále lze databázi prohlížet podle let, uložení originálů, materiálů, čísla zakázky. Prohledávání podle klíčových slov nebylo implementováno, ale internetové vyhledávače (např. Google) je poskytují uspokojivě.

Organizace stromu kategorií

Strom kategorií dělí fotografie podle obsahu i formy. Jedna fotografie může být obsažena v několika kategoriích a kategorie mohou obsahovat odkazy na související podkategorie jiných částí stromu.

Vlastní strom vznikl postupným vývojem a jednotlivé kategorie byly zakládány z nejrůznějších důvodů. Kategorie, v nichž možství snímků přesáhlo rozumnou míru, byly rozdělovány.

Mezi základní dělení patří dělení podle formy:

  • Události
    Fotografie nejrůznějších události do množství 3 snímků z jedné akce
  • Reportáže
    Větší reportážní celky (více než 3 snímky)
  • Portréty a postavy
    Portrétní fotografie v atelieru i v exterieru, kde jsou maximálně dvě osoby
  • Skupinové fotografie
    Skupiny obsahující 3 a více osob.
  • Tabla
  • Města a vesnice, Hrady a zámky, Cizina, Kláštery, Interiery, Krajiny
    Místopisné fotografie.
  • Technika, Koně a kočáry, při práci ***?
    Místopisné fotografie. ***?

Další kategorie mají spíše společenský význam:

  • Kluby a spolky
  • Kultura
  • Osobnosti
    Fotografie týkající se známých osobností (například Edvarda Beneše či jiných osobností portrétovaných v atelieru). Jedná se nejen o fotografie osobností, ale i věcí s nimi spojených, například interiery vily Edvarda Beneše či reportáž z jeho návštěvy Tábora.
  • firma Šechtl a Voseček
  • Rodiny
    Pokud se podaří dohledat fotografie týkající se jedné rodiny - například z rodiného alba, tyto kategorie sdružují skupinové fotografie, portréty, ale i vše další, co se dané rodiny týká. Například fotografie nemovitostí.
  • Šlechta
    Podobný význam jako u rodin.
  • Umělecké fotografie
  • Reklama

Nakonec byly založeny kategorie pro některé méně obvyklé techniky. Například ušlechtilé tisky, rentgenové fotografie, stereoskopické fotografie, autchromy.

Výsledkem tohoto poněkud nekoncepčního vývoje je, že každý uživatel stromu kategorií potřebuje trochu času si na systém zvyknout. Strom kategorií však představuje zcela nejvyužívanější metodu hledání fotografí v archívu a je užitečný zejména pro ty, kteří nevědí přesně, co hledají, a pouze se chtějí s archívem seznámit.

Vlastní strom lze snadno modifikovat, a proto dnes s kvalitnější představou o tématickém členění archívu je snadné jej přeorganizovat v přehlednější pomůcku.

Automatické kontroly konzistence údajů zadaných do databáze

Databáze automaticky kontroluje některé informace. Datování je ověřováno porovnáním s čísly zakázek: informace o číslování zakázek byly sice ztraceny, ale podle několika fotografií s přesným datováním i číslem bylo určeno přibližné přiřazení čísel k jednotlivým rokům. Podle tohoto přiřazení se fotografie kontrolují, a pokud jejich datování neodpovídá číslu, je opraveno buď datum, nebo číslo, nebo vlastní algoritmus pro aproximaci. U nedatovaných fotografií je také určení roku podle čísla vypisováno takto: Nejbližší starší datovaná má číslo 1 a je z roku 1907. Nejbližší mladší datovaná má číslo 288 a je z roku 1908. Tato fotografie tedy bude přibližně z roku 1908...

Další kontrola datování probíhá podle stromu kategorií. Napřílad kategorie „portréty T. G. Masaryka“ má nastavený maximální rozsah podle jeho narození a úmrtí. Pokud datování fotografie nespadá do tohoto intervalu, je označeno za chybné. Je možné v tomto pravidlu dělat výjímky: například portrét T. G. Masaryka na výstavě uspořádané po jeho smrti je správně datován do pozdějšího data.

Klíčová slova jsou kontrolována podle slovníku, který je průběžně doplňován podle potřeby.

Správa upravených fotografií

Fotografie pro tisk jsou upravovány z půvdních RAW scanů. Protože se jedná o náročnou proceduru, jednotlivé upravené a vyretušované fotografie archivujeme a vkládáme do databáze, kde se zobrazují jako alternativní verze obrázku. Pomocí této funkce lze do databáze vložit také zajímavé detaily, skeny zadních stran fotografií a další podobné informace.

Správa archivace

Do databáze také vkládáme informace o jednotlivých archivních médiích tak, jak jsou vytvářeny a případně ničeny. Jednoduchý nástroj kontroluje, že všechny zálohované soubory by měly existovat ve třech kopiích a že jsme nezapomněli některé naskenované fotografie do databáze zařadit.

Pokračování