Formáty uložení dat

Z WikiCITeM

Kapitola z příručky Digitální dokumentace objektů kulturní, historické a vědecké hodnoty

V následujících tabulkách jsou uvedeny formáty a kodeky použitelné pro ukládání digitálních dat v obrazové, zvukové i kombinované podobě. Uvedeny nejsou formáty neperspektivní, málo rozšířené, nebo z jakéhokoli jiného důvodu pro dokumentační účely nepoužitelné.

Statický obraz

Formát Charakteristické vlastnosti Použití
BMP
(BitMaP)
  • původní nekomprimovaný formát obrazových dat
  • mimořádná velikost datových souborů
  • formát srozumitelný prakticky každému softwaru
dříve základní formát, dnes se pro obrovské nároky na paměťový prostor téměř nepoužívá
TIFF
(Tagged Image File Format)
  • umožňuje interní uložení základního souboru technických metadat (EXIF)
  • zahrnuje velké množství profilů a barevných prostorů, včetně prostorů nezávislých na aktuálně použitém zobrazovacím zařízení (např. CIE L*a*b)
  • podporuje ukládání dat v nekomprimované, bezztrátově komprimované (LZW) a ztrátově komprimované (nedoporučuje se) formě
  • až 16 bit barevná hloubka
  • zvládá uložení velkých datových objemů
  • prakticky nepoužitelný pro webové prezentace
  • obecně rozšířený formát s dlouhodobou systémovou podporou
v současné době základní formát pro editaci a uložení základních datových souborů, používán většinou digitálních fotoaparátů
RAW
  • jen u některých digitálních fotoaparátů
  • nestandardizovaný formát s různými specifikacemi u jednotlivých výrobců
  • mimořádné možnosti zvýšení technické kvality snímků
  • detailní popis barevného prostoru (až 12 bit ~ 68,7 mld. odstínů)
  • velký objem datového souboru
pouze konverzní formát s omezeným využitím, pro nejnáročnější aplikace
PNG
(Portable Network Graphics)
  • bezeztrátová komprese obrazových dat
  • dobrá podpora ve www prohlížečích
  • otevřený, patentově svobodný formát
  • platformní nezávislost (vynikající podpora i v Linuxu)
alternativa k JPG pro publikaci dat na internetu, interplatformní výměna obrazových dat,

alternativní formát pro ukládání základních datových souborů

JPEG
(Joint Photographic Experts Group)
  • ztrátová komprese obrazové informace (softwarově nastavitelná)
  • rušivé kompresní artefakty ("čtverečkování") při vyšší úrovni komprese
  • relativně malá velikost souborů
  • možnost společného uložení jen omezené sady technických metadat
  • podpora malého množství barevných prostorů
  • kumulace kvalitativních ztrát při rekompresi - nepoužitelné pro editaci
publikace na internetu, nevhodný pro liniová grafická data (text, perokresby)
JPEG 2000
  • komplikovanější způsob zakódování dat
  • podpora více stupňů rozlišení
  • rozšířené verze podporují vrstvy a barevné profily
  • umožňuje ztrátovou i bezeztrátovou kompresi
  • podpora rozšiřujících metadat v XML (včetně IPTC) mapovatelných na Dublin Core Metadata Standard
publikace na internetu, alternativní formát pro ukládání základních datových souborů
GIF
(Graphics Interchange Format)
  • umožňuje ztrátovou (high color) i bezeztrátovou kompresi obrazových dat
  • omezená šířka barevné palety
  • rychlé načítání (krátká dekomprese)
  • maximálně 8 bitová barevná hloubka
  • umožňuje ukládání průhledných obrázků nebo animací
publikace na internetu, nevhodné pro plnobarevná obrazová data (foto, malby), doporučeno pro kompresi liniových grafických dat

(webdesign, loga, tlačítka atd.)

PDF

(Portable Data Format)

  • komplexní metaformát
  • umožňuje současné uložení textových i grafických dat
  • XMP - současné uložení metadat ve formátu XML
  • podpora různých kompresních stupňů v různých částech dokumentu
  • pouze omezené množství barevných prostorů
  • nezávislost na hardware a systémovém prostředí
  • uzavřený proprietární formát (Adobe)
de facto standard pro přenos kombinované textově-obrazové informace

Zvuk

Formát Charakteristické vlastnosti Použití
WAV
  • původně nekomprimovaný formát zvukových dat
  • obvykle 16b vzorkování
  • mimořádná velikost datových souborů
  • obecné rozšíření
značné nároky na paměťový prostor, výchozí formát pro další zpracování a archivaci základních datových souborů, využívá se pro hudební CD
MP3
(MPEG Layer 3)
  • odvozen z kódování doprovodného zvuku ve videosouborech
  • široce rozšířený standard
  • ztrátová komprese dat (úroveň komprese lze nastavit)
  • až 10x menší velikost oproti WAV
  • rozdíl v kvalitě skoro nepozorovatelný
  • možnost současného uložení omezeného souboru metadat (ID3tag)
alternativa pro uložení základních datových souborů i jejich derivátů

(umí ho přehrát většina nových hi-fi, domácích kin a MP3 přehrávačů)

MP3PRO
  • modernější varianta předchozího formátu
  • SBR (Spectral Band Replication)
  • ztrátová komprese dat
  • zhruba poloviční velikost souborů oproti původnímu MP3
alternativa pro uložení základních datových souborů i jejich derivátů
WMA
(Windows Media Audio)
  • uzavřený formát závislý na podpoře ze strany fy Microsoft
  • úroveň komprese mírně lepší než u MP3
  • ztrátová i bezeztrátová komprese dat
  • možnost současného uložení omezeného souboru metadat, vč. podpory IPR (Intelectual Property Rights)
alternativa pro uložení základních datových souborů i jejich derivátů; copyrightovaný obsah

známý, ale méně používaný formát s podporou jen u PC a některých dražších hi-fi a MP3 přehrávačů

OGG
(Ogg Vorbis)
  • otevřený, patentově svobodný formát
  • platformní nezávislost (vynikající podpora v Linuxu)
  • ztrátová i bezeztrátová komprese dat
  • dobrá kvalita zvuku i při nízkých datových tocích
  • méně rozšířený a používaný
Publikace dat na internetu, interplatformní výměna dat,

alternativní formát pro ukládání základních datových souborů

MID
(MIDI)
  • pracuje přímo s notovým záznamem
  • závislost kvality přehrávání na hardwarovém vybavení
  • použitelné pouze pro záznam hudebních nástrojů
  • miniaturní objemy datových souborů
jen pro speciální hudební využití

Videosekvence

V případě videosekvencí je třeba důsledně rozlišovat pojem formát (kontejner, obálka - obecně způsob uložení dat) od pojmu kodek (způsob komprese dat):

Formát Charakteristické vlastnosti Použití
AVI
(Audio Video Interleave)
  • formát podporovaný většinou aplikací
  • možnost použití různých kompresních kodeků
  • značná velikost souboru
doporučený formát ukládání základních datových souborů
MPG
(Motion Picture Experts Group)
  • díky DVD široce rozšířený formát
  • velká softwarová podpora
  • preferovaný formát na internetu
  • nevýhodou zdlouhavá komprese dat
  • používá několik variant kompresních kodeků
doporučený formát ukládání základních i odvozených datových souborů
WMV
(Windows Media Video)
  • obvykle používá i stejnojmenný kodek
  • přehrávač součástí MS Windows
  • preferovaný formát fy Microsoft (dříve ASF)
doporučený formát ukládání odvozených datových souborů
MOV
(Motion Open Video)
  • používá stejnojmenný kodek
  • značná vazba na firemní přehrávač QuickTime
  • čitelnost v MacOS i MS Windows
  • omezené rozšíření
ukládání odvozených datových souborů, zejména pro scény s mnoha detaily
RV,RM
(RealVideo)
  • používá stejnojmenný kodek fy Real Media
  • problémy s ostrostí pozadí
  • striktní vazba na přehrávač RealPlayer
vzhledem k rigidní licenční politice prakticky nepoužitelný



Kodek Charakteristické vlastnosti Použití
DV
(Digital Video)
  • používaný u většiny digitálních videokamer
  • široce rozšířený, dobrá obrazová kvalita
  • možnost okamžitého převíjení v obou směrech
  • rozlišení 720 x 576 bodů (PAL)
  • fixní komprese
střih a kódování základních datových souborů
MPEG
(Motion Picture Experts Group)
  • řada variant kompresního kodeku rozšířeného díky DVD
  • kvalitní obraz při vyšších datových tocích
střih a kódování základních i odvozených datových souborů, jeden z nejrozšířenějších kodeků
MJPEG
(Motion JPEG)
  • vychází ze statického JPEG
  • libovolná velikost obrazu
  • nastavitelná ztrátovost komprese
  • dnes zřídka používaný
kódování odvozených datových souborů
WMV
(Windows Media Video)
  • dvouprůchodové kódování
  • proměnný datový tok
  • zdlouhavé kódování
  • horší zpracování drobných detailů
  • dobré zachycení dynamického pohybu
  • existuje i zdokonalená varianta WMV-HD
uložení odvozených datových souborů, zejména pro dynamické scény s menším množstvím detailů
DivX
  • nastavitelný datový tok (bitrate)
  • malé výstupní soubory
  • ztrátová (ale rychlá) komprese
  • komplikovanější licenční politika
kódování odvozených datových souborů, zejména pro statičtější scény s menším množstvím detailů
XviD
  • Open Source varianta předchozího
  • rozsáhlé možnosti individuálního nastavení parametrů
  • oproti DivX poněkud ostřejší detaily
  • někdy problémy se stabilitou
kódování odvozených datových souborů, zejména pro statické, málo kontrastní scény
MOV
(Motion Open Video)
  • základní kodek platformy MacOS
  • vysoká obrazová kvalita
kódování odvozených datových souborů, zejména pro detailní scény
RM
(RealMedia)
  • problémy s ostrostí pozadí a přechody mezi barvami
  • striktní vazba na přehrávač RealPlayer fy Real Media
vzhledem k rigidní licenční politice prakticky nepoužitelný, jen pro internetové vysílání

Doprovodná atributová data a metadata

Formát Charakteristické vlastnosti Použití
TXT
(TeXT)
  • obecně rozšířený a čitelný formát
  • omezená znaková sada
  • problémy s kódováním národních znaků
  • zastaralost
standardní exportní formát databází (pro udržení zpětné kompatibility), výstup do textových sestav
CSV
(Comma Separated Values)
  • zvláštní typ předchozího formátu
  • lze použít různé oddělovače hodnot (tečka středník, tabulátor…)
uložení tabulkových a databázových údajů bez nároků na formátování
DOC
  • základní formát aplikace MS Word
  • uzavřený standard s mnoha variantami
  • problémy s čitelností mimo aplikace fy Microsoft
alternativní formát pro uložení formátovaných textových dat s krátkodobou životností
RTF
(Rich Text Format)
  • podpora ve většině textových editorů
  • dovoluje bohaté formátování dokumentů
  • velké konverzní možnosti
standardní formát pro formátovaná textová data
DBF
(Data Base File)
  • importní i exportní podpora ve všech rozšířených databázových strojích i tabulkových editorech
  • více vzájemně odlišných verzí
základní exportní / importní formát většiny současných databázových strojů
EXIF
  • integrace přímo do souboru obrazových dat
  • automatické generování technických metadat digitálními fotoaparáty
  • možnost nezáměrného poškození při editaci obrazového souboru nevhodnými nástroji
  • omezený rejstřík značek (tagů)
zápis a zpracování zejména technických metadat o expozici snímku, pro archivaci méně vhodný
XML
(eXtended Markup Language)
  • hierarchická struktura - interoperabilita s jinými skriptovacími jazyky
  • perspektiva dalšího rozšíření
  • snadná standardizovatelnost via www
  • platformní nezávislost
  • dobrá podpora národních jazyků
napojení databází na internetové technologie, výměnný formát pro standardizovaná DTD, jeden z perspektivních způsobů ukládání digitálních textových dat
XLS
(eXceL Sheet)
  • nativní formát aplikace MS Excel (součást kancelářského balíku MS Office)
  • obecně rozšířený a čitelný
  • nestandardizovaný proprietární formát s častými změnami ze strany výrobce (Microsoft)
  • nedostačující pro velké databáze
formát nejjednodušších amatérských "databází", standard pro komunikaci s MS Office, pro větší aplikace má minimální význam
další
  • řada málo rozšířených "standardů" a proprietárních formátů různých dodavatelů
  • některé částečné výhody (rychlost, velikost, snadná implementovatelnost, )
  • obvykle špatná interoperabilita a minimální podpora v obvyklých databázových strojích
komunikační formáty pro výměnu dat s jinými systémy, v případě

dobře propracovaných exportních a importních funkcí možný interní formát malých databází