Digitální komprese obrazu, jak funguje a jak mění naše životy?

Technologie digitální komprese obrazu efektivně redukuje data a usnadňuje jejich ukládání a přenos. V tomto článku se podíváme na to, jak funguje a jak ovlivňuje náš život.

 

Digitální obrázek je digitální reprezentace fotografie nebo kresby. Tyto digitální obrázky se skládají z pixelů, což jsou nejmenší jednotky bodů, a každému pixelu je přiřazena hodnota, která představuje něco jako jas nebo barvu. Obecně platí, že čím vyšší počet pixelů, tím vyšší rozlišení, ale na úkor množství uložených dat. K efektivnímu ukládání a přenosu těchto digitálních obrázků jsou zapotřebí techniky komprese digitálního obrazu, aby se snížilo množství dat.
Existují dva typy technik komprese digitálního obrazu: bezeztrátová komprese a ztrátová komprese. Bezeztrátová komprese je méně účinná, protože nepoužívá metody, které způsobují ztrátu dat během procesu komprese, ale lze ji obnovit do stejného obrazu jako originál. Ztrátová komprese na druhé straně odstraňuje nadbytečná nebo nepotřebná data, což ztěžuje obnovení stejného obrazu jako originál, ale může dosáhnout vysoké účinnosti komprese, která je mnohonásobně až tisíckrát vyšší než bezeztrátová komprese, což z ní činí oblíbenou kompresní techniku.
JPEG, který běžně používáme, je reprezentativní formát digitálních obrazových souborů se ztrátovou kompresí. Komprese formátu JPEG se skládá hlavně z předběžného zpracování, DCT, kvantizace a kódování.
Za prvé, předběžné zpracování zahrnuje změnu barevného modelu a „vzorkování“. Nejprve se změní barevný model digitálního obrazu z RGB na YCbCr. Model RGB kombinuje tři primární barvy světla, aby společně reprezentovaly barvu a jas pixelu, zatímco model YCbCr rozděluje informaci pixelu na Y, což představuje informaci o jasu, a Cb a Cr, které představují informaci o barvě. Když se barevný model změní z modelu RGB na model YCbCr, provede se vzorkování pro extrahování pouze některých hodnot z pixelů.
Lidské oko je citlivé na změny jasu a relativně méně citlivé na změny barvy, takže vzorkování extrahuje veškeré Y, které představuje informaci o jasu, a pouze část Cb a Cr, které představují barevnou informaci, do té míry, lidské oko nedokáže vnímat změny barvy. Toto vzorkování extrahuje informace z bloku pixelů v poměru J:a
z bloku pixelů v určitém poměru J:a. Kde J je počet vodorovných pixelů v pixelovém bloku, a je počet pixelů informace z prvního řádku pixelového bloku a b je počet pixelů informace z druhého řádku. Pokud například vzorkujete informace o barvách v poměru 4:2:0, první řádek bloku pixelů se 4 vodorovnými pixely extrahuje 2 informace o barvě a druhý řádek nevytáhne žádné informace o barvě. Nakonec jsou extrahovány pouze dvě z osmi barev v bloku 4×2, čímž se sníží množství dat.
Po předzpracování se provede transformace zvaná DCT. DCT je proces, který převádí informace o vzorkovaných pixelech na frekvence a reprezentuje je jako data, která jsou pravidelně oddělena podél frekvenční domény. Pro efektivitu se DCT provádí na matici blokované na 8 pixelů horizontálně a 8 pixelů vertikálně jako základní jednotku. Když se provádí DCT, nízkofrekvenční složky, které představují malé rozdíly v informacích mezi sousedními pixely, se shromažďují v levé horní části matice a vysokofrekvenční složky, které představují velké rozdíly, se shromažďují v pravé dolní části matice a jsou reprezentovány jako hodnoty matice oddělené podél frekvenční domény. Mezní hodnota nízkofrekvenční složky je větší než mezní hodnota vysokofrekvenční složky.
Dalším krokem je kvantování. V kvantizačním procesu se hodnota matice získaná pomocí DCT vydělí určitou přednastavenou konstantou a zaokrouhlí se. V tomto případě se hodnota matice nízkofrekvenční složky vydělí malou konstantou a zaokrouhlí se nahoru, ale hodnota matice vysokofrekvenční složky se vydělí velkou konstantou a zaokrouhlí se nahoru, aby byla nulová. Účelem je snížit velikost dat snížením absolutní hodnoty nízkofrekvenčních složek a odstraněním vysokofrekvenčních složek s ohledem na to, že lidské oko je citlivé na nízkofrekvenční složky, ale méně citlivé na vysokofrekvenční složky.
Nakonec jsou data zakódována. Kódování je binární reprezentace kvantovaných maticových hodnot. Pro tento proces se obvykle používá Huffmanovo kódování. Huffmanovo kódování funguje tak, že přiřazuje méně bitů k reprezentaci dat, která se vyskytují často, a více bitů k reprezentaci dat, která se vyskytují zřídka. Výsledkem je, že proces kódování Huffman může snížit množství dat v digitálním obrazu bez ztráty jakýchkoli dat.
Digitální obrázky se používají v mnoha oblastech našeho každodenního života. Používají se například ve fotografii, lékařském zobrazování, satelitním snímkování, grafickém designu, produktových snímcích v internetových obchodech a mnoha dalších aplikacích. S rostoucím využíváním digitálních obrazů se rychle rozvíjely i technologie zpracování obrazu. Zejména pokroky v rozpoznávání obrazu pomocí umělé inteligence (AI) a strojového učení (ML) umožnily inovativní technologie, jako je rozpoznávání obličeje, samořídící auta a chytré kamery.
Spolu s využíváním digitálních obrázků je důležitou otázkou i otázka autorských práv. Vzhledem k tomu, že kopírování a distribuce digitálních obrázků je snazší, jsou vyžadována právní a technologická opatření k ochraně autorských práv a zabránění jejich porušování. Například technologie digitálního vodoznaku se používá k vkládání informací o autorských právech do obrázků v neviditelné podobě, aby se zabránilo nelegálnímu kopírování obrázků.
Probíhají také výzkumy zaměřené na zlepšení kvality digitálních snímků. Vyvíjí se řada technik zpracování obrazu, včetně technik pro vytváření obrázků s vysokým rozlišením, odstraňování šumu a korekce barev. Tyto techniky pomáhají učinit digitální obrázky ostřejšími a přesnějšími.
Digitální obrázky hrají důležitou roli v mnoha aspektech našich životů a jejich význam bude v budoucnu dále narůstat, proto je důležité porozumět technologiím spojeným s digitálními obrázky a umět je správně využívat. Digitální obrázky jsou více než jen fotografie nebo kresby; mají hluboký dopad na náš každodenní život a technologický pokrok.

 

O autorovi

Spisovatel

Jsem "kočičí detektiv" a pomáhám shledávat ztracené kočky s jejich rodinami.
Dobíjím energii nad šálkem café latte, ráda se procházím a cestuji a rozšiřuji si myšlenky psaním. Doufám, že jako blogerka pozoruji svět a řídím se svou intelektuální zvídavostí, a tak mohu nabídnout pomoc a útěchu ostatním.