Hvordan kan digital vannmerking bevare identifikatorer selv gjennom redigering og komprimering?

Dette blogginnlegget utforsker prinsippene bak å opprettholde vannmerker innebygd i digitale bilder under redigering og komprimering, sammen med de tekniske egenskapene som brukes i de romlige og frekvensdomenene.

 

Digital vannmerking refererer til teknologien for usynlig å legge inn spesifikke identifikatorer, eller vannmerker, i digitale bilder. Den innebygde identifikatoren kan hentes ut gjennom spesifikke prosedyrer og brukes som bevis for å bevise bildets opphavsrett. Derfor må vannmerking sikre et visst nivå av robusthet slik at vannmerket kan hentes ut i en form som er nær sin opprinnelige tilstand, selv om det originale bildet redigeres som rotasjon, beskjæring eller endring av størrelse, eller komprimeres. Videre må ikke innsetting av et vannmerke endre det opprinnelige datalagringsformatet, og usynligheten må opprettholdes slik at den innebygde identifikatoren ikke er lett å oppdage.
Digitale fotodata består av lysstyrkeverdier for rutenettlignende piksler arrangert horisontalt og vertikalt. Å representere hver piksels lysstyrkeverdi som todimensjonale matrisedata kalles den romlige domenetilnærmingen. I digitale fotodata uttrykt via den romlige domenetilnærmingen kan vannmerker settes inn ved å justere lysstyrkeverdiene til piksler på riktig måte i områder som er mindre synlige for det menneskelige øyet. For eksempel kan bildedataene til et bestemt varemerke innlemmes i lysstyrkeverdiene ved å legge til eller multiplisere dem med pikselverdiene i et angitt område. Siden det romlige domenet tillater direkte innsetting av identifikatorer i pikselverdier, er beregningsbelastningen som kreves for innsetting og uttrekking av vannmerke relativt lav, og selve innsettingsprosessen kan håndteres raskere. En ulempe er imidlertid at vannmerker som settes inn på denne måten er begrenset til bestemte områder. Følgelig kan de lett bli skadet av enkel bildebehandling som beskjæring eller til og med datakomprimering som forårsaker informasjonstap.
Dette problemet kan delvis reduseres ved å bruke frekvensdomenet. Den romlige frekvensen representerer graden av lysstyrkevariasjon per avstandsenhet. Den betegner graden av vibrasjon som oppstår på grunn av romlig bevegelse, ikke tidens gang. I digitale bilder, jo oftere lysstyrkeendringer skjer i en bestemt retning, desto høyere er den romlige frekvensen som måles i den retningen. Romlig frekvens når sitt maksimum når lysstyrkeendringen mellom tilstøtende piksler er brå. Ved å bruke dette prinsippet kan et digitalt bilde representeres som en fordeling av romlige frekvenser på et todimensjonalt plan i horisontal og vertikal retning. Fordelingen av romlige frekvenser, dannet som en todimensjonal matrise, kalles det romlige frekvensspekteret. Å representere et fotografi som et frekvensspekter er kjent som frekvensdomenetilnærmingen. Fotografiske data i det romlige domenet kan konverteres tapsfritt til frekvensdomenet gjennom matematiske transformasjoner som Fourier-transformasjonen, og den inverse transformasjonen er også gyldig.
For å sette inn et vannmerke i frekvensdomenet, må dataene i det romlige domenet først transformeres til frekvensdomenet, og deretter settes identifikatordata inn i et spesifikt frekvensbånd. Deretter kreves en omvendt transformasjon tilbake til det romlige domenet. Identifikatoren som settes inn i et spesifikt frekvensbånd fordeles over alle piksler i det romlige domenet som utgjør den frekvensen, noe som sikrer at den er jevnt spredt og lagret i hele bildet. Et vannmerke som settes inn på denne måten forblir stort sett usynlig for det menneskelige øyet. Selv om det forekommer noe bilderedigering, for eksempel beskjæring, kan vannmerket delvis gjenopprettes basert på identifikatordataene som er lagret i de gjenværende områdene. Behovet for transformasjon mellom det romlige domenet og frekvensdomenet øker imidlertid beregningsbelastningen for innsetting av vannmerke betydelig. I tillegg, siden identifikatordataene som settes inn i et spesifikt bånd manifesterer seg som støy i det romlige domenet, er det en ulempe der hele bildet kan virke uskarpt eller forvrengt.
I typiske fotografier er mesteparten av informasjonen som oppfattes visuelt av mennesker konsentrert i lavfrekvensbåndet. Når man forstår innholdet i et bilde, er mennesker relativt ufølsomme for høyfrekvente komponenter sammenlignet med lavfrekvente. Derfor, selv om mengden støy introdusert av vannmerking er identisk på tvers av alle frekvensbånd, er forvrengning i høyfrekvensbåndet mindre merkbar i det originale bildet. Imidlertid prioriterer de fleste tapsrike bildekomprimeringsteknikker å fjerne høyfrekvente komponenter for å redusere den totale datastørrelsen. Følgelig blir vannmerker innebygd i høyfrekvensbåndet spesielt sårbare for komprimering. Av denne grunn er vannmerker i frekvensdomenet for det meste innebygd i mellomfrekvensbåndet for å opprettholde et visst nivå av robusthet selv under komprimering. Denne tilnærmingen minimerer forringelse av fotokvaliteten samtidig som den maksimerer potensialet for bevaring av identifikatorer.

 

Om forfatteren

Forfatter

Jeg er en «kattedetektiv» og hjelper til med å gjenforene bortkomne katter med familiene deres.
Jeg lader opp med en kopp café latte, liker å gå turer og reise, og utvider tankene mine gjennom skriving. Ved å observere verden nøye og følge min intellektuelle nysgjerrighet som bloggskribent, håper jeg at ordene mine kan gi hjelp og trøst til andre.