Billedbeskrivelser med kunstig intelligens

Del med dit netværk

Generative systemer kan ikke bare bruges til at skabe billeder ud fra tekstforespørgsler. De kan også bruges til at beskrive billeder med tekst. Det er noget man har brugt maskinlæring til i lang tid, da man på nettet gerne vil kunne billeder metadata og beskrivelser og vi brugere er ikke altid så gode til selv at sætte den slags på. Med SceneXplain får man adgang til en række forskellige modeller der kan bruges til at sætte ord på billeder og video.

Det er ret imponerende resultater der efterhånden kan gives med de store sprogmodeller og selv ret komplekse scener kan beskrives. Den store værdi ligger især i de forskellige modeller og deres forskellige styrker og svagheder. Der er for eksempel modeller der er særligt gode til at være præcise, særligt gode til komplekse scener eller endda en model der kan lave narrativer ud fra billedet.

Her er et udpluk af scener der er analyseret med SceneXplain. Billeder fra NASA (som er frit tilgængeligt og fundet via medierforalle.dk) er analyseret af to forskellige modeller. Den ene giver en kort billedtekst. Den anden en længere historie baseret på billedet. Endelig er en video blevet analyseret og resumeret.

Når man anvender tjenesten bruger man credits, men man får en lille stak når man opretter sig som bruger og kan optjene flere løbende også uden at tegne abonnement. Tjenesten kræver dog login ligesom man altid skal være opmærksom på hvad man bruger den til i forhold til datasikkerhed og personoplysninger.


Del med dit netværk

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *