Endnu et søm i ligkisten i forsøget på at afsløre kunstig intelligens

Del med dit netværk

Jeg har tidligere skrevet om hvordan vi kan afsløre at noget er lavet med AI. Det korte svar er at det kan vi ikke – i hvert fald ikke automatisk. Selvom systemer til at afsløre om noget er skrevet med generativ kunstig intelligens er næsten lige så gamle som ChatGPT, er det også tilfældet med de systemer til at snyde de systemer der skal afsløre snyd.

Et eksempel på sådan et system der kan snyde detektionssystemerne hedder BypassGPT, og er desværre (eller heldigvis afhængig hvordan man tænker) ikke gratis, men man kan stadig lege lidt med det. Det viser med al tydelighed for let det er at snyde for eksempel ZeroGPT.

BypassGPT er relativt simpelt at bruge. Man indsætter sin tekst og vælger hvilken model man vil anvende og så “humaniseres” teksten så den ikke længere genkendes som skabt af kunstig intelligens.

Jeg har fået SkoleGPT til at hjælpe med at skrive en engelsk stil (det krævede lidt overtalelse, for SkoleGPT har efterhånden forstået at den skal tale dansk) og tester hos ZeroGPT:

Teksten direkte fra SkoleGPT bliver straks afsløret. Der er ingen tvivl hos ZeroGPT om at den er 100% kunstigt skabt.

Men efter en tur i humaniseringsmaskinen hos BypassGPT ser det pludselig meget anderledes ud:

Teksten er nu blevet skrevet om og nu kan ZeroGPT ikke længere se at den er kunstigt fremstillet. Den bliver faktisk bedømt som 0% AI og altså skrevet af et menneske.

Grunden til at eksemplet er på engelsk er fordi detektionssystemerne indtil videre ikke fungerer på dansk. Men som man kan se fungerer de også kun begrænset på engelsk – eller de er i hvert fald lette at snyde.


Del med dit netværk

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *