Maskintransskription med MyGoodTape

Del med dit netværk

OpenAI står ikke bare bag sprogmodellen GPT-3 og ikke mindst ChatGPT. De roder også med sproggenkendelse og transskription. Altså muligheden for at få talt sprog omdannet til skrift. Deres model hedder Whisper og er faktisk frit tilgængelig under en såkaldt MIT-licens på Github. Det har blandt andet den danske medievirksomhed Zetland gjort brug af. De har lavet deres egen transskriptionsservice. Mygoodtape hedder tjenesten som er ganske gratis. Det kræver dog man uploader lydfilen til deres server og aflevere en mailadresse så man kan få at vide når tjenesten er færdig med at transskribere. Man kan også vælge at oprette en konto så man kan have flere transskriptioner liggende.

Upload og angiv en mailadresse. Så er det ellers bare at vente på at man modtager en mail når det hele er klar.

Servicen er meget simpel at bruge. Man uploader sin lydfil (eller video – så bruges lydsiden bare) og så laver tjenesten arbejdet. Herefter kan man hente transskriptionen ned. Den kan hentes både med og uden tidsstempler og man selv vælge hvor små tidsbider det skal være helt ned til 5 sekunder. Man kan også få teksten som en såkaldt src-fil, der bruges til undertekster på video – og det er altså rigtig smart!

Det færdige arbejde er imponerende. Ikke perfekt, men godt nok tæt på. Og med tidsstempler! De slørede dele er af hensyn til kilden i det interview jeg har brugt til at teste.

Den eneste anke er at servicen ikke kan kende forskel på stemmer. Det betyder der ikke bliver markeret hvem der taler og det betyder at man, især ved interviews med flere personer, stadig har en del arbejde med at markere det i den færdige transskription. Når det er sagt er der dog stadig rigtig mange timer sparet hvad enten man skal transskribere tekster til opgaver eller lave undertekster til videoer.


Del med dit netværk

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *