Undertekster AI - bedste løsning ?

Optagelse og redigering af video og billeder, lyd til video, Final Cut, Premiere Pro, Pinnacle, m.v.
Nyt svar
Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10537
Sted: Oslo

Re: Undertekster AI - bedste løsning ?

Indlæg af Mike-air »

Det er lidt et sammetræf, men jeg var faktisk i kbh igår for at holde et (relateret) oplæg på et tale-til-tekst event hostet af DDSC og Telenor. Blandt andet var Dictus CEO’en forbi for at sige lidt om hvordan de laver deres modeller.

Som jeg forstod det, er der for dem en stor præference for Wav2vec over whisper, fordi førstnævnte tager alle lyde med (jeg husker ikke fagtermet, for det er ikke mit ekspertise område), hvor whisper blot spytter ord (tokens) ud fra et vocabulary, men til gengæld er ganske robust overfor støj. Skal man som i mit område «bare» vide hvad kunden vil, så er whisper klart at foretrække. Modsat, så er politiet, sundhedssektor m.fl. Mere interesserede i wav2vec for at få mest muligt ud af optagelsen. Dictus og de andre kommercielle aktører (som sværger til wav2vec) processerer efterfølgende teksten hvis den eks. Skal være mere subtitle venlig m.m.

Konklusionen er nok at whisper arkitekturen vil give det mest almene resultat på tværs af optageforhold - men der er gang i begge arkitekturer indenfor dansk open source. Jeg følger lige op om et par dage med en integration af din kode og flere danske open source modeller! Go påsk! 👍

Medlemsavatar
Jenkins
Forum Donator
Indlæg: 1139
Sted: Nordfyn

Indlæg af Jenkins »

Lige en update herfra :

Jeg har ikke henlagt projektet . Men jeg endte med lige pt at, bruge alt for lang tid på det , kontra faktisk at få tekstet og oversat det materiale jeg sidder med lige nu .

Projektet er ikke gået i glemmebogen , men bliver lige på sidelinjen.

Jeg skal nok opdatere igen , når der er noget nyt :)

Nyt svar