MacWhisper er den gratis transkripsjonsprogramvaren jeg har ventet på

Leter du etter Mac-programvare for å transkribere lydfiler til skrevne tekstfiler? Det er mange betalte verktøy, som Otter.ai og Trint, som kan koste ekte penger når du begynner å bruke dem for mye. Men MacWhisper er gratisløsningen internett har ventet på. Eller i det minste den jeg har ventet på.

OpenAI ga ut et utrolig kraftig gratisprogram tilbake i september 2022 som gjorde det mulig for folk med noen tekniske kunnskaper å konvertere lyd- og videofilene sine til utrolig nøyaktige transkripsjoner. Problemet var at det ikke var veldig tilgjengelig for den gjennomsnittlige brukeren, siden du måtte være kjent med å bruke kommandoer i Terminal-appen.

Men med MacWhisper, som først ble oppdaget av 9to5Mac, noen har endelig utviklet et GUI, eller grafisk brukergrensesnitt, som bygger på toppen av OpenAIs Whisper og lar alle de forvirrende tekniske tingene ligge under panseret, slik at du bare kan dra og slippe lydfilen din og få en transkripsjon veldig raskt. Og MacWhisper er ekstremt nøyaktig fordi OpenAIs Whisper har blitt trent på 680,000 timer av lyddata på nettet.

En av de fine tingene med MacWhisper er at du ikke laster opp lyd- eller videofilen du vil transkribere til internett. Det er viktig for journalister som kanskje jobber med en sensitiv historie, eller alle som bare generelt sett er forsiktige med å laste opp sine personlige filer til skyen. Filen forblir på skrivebordet ditt, noe som betyr at det ikke er noen sjanse for at noen kan fange opp lyden din.

Igjen, MacWhisper er bare et nytt brukergrensesnitt for et gratis program som ble introdusert av OpenAI sent i fjor, men det kommer virkelig til å gjøre lydtranskripsjon enkelt for omtrent alle. Fordi jeg har brukt Whisper og har funnet det utrolig nyttig siden det ble utgitt. Og til og med jeg skal nå bruke MacWhsiper, fordi det garantert vil øke hastigheten på arbeidsflyten min.

Som bare ett eksempel, etter nyheten om kryptoselskapet FTXs kollaps, brukte jeg Whisper til å transkribere dusinvis av timer med gamle YouTube-intervjuer med selskapets grunnlegger Sam Bankman-Fried. Derfra kunne jeg søke i transkripsjonene og finne rare og interessante ideer for artikler å skrive, som da SBF sa i juni 2021 at blockchain ville ha fikset Enron. SBFs sammenligning med Enron var en merkelig tilfeldighet, gitt alt vi nå vet om hvordan FTX kollapset. Men jeg ville aldri ha funnet det øyeblikket i et gammelt obskurt intervju uten å ha dusinvis av utskrifter jeg kunne søke etter. Og selv om den prosessen var enklere enn å lytte til timer og timer med kassetter, var den fortsatt klumpete og lite automatisert.

Etter å ha installert Whisper på maskinen min, pleide jeg å skrive «whisper audiofilename.mp3 —model tiny.en» i Macs Terminal-app hver gang jeg ønsket å transkribere en fil. Med WhisperMac kan jeg bare dra og slippe lydfilen min, og den gjør sin magi uten ekstra skriving.

Jeg testet ut MacWhisper med en episode av NBC Nightly News som jeg lastet ned fra YouTube. Og bortsett fra noen få feil, som å tolke ordet "windchills" som "windshills", og å høre Lester Holt som "Lester Hold", var transkripsjonen veldig nøyaktig. MacWhisper er gratis, men det er et betalt nivå av programvaren som kan være litt mer nøyaktig fordi den bruker OpenAIs mer intensive treningsmodeller, men gratisversjonen vil fungere utmerket for de fleste.

MacWhisper lar deg eksportere det transkriberte ordet i noen få forskjellige formater, inkludert ren tekst, CSV eller til og med et undertekstfilformat som SRT og VTT.

Og MacWhisper er ikke bare for engelsk. Du kan transkribere lyd på 100 forskjellige språk, noe som er utrolig nyttig. Den eneste funksjonen MacWhisper ikke har, som jeg har likt å leke med på Whisper i Terminal-appen, er språkoversettelse. Jeg har oversatt virale videoer til russisk og kinesisk og har blitt fortalt av folk som snakker språkene på Twitter at oversettelsene er nøyaktig.

Den andre funksjonen som MacWhisper ikke har, selv om den heller ikke er tilgjengelig fra OpenAIs Whisper, er muligheten til å skille høyttalere. Hvis du for eksempel transkriberer et intervju med to foredragsholdere, er det ingen tydelige markeringer som viser når en høyttaler har stoppet og en annen har startet. Men jeg mistenker at noen vil bygge den evnen til slutt. Betalte tjenester som Trint gjør dette automatisk, og det ville vært flott å ha gratis til slutt, men du får det du betaler for.

Det er også en funksjon med MacWhisper der du kan konvertere tale fra datamaskinens mikrofon til tekst, noe som kan være nyttig hvis du vil transkribere noe i farten.

Jeg brukte måneder på å lure på når noen endelig ville utvikle en GUI for Whisper, ettersom noen få prøvde det, men ikke skapte noe veldig brukervennlig. Men MacWhisper, som er utviklet av Jordi Bruin, er programvaren jeg har ventet på. Bruin har også utviklet programvare som MacGPT, som lar brukere få tilgang til ChatGPT fra menylinjen.

Du kan laste ned MacWhisper gratis, med e-postregistrering, på Bruins hjemmeside.

Kilde: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/