Webbläsaren som du använder stöds inte av denna webbplats. Alla versioner av Internet Explorer stöds inte längre, av oss eller Microsoft (läs mer här: * https://www.microsoft.com/en-us/microsoft-365/windows/end-of-ie-support).

Var god och använd en modern webbläsare för att ta del av denna webbplats, som t.ex. nyaste versioner av Edge, Chrome, Firefox eller Safari osv.

Fortsatt erbjudande om transkriberingsverktyget Whisper

Man sitter vid dator och anteckningsblock. Foto.

Fakultetens pilotprojekt att transkribera med hjälp av AI-verktyget Whisper har fungerat mycket bra och många hundratals timmar av intervjumaterial har hittills transkriberats. I väntan på en universitetsgemensam lösning fortsätter vi därför att erbjuda verktyget via Institutionen för psykologi.

Om erbjudandet

Institutionen för psykologi har köpt in en kraftfull dator för transkribering av ljud- och videofiler. Datorn är placerad i ett säkerhetsskåp och hanteras av Lars Kindberg.

Transkriberingsrogrammet är OpenAI:s Whisper. Det är ett gratisprogram som klarar av att transkribera 82 olika språk och kan översätta till engelska från dessa andra språk. Whisper går bra att köra lokalt på datorn och datorn behöver inte vara uppkopplad på något nätverk. Transkriberingsprogrammet klarar av att transkribera filer i mp3-, mp4-, mpeg-, mpga-, m4a-, wav- och webm-format.

Efter varje körning, när alla filer är transkriberade, ”ominstalleras” datorn genom att en avbildning av datorns hårddisk som den var innan körningen, skrivs tillbaka på hårddisken och hårddisken krypteras. På så sätt säkras att inga eventuella spår från filerna finns kvar på datorn. Det enda som sparas över från datorn till ett USB-minne innan datorn återställs är en textfil med information om antalet filer som transkriberades, hur lång den sammanlagda tiden av det transkriberade materialet var och hur lång tid transkriberingen tog.

Datorn är inte uppkopplad på något nätverk under körningen utan den kopplas bara upp på internet när den uppdateras.

Transkriberingen blir inte perfekt. Programmet ”hör” fel, upprepar och ibland även hittar på. Men den ger ändå en bra grund att utgå ifrån.

Rutiner för transkribering

  1. Kontakta Lars Kindberg, lars [dot] kindberg [at] psy [dot] lu [dot] se, för att boka en tid. 
  2. Ladda upp filerna på ett USB-minne. Alla filer som ska transkriberas ska ligga i samma mapp på USB-minnet och inga andra filer ska ligga i den mappen. USB-minnet kan vara krypterat, men ska då vara krypterat med hjälp av bitlocker så att Whisper klarar av att transkribera filerna direkt på USB-minnet.
  3. Lars hjälper dig att färdigställa transkriberingen. När programmet har transkriberat en fil så sparas innehållet i samma mapp som filen ligger i och innehållet sparas som fem filer i olika format. En fil är i json-format, som är ett standardiserat format för att flytta data mellan olika system, tre filer är olika varianter av tidsstämplade textfiler och en är en ren textfil (txt).