Transkription av äldre ljudfiler

Vårt projekt har så sakteliga tuffat igång – med hjälp av statistikstudenten Ester Lagerlöf. Hon har skrivit uppsats om transkription av äldre ljudfiler genom olika speech-to-text-modeller på Uppsala universitet och har för projektets räkning gjort en del testkörningar. Framför allt har hon använt Kungliga bibliotekets så kallade wav2vec-modell på ett tiotal ljudfiler – både veckorevyer med ljud från Svensk Filmindustri samt ett par äldre radioprogram. Resultaten är intressanta även om modellen har problem med äldre ljudmaterial, främst när det handlar ljudåtergivning i andra hand (exempelvis inspelade telefonsamtal). Den så kallade word-error-rate är därför relativt hög för denna typ av radio- och filmmaterial. I ett radioinslag från 1938 om där upprörda lyssnare klagade på kvinnliga nyhetsuppläsare – ett inslag som finns på SR:s Radiofynd – så lyckas inte modellen uppfatta ordet Radiotjänst korrekt en enda gång. Arbetet fortsätter.

Projektstart under 2022

Moderna tider 1936 är ett forskningsprojekt i skärningspunkten mellan digital humaniora och mediehistoria finansierat av Riksbankens jubileumsfond. Eftersom projektledare Pelle Snickars under våren 2022 påbörjat en ny tjänst vid Lunds universitet har projektet sin hemvist vid detta lärosäte. Ett samarbete med Humanistlaboratoriet vid Lunds universitet kommer därtill att inledas under året. Till projektet kommer också att knytas en doktorand, förhoppningsvis med utlysning till hösten. Det är också först då som projektet på allvar kommer att sätta fart – mer och uppdaterad information kommer att publiceras här på projektbloggen.