Seminar

Exploring infrastructure for Dutch speech recognition

Door ontwikkelingen in AI verandert de wereld van automatische spraakherkenning (ASR) snel. Nieuwe ASR-systemen lijken een overweldigend nauwkeurige transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden en in grootschalige toepassingen?

Event
25 jun 2024
Tijd
13:00-17:00u.
Plaats
SURF Utrecht

ASR-systemen die recentelijk op de markt zijn gekomen, zoals Whisper, lijken een overweldigend accurate transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden? Bijvoorbeeld in het geval van dialecten, kindertaal, spraak van ouderen of spraak van niet-moedertaalsprekers? Wat gebeurt er als er meerdere sprekers zijn of achtergrondgeluiden? En wat moet je doen als je zeer grote hoeveelheden spraakgegevens wilt transcriberen? Wat is de beste manier om dit op een meer (infra)structurele manier aan te pakken?

In dit seminar tonen we voorbeelden uit verschillende toepassingsgebieden en bespreken we praktische, operationele en strategische aspecten van:

  • De noodzaak van het beschikbaar maken van hoogwaardige (Nederlandse) spraakherkenningsengines in onderzoeks- en onderwijscontext, bijvoorbeeld om spraak uit colleges, interviews of vergaderingen te transcriberen naar tekst.
  • Of het al dan niet belangrijk is dat spraakherkenningsengines kunnen worden ge-update wanneer betere engines of modellen beschikbaar komen, of dat verschillende versies van modellen kunnen worden geselecteerd voor specifieke taken (bijv. specifieke soorten spraak).
  • Hoe open standaarden toegepast kunnen worden en 'Explainability' zoveel mogelijk bevorderd kan worden (hoe worden modellen gemaakt, met welke datasets, prestatiespecificaties).

Dit seminar heeft niet als doel om onderzoek naar spraaktechnologie te faciliteren, maar richt zich op het gebruik van bestaande spraaktechnologie-oplossingen, en hoe dit (verder) gefaciliteerd kan worden: laten we naar duurzame oplossingen zoeken voor onderzoek en onderwijs!

Programma

Voorzitter: Annette Langedijk (SURF)

12:45u. Inloop
13:00u. Welkom en Setting the Stage (Roeland Ordelman, CTO CLARIAH)
13:10u.

Gebruikersperspectieven op ASR

  • Jeffrey van Woensel en Annabel de Ruiter (Nederlands Veteraneninstituut)
  • Can You Hear Me, Loud and Clear? Advantages and Limitations of Voice Recorded Speech to Text Answers in the Online LISS panel - Joris Mulder (Centerdata)
  • How we got a supercomputer to listen and write down all the Dutch podcasts - Sahra Mohamed (NL podcasts)
  • Speech-to-text in user generated video - Arnout Probst (UvA/HvA)
14:30u. Pauze
15:00h

Technologische perspectieven op ASR

  • Spraaktechnologie: Trends, beperkingen en toekomst - Vivian van Oijen (SURF)
  • (Infra)structural considerations for high quality ASR for a variety of research domains - Henk van den Heuvel (Radboud Universiteit)
15:50h Paneldiscussie
16:30h Afsluiting en netwerkborrel

Noot: De voertaal van de bijeenkomst is Engels.

Voor wie?

Het evenement is met name interessant voor:

  • Onderzoekers, docenten en ondersteunend personeel uit verschillende disciplines die geĆÆnteresseerd zijn in de toepassing van automatische spraakherkenning
  • Aanbieders van onderzoeks- en onderwijsinfrastructuur

Locatie

SURF Utrecht (Kantoren Hoog Overborch - Hoog Catharijne) 
Moreelsepark 48 
3511 EP Utrecht 
Routebeschrijving
 

Organisatie

SURF in samenwerking met Stichting Open Spraaktechnologie.