Seminar

Exploring infrastructure for Dutch speech recognition

Door ontwikkelingen in AI verandert de wereld van automatische spraakherkenning (ASR) snel. Nieuwe ASR-systemen lijken een overweldigend nauwkeurige transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden en in grootschalige toepassingen?

Aanmelden

: 25 jun 2024
: Tijd

13:00-17:00u.
: Plaats

SURF Utrecht

Aanmelden

ASR-systemen die recentelijk op de markt zijn gekomen, zoals Whisper, lijken een overweldigend accurate transcriptie van spraak te leveren. Maar hoe presteren deze systemen onder atypische omstandigheden? Bijvoorbeeld in het geval van dialecten, kindertaal, spraak van ouderen of spraak van niet-moedertaalsprekers? Wat gebeurt er als er meerdere sprekers zijn of achtergrondgeluiden? En wat moet je doen als je zeer grote hoeveelheden spraakgegevens wilt transcriberen? Wat is de beste manier om dit op een meer (infra)structurele manier aan te pakken?

In dit seminar tonen we voorbeelden uit verschillende toepassingsgebieden en bespreken we praktische, operationele en strategische aspecten van:

De noodzaak van het beschikbaar maken van hoogwaardige (Nederlandse) spraakherkenningsengines in onderzoeks- en onderwijscontext, bijvoorbeeld om spraak uit colleges, interviews of vergaderingen te transcriberen naar tekst.
Of het al dan niet belangrijk is dat spraakherkenningsengines kunnen worden ge-update wanneer betere engines of modellen beschikbaar komen, of dat verschillende versies van modellen kunnen worden geselecteerd voor specifieke taken (bijv. specifieke soorten spraak).
Hoe open standaarden toegepast kunnen worden en 'Explainability' zoveel mogelijk bevorderd kan worden (hoe worden modellen gemaakt, met welke datasets, prestatiespecificaties).

Dit seminar heeft niet als doel om onderzoek naar spraaktechnologie te faciliteren, maar richt zich op het gebruik van bestaande spraaktechnologie-oplossingen, en hoe dit (verder) gefaciliteerd kan worden: laten we naar duurzame oplossingen zoeken voor onderzoek en onderwijs!

Programma

Voorzitter: Annette Langedijk (SURF)

12:45u.	Inloop
13:00u.	Welkom en Setting the Stage (Roeland Ordelman, CTO CLARIAH)
13:10u.	Gebruikersperspectieven op ASR Jeffrey van Woensel en Annabel de Ruiter (Nederlands Veteraneninstituut) Can You Hear Me, Loud and Clear? Advantages and Limitations of Voice Recorded Speech to Text Answers in the Online LISS panel - Joris Mulder (Centerdata) How we got a supercomputer to listen and write down all the Dutch podcasts - Sahra Mohamed (NL podcasts) Speech-to-text in user generated video - Arnout Probst (UvA/HvA)
14:30u.	Pauze
15:00h	Technologische perspectieven op ASR Spraaktechnologie: Trends, beperkingen en toekomst - Vivian van Oijen (SURF) (Infra)structural considerations for high quality ASR for a variety of research domains - Henk van den Heuvel (Radboud Universiteit)
15:50h	Paneldiscussie
16:30h	Afsluiting en netwerkborrel

Noot: De voertaal van de bijeenkomst is Engels.

Voor wie?

Het evenement is met name interessant voor:

Onderzoekers, docenten en ondersteunend personeel uit verschillende disciplines die geïnteresseerd zijn in de toepassing van automatische spraakherkenning
Aanbieders van onderzoeks- en onderwijsinfrastructuur

Locatie

SURF Utrecht (Kantoren Hoog Overborch - Hoog Catharijne)
Moreelsepark 48
3511 EP Utrecht
Routebeschrijving

Organisatie

SURF in samenwerking met Stichting Open Spraaktechnologie.

Aanmelden

Programma

Voor wie?

Locatie

Organisatie

Nieuwsbrief