Geleyn ontmoet #1

Over kortste paden, data herkenning en het gebruik van fonemen

Op 23 november was ik te gast bij Marten Teitsma zijn college over speech recognition. Een college reeks die hij in het thema semester technische informatica aan 4e- jaars studenten aanbiedt.

De themasemesters van de opleiding HBO-ICT geven de studenten de kans om, voordat zij het laatste semester hun stage vervullen, zich goed te verdiepen in een onderwerp naar keuze. Het is een mooie ontwikkeling die past bij de gedachte van AMOO, het onderwijsvernieuwingsprogramma van onze faculteit. Het heeft zeker ook veel weg van een minor en terwijl ik zit te luisteren vraag ik me af of studenten van andere opleidingen hier ook aan zouden kunnen meedoen. Helemaal zeker ben ik daar niet van. Gedurende de twee uur komt er toch specifieke ICT-materie langs: zoals Dijkstra's Shortest Path Algorithme, Finite State Automata en Markov Models. Aan de studenten merk ik dat zij bij het horen van deze termen een aha-erlebnis hebben. Het college vraagt toch een behoorlijke dosis ICT voorkennis.

Te laat

Het college start om tien voor half tien en begint met een klein aantal studenten. In de loop van het eerste half uur komen er zo nog zeker 6 studenten bij. Marten kent z’n pappenheimers, spreekt de studenten aan en de groep kent elkaar kennelijk ook goed. De laatkomers zijn even stil, maar doen al snel actief mee. Sterk. Het college gaat in op de technieken om uit opgenomen en gedigitaliseerde gesproken tekst betekenisvolle informatie te halen die in computer programma’s gebruikt kan worden. Het is één van de grote uitdagingen in sensor data herkenning, naast die van beeldherkenning.

Marten gaat in op het gebruik van fonemen en hoe deze gematched kunnen worden met meest waarschijnlijke template aan de hand van Dijkstra's Shortest Path Algorithme. Het is een mooi begin om volle aandacht te krijgen.

Zeper

Ik zit met aandacht te luisteren en mijn gedachten nemen me mee naar mijn eigen robotica onderzoekswerk van een tijd geleden. Ook toen was speech recognition één van de veelbelovende technieken waar de ICT-industrie zich op stortte. Want zoals het swipe screen de muis heeft vervangen en die op zich weer het toetsenbord, blijft het zoeken naar de meest natuurlijke weg voor mensen om met machines te kunnen werken. Gesproken taal begrijpen via software is opnieuw zo’n doorbraak techniek waar veel van de grote ‘brands’ van toen en nu op springen: Apple, Amazon en Microsoft.

Maar het is ook een hardnekkig onderwerp. Al vele decennia wordt er onderzoek naar gedaan en alhoewel er steeds maar weer toepassingen en applicaties bijkomen is de doorbraak nog niet bereikt. Met SIRI op OSX kom je een eind, maar zodra je meer wil dan instructies uitspreken loop het snel vast.

En dan is er de uitdaging om van techniek ook commercieel succesvolle toepassingen te maken. Het schoolvoorbeeld van hoe moeilijk dat is wordt gegeven door Lernout & Hauspie. Een spraaktechnologie bedrijf uit Vlaanderen dat in de 90-er jaren zijn tijd te ver vooruit was en met veel baanbrekende technologieën toch roemloos ten onder ging. Want de verwachtingen van direct commercieel success waren veel te hoog. Voor wie dat nog eens beknopt wil nazien: dat kan hier.

CERN

Tijdens de pauze spreek ik met Marten bij over de contacten met CERN in Zwitserland. Marten en z’n collega’s hebben een goede band opgebouwd met de onderzoeksgroepen daar en –dichterbij- de onderzoekers bij het NIKHEF op het Sciencepark. Er wordt daar natuurkundig onderzoek gedaan van het hoogste “Robbert Dijkgraaf-gehalte” en daar komt veel ICT-engineering bij kijken. Eerder hebben studenten Technische Informatica stage gelopen in Zwitserland (bij CERN) en nu bestaat weer de kans dat een student voor een langere periode ook een bijdrage gaat leveren daar. Het is mooi nieuws dat te horen en zegt iets over de rol die we spelen en de kwaliteit van onze studenten.

Experiment

Aan het einde van het eerste uur kondigt Marten aan het tweede uur in te gaan op de statistiek van waarschijnlijkheid met behulp van Markov-models. Ik moet even graven in mijn geheugen, maar voor de studenten de normaalste zaak. Kennelijk zo normaal dat Marten het tweede uur anders invult en spreekt over de opzet van een experiment. Samen wordt verkend hoe je dat kan doen en welke meetfactoren van belang zijn. Marten daagt de studenten uit en het is goed merkbaar dat hij de studenten goed kent. En zij hem. Er is snel een dialoog en ideeën worden gedeeld.

Ik wens de studenten uit Martens klas veel succes en dank hen en Marten om er bij te hebben kunnen zijn. Voor mij een pracht start van de dag. Ik zie uit naar het volgende bezoek.

Geleyn

Gepubliceerd door  Faculteit Digitale Media en Creatieve Industrie 15 december 2016