Toshiba Research Europe onthulde onlangs de laatste doorbraken in haar R&D programma om haar embedded ASR engine uit te breiden. Opgewaardeerde ASR middleware van Toshiba met een hogere nauwkeurigheid en nieuwe functionaliteit zal in negen talen (US en UK Engels, Nederlands, Frans, Duits, Italiaans, Spaans, Japans en Mandarijn) beschikbaar gesteld worden in het derde kwartaal van 2004. Nog meer talen liggen in het verschiet.
Door haar R&D activiteiten zal de middleware van Toshiba nieuwe standaards op het gebied van precisie en foutloosheid in spraakherkenningstechnologie neerzetten. De nauwkeurigheid zou 95% bedragen, zelfs in luidruchtige omgevingen. Een nieuwe versie van Toshiba's technologie om online grammatica te laden en te bewerken zal in-car systemen een grotere kennis geven (bijv. de mogelijkheid om titels van een CD te lezen) en de gebruikers meer functionaliteit bieden. (bijv. "Speel 'A Hard Day's Night'" i.p.v."Speel track 5" ) Gebruikers zullen de mogelijkheid hebben een vele malen groter aantal woorden en commando's te definiëren, variërend van het voice-dialen van personen in het adresboek van hun PDA's tot het dicteren van e-mail’s. De nieuwe middleware zal ook een geavanceerde grammatica-optimalisatietool bevatten die applicatieontwikkelaars in staat stelt hun eigen maatoplossingen naadloos en rendabel te ontwikkelen door het gebruik van standaard grammaticaformaten en vertrouwde ontwikkeltools.
Toshiba’s ASR systemen zijn ingebouwd in vele in-car navigatiesystemen, pc’s en PDA’s over de gehele wereld. Het bedrijf biedt haar klanten een complete embedded oplossing. Deze behelst niet alleen de speech middleware (zowel ASR als Text-to-Speech) maar ook de benodigde chiptechnologie en processoren, alsmede wereldwijde support.
De kerntechnologie achter het ASR systeem wordt ontwikkeld in Toshiba's Corporate Research & Development Centre te Kawasaki in Japan. De ontwikkeling en optimalisatie van Europese en Amerikaanse taalcomponenten en de grammatica-optimalisatietool wordt uitgevoerd door de Speech Technology Group in het Cambridge Research Laboratory (CRL) van Toshiba.
"Hogere nauwkeurigheid en rijke functionaliteit zijn de basiscriteria van een spraakherkenningsoplossing. Dankzij onze R&D-inspanningen in Japan en Cambridge zal de eerstvolgende versie van Toshiba ASR uitblinken in beide gebieden", zegt Dr. Kate Knill. (Groepsleider van de Speech Technology Group van het CRL) "Het belangrijkste is dat we de hoeveelheid fouten die gewoonlijk optreden bij spraakherkenning dramatisch hebben teruggebracht en dat wij een nauwkeurigheid kunnen leveren die normaal gesproken rond de 95% ligt. Dit niveau van nauwkeurigheid zal, gecombineerd met het aanbieden van een complete embedded oplossing, Toshiba een voorsprong in de markt geven."
Meer hierover kun je lezen bij Toshiba.
Vertaald en bewerkt door Larz.
Bron: Toshiba