I juni lanserer Max Manus AS talegjenkjenning på norsk

Max Manus AS er svært glade for å kunne lansere en løsning for talegjenkjenning på norsk i juni. Et av hovedmålene med løsningen er å hjelpe personer med funksjonsnedsettelse eller midlertidige belastningsskader tilbake i arbeid eller forbli i arbeidslivet ved bruk av talegjenkjenning.

Å kunne produsere tekst og betjene en PC kun ved hjelp av stemmen vil være til stor nytte for de som av ulike årsaker ikke kan bruke mus og tastatur. Med talegjenkjenning for norsk vil du ved hjelp av stemmen kunne skrive dokumenter og e-poster, samt navigere deg rundt på din PC.

Første versjon av produktet vil egne seg godt til personer som har funksjonsnedsettelser eller belastningsskader som gjør at de kan bruke tastatur og mus til en viss grad, men som har behov for et hjelpemiddel som kan avlaste for de mest tastaturtunge oppgavene. Produktet vil være tilgjengelig gjennom NAV Hjelpemiddelsentralen.

Talegjenkjenning i praksis

 

Skrive og navigere med stemmen
I videoen av produktets alfa versjon viser vi hvordan man kan åpne Microsoft Word og produsere en tekst kun ved hjelp av stemmen. Teksten kommer fortløpende opp mens man snakker, og man skal si alle de ord og tegnsettinger man ønsker skal være med i teksten. I denne videoen viser vi at det kan oppstå feil i teksten. I dette tilfellet oppstår det ved nøling i dikteringen og ved bruk av ord som enda ikke finnes i ordboken. Feilene rettes ved hjelp av en talekommando eller tastatur. De ordene som ikke er kjent for talegjenkjenningssystemet har i dette tilfellet engelsk uttale. Slike ord kan du legge til i din personlige ordbok og systemet vil kunne kjenne dem igjen riktig. Du kan også trene systemet til å forstå hvordan du uttaler disse ordene. Eksempler på dette vil legges ut som demovideoer fremover.

Med stemmekommando kan du åpne applikasjoner med stemmen og gjøre enkle formateringer av tekst som fet skrift, kursiv og understreking og justering av tekst. Man kan også spille av egen innlesing og få teksten lest opp ved hjelp av talesyntese. Talesyntesen er levert av vår samarbeidspartner Lingit

Hvor langt har vi kommet?
I løpet av 2016 fikk vi på plass en alfaversjon av norsk talegjenkjenning som har gjennomgått de første brukertester for både gjenkjenningskvalitet og brukervennlighet. Tilbakemeldingene fra testene har vært gode, og vi gleder oss til den siste fasen av prosjektet som omhandler produktmodning og optimering av løsningen. Her vil vi kunne bruke og utnytte de store mengder av innsamlede data som vi har samlet i prosjektet som vil øke kvaliteten i enda større grad frem mot lansering i juni 2017.

De siste månedene har vi bearbeidet og ryddet i dataene så alt er klart for språkmodellering for generell norsk tale. Dette er en stor jobb og 1,5 milliarder ord er brukt som underlag i treningsprosessen. Dette er dokumenter som representerer norsk dagligtale både for formelt og uformelt språk. Nå er vi i treningsfasen og trener språkmodellene og ordboken på alt materiale som er samlet inn. Denne jobben er ferdig i slutten av mars hvor vi lanserer en betaversjon som vil brukes til siste fase med brukertesting.

 

Foreløpige tester på betaversjonen viser lovende resultater, så vi gleder oss stort til siste fase av prosjektet med innspurt frem mot lansering av prosjektet i juni.
Ønsker du å følge med på utviklingen i prosjektet registrer deg her for å motta våre nyhetsbrev . Her vil vi presentere nyhetene etter hvert som de blir klare samt videoer som viser produktet i praksis.