Tal til mig

Kan man ikke finde ud af at stave, er det rart at have en talecomputer ved sin side

Publiceret

Bemærk

Denne artikel er flyttet fra en tidligere version af folkeskolen.dk, og det kan medføre nogle mangler i bl.a. layout, billeder og billedbeskæring, ligesom det desværre ikke har været teknisk muligt at overføre eventuelle kommentarer under artiklen.

Svenskerne har fået deres egen sprogversion af det amerikanske talegenkende-software, kaldet DragonDictate. Med systemet kan alle diktere tekst til en computer, og det, man siger, skriver computeren ned. Systemet retter sig også efter talekommandoer i de fleste windowsprogrammer. Taster og mus er blevet overflødige.

Med teknologien er det ikke længere et problem, hvis man er en klovn til at stave og langsom til at taste.

Tekstbehandling per tale kommer op på et tempo på 50-70 ord i minuttet inklusive tegnsætning med det stade, teknologien er på i dag. Det er hurtigere, end skrivetempoet hos mange rutinerede tastebrugere. For ikke at tale om tastetempoet hos utrænede skoleelever.

Talebetjening åbner op for en ny edb-æra, hvor computeren bliver mere enkel og mindre færdighedskrævende at bruge. Det kan betyde, at elever i en tidligere alder vil kunne bruge edb til mere.

Vildt betaget

Softwarekonsulent Niels Erik Matiasen fra Hjælpemiddelinstituttet i Århus er 'vildt betaget' af systemet. For mange fysisk handicappede er det at bruge taster et kæmpeproblem.

- Systemet er meget bedre, end hvad man ellers har set af talegenkendelse, og jeg ser muligheder for overbygning på diverse typer kendt handicapsoftware og mulighed for udvikling af helt nye programtyper, siger han.

Niels Erik Matiasen vil gerne have gang i en dansk versionering af systemet, men det er omfattende og dyrt.

Centerleder Birgit Dilling Jandorf fra Videncenter for Ordblindhed på Københavns Universitet siger, at talegenkendelse ville være fantastisk. Hun tilføjer samstemmende med andre fra pædagogiske kredse, at talegenkendelse hidtil ikke har været tænkt ind i dansk skolesoftware.

Et nyt franskudviklet sprogundervisningsprogram 'Talk to Me' benytter dog teknologien. I Danmark sælges programmet af PM-Multimedia til priser fra 125 til 775 kroner. Her kan man studere tysk, fransk og spansk fra en multimedie-pc forsynet med en mikrofon. Programmet vurderer det indtalte svar og godkender eller kasserer det. På en skala ser man også, hvor tæt man er på udtalen af indtalte model-sætninger. Systemet fik to Emma-priser på bogmessen i Frankfurt i oktober under kategorierne Education for Adults og Technological Innovation.

Fra Dragons europæiske hovedkontor i England fortæller marketingmanager Josephine Uren, at man først nu er ved at finde ud af mulighederne for talegenkendelse til undervisningscomputere. Det sker i almindelige skoler såvel som højere oppe i uddannelsessystemet og især til handicappede.

Sådan bruges talegenkenderen

Når man dikterer til systemet, dukker det ord, man siger, op i skærmteksten, eventuelt sammen med andre gæt på ordet. Har maskinen gættet forkert, retter man ved at sige nummeret ud for det korrekte alternativ.

Kender programmet slet ikke et ord, staver man det. Herefter indgår det i et aktivt ordforråd. Hvis et ord findes i en bagvedliggende ordliste på 120.000 ord, vil det ofte dukke op på skærmen, før man har stavet færdig. Systemet bliver efterhånden mere og mere fortroligt med sin brugers stemme, og genkendelsen bliver efterhånden bedre. Det aktive ordforråd på 30.000 opdateres hele tiden med de hyppigst anvendte ord.

Foreløbig er talegenkenderen, der kom i en amerikansk førsteudgave så tidligt som i 1981, oversat til britisk-engelsk, spansk, italiensk, tysk, fransk og svensk.

Der er ingen konkrete planer om en dansk udgave, men de svenske erfaringer viser, at en dansk version kan laves i løbet af et til to år. Versionen til svensk lå færdig i september 1995 efter godt et års tilpasning. Fra Dragons svenske samarbejdspartner, Retech, siger direktør Thomas Malmsborg, at systemet fungerer lige så godt som sit amerikanske ophav. Retech er et kommercielt selskab under de Synshandicappedes Landsforbund.

Andre svenske investorer er landets Arbejdsmarkedsstyrelse og teleselskabet Telia.

Seks-syv edb-folk var sat på opgaven i Sverige og tre hos Dragon i Boston. Forinden lå et års arbejde med at lave en mindre dos-udgave. Versioneringen kostede ifølge Thomas Malmsborg 'adskillige millioner kroner'.

Det begyndte med indsamling af 166 millioner svenske ord fra aviser og forlag. Ordmønstre, hyppighed og andet blev analyseret, så det amerikanske system kunne begynde at 'forstå' svensk. 120.000 af de mest anvendte ord blev lagt ind på softwarens ordliste. Heraf 30.000 i det aktive ordforråd. 72 svenskere blev sat til at læse samtlige ord op. På den måde lærte programmet ikke at blive forvirret over den store variation i udtale af ord, der er fra person til person. Netop det har i årtier gjort det umuligt at få computere til at genkende tale effektivt.

Hidtil har undervisningssektoren ikke været specielt i fokus. I USA er systemet især blevet populært til tekstbehandling hos erhvervsdrivende, der er dårlige til at taste eller stave, fortæller man hos Dragon. Den svenske version er primært rettet mod læger, jurister og handicappede. Læger kan hurtigt diktere sygejournaler, samtidig med at de undersøger røntgenbilleder i mørklagte omgivelser. Jurister bruger systemet, når de dikterer, fordi præcise og lange juridiske standardafsnit kan hentes frem ved hjælp af korte talekommandoer.

Også folk der får problemer i arme og skuldre af at bruge mus og taster hele dagen kan bevare arbejdsevnen ved hjælp af talebetjening.

Forskningen bag

Mange års forgæves forskning i at få computere til at forstå tale i 70'erne og 80'erne var baseret på ideen om kunstig intelligens. En dominerende skole af humanistiske forskere ville dengang lære computere at analysere ords sproglige og grammatiske sammenhæng på vejen mod en talegenkender, men det var en blindgyde. Derimod kom der skub i udviklingen med nye metoder til statistisk sandsynlighedsberegning, massiv talknusning og mønstergenkendelse, hvilket var det, Dragon satsede på. Tilgangen fik vind i sejlene med fremkomsten af stadigt hurtigere processorer til pc'ere. I dag fører Dragon an og leverer talesoftware til både IBM og Microsoft, der sælger små systemer under eget navn. I de seneste udgaver bruges visse 'kunstigintelligens'-rutiner. Det er nyttigt over for et problem som enslydende ord, der betyder noget forskelligt. I en britisk præsentation fremhæves eksemplet: 'Tony Wright will write a letter right now'. Ordene Wright, write og right udtales ens. Men ved at se på hvordan de optræder i sætningen, kan talegenkenderen alligevel stave dem korrekt.

Pause mellem hvert ord

I Sverige koster Windows-versionen 24.900 svenske kroner for en udgave med 30.000 ord i det aktive ordforråd og 120.000 ord i ordlisten. En amerikansk version har 40.000 ord i det aktive ordforråd. Fra svensk side fortæller Thomas Malmsborg, at han ser frem til en genkender, der kan kapere kontinuerlig tale. I dag skal man fortsat diktere med et lille ophold mellem hvert ord. Men softwaren til sammenhængende talestrøm findes allerede. For hurtigsnakkerne blandt os drejer det sig om over 300 ord i minuttet. En talegenkender, der kan følge med her, vil revolutionere skrivning, og i Dragon mener man, at genkendelse af kontinuert tale vil være en realitet, når pentiumprocessoren, der sidder i de hurtigste af dagens skole-pc'ere, bliver afløst af kommende 686- eller 786-processorer.

Sebastian Swiatecki er freelancejournalist.