NTNU - Norges teknisk-naturvitenskapelige universitet
Ansvarlig redaktør: Informasjonsdirektør
Anne Katharine Dahl

Teknisk ansvarlig: 
Kenneth Aar

 
Dei lærer
datamaskinen norsk
Den neste PC-en din snakkar kanskje Ålesund-dialekt. Det gjer mikrobølgeomnen, stereoanlegget og mobiltelefonen også, dersom firmaet Nordisk Språkteknologi får det som dei vil.

Kontorfolk kan gløyma musesjuke og stive skuldrer
- ein mikrofon erstattar mus og tastatur. Blinde kan surfa på internett med ein talande nettlesar. Rullestolbrukarar kan tenna lys med stemma.
 
 

Vil den nye dataalderen øydelegga språket vårt? Både teknologar og språkfolk ser at språkteknologi kan forma språkutviklinga. NTNU-forskarar og kollegaer frå Oslo og Bergen vil oppretta ein nasjonal språkdatabase som kan brukast av alle som arbeider med språkteknologi, både forskarar og bedrifter. Monopol i denne viktige marknaden er farleg, argumenterer dei.

Datamaskinen får munn og øyre

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Bente Moxness forklarer korleis datamaskina kjenner igjen lydbølgene som orda våre er samansett av.

«Dette er ein test. Ein to tre ...» I eit lydisolert rom ved Lingvistisk institutt på Dragvoll førebur fonetikarane Jørn Almberg og Anne Sandø seg til å gjera opptak av leseprøvar. Tusen slike prøvar skal brukast til å utvikla dataprogram som kan skjøna norsk tale.

- Dikteringsprogram finst allereie for engelsk. Vi held på å utvikla det første norske, fortel språkingeniør Bente Moxness i Nordisk Språkteknologi AS (NST).

- Sjølv om ein tekst vert lesen ordrett og feilfritt er det mogleg å høyra kva del av landet lesaren kjem frå. Ein trønder uttalar e-lyden i ordet «meg» annleis enn ein austlending. Dessutan vil det alltid vera individuelle skilnader. Difor treng vi så mange ulike stemmer, for å gjera stemmegjenkjenninga god nok.

Språk-matematikk

Dataprogram for stemmegjenkjenning er basert på matematiske metodar og statistikk. Materialet frå stemmeprøvane vert brukt som samanlikningsgrunnlag. Når nokon snakkar til maskinen, vert lydbølgene som orda er samansette av, samanlikna med lydar programmet allereie kjenner. Det næraste ordet eller den næraste lyden vert så valt. Slik mønstergjenkjenning i lydsignal bygger på velkjende metodar, men er likevel krevjande å få til i praksis.

Normert bokmål

I første omgang vil dataprogramma til Nordisk Språkteknologi berre kjenna att tale som ligg nær normert bokmål. Det betyr at trøndarar ikkje kan seia «mæ» eller «itj» til maskinen, men «meg» og «ikke». NST er så vidt i gang med å eksperimentera med nynorsk, men også her vil gjenkjenninga berre virka for tale som ligg nær opp til skriftnorma.

- Kva med dialektane?

- Våre system kjenner att lydar og tonefall i dialektane, men ordformene må vera som i skriftnormalen. Skal vi også ta omsyn til dialektord, må vi samla inn eit mykje større utval av stemmeprøver, og det vert kostbart. Vi må ta omsyn til at marknaden vår er størst der talemålet ligg relativt nær skriftnorma. Dersom dialekt-tale skal gjerast om til vanleg skriftleg tekst, møter vi også ei stor fagleg utfordring - datamaskinen må forstå meir av innhaldet enn dersom han berre skal skriva ned nøyaktig det som vert sagt.

Ålesund-dialekt

Nordisk Språkteknologi vil også laga maskinar som kan snakka sjølv.

- Telefonbankar og sentralbord snakkar automatisk allereie?

- Slike system spelar berre av ferdig innspelte frasar. Vi driv med ekte talesyntese - maskinen skal kunna lesa alle tekstar, også ord den aldri har sett før. Det er vanskeleg - norsk har vanskelege reglar for uttale. Setningsmelodien må vera korrekt, men det største problemet er at ord som vert stava likt, kan ha ulik tyding og uttale. Dette vert kalla tonelag, og det er slik vi skiljar på «badet» (bestemd form av »eit bad») og «badet» (bokmål - fortid av verbet «bade»). Slike skilnader er små i Ålesund-dialekten, og vi har difor valt å etterlikna ei kvinnestemme derifrå.

Funksjonshemma

Tale- og syntesegjenkjenning har eit stort bruksområde. NST satsar mellom anna på å levera komponentar til elektroniske journalsystem på sjukehus. Tanken er at dersom legen kan diktera til ein datamaskin, slepp han eller ho å gå vegen om sekretær og skrivestove. Tilsvarande løysingar vert planlagde for oljeproduksjon og andre typar industri. Talestyring for bilstereo er også aktuelt.

- I tillegg kan teknologien vår brukast i hjelpemiddel for funksjonshemma. Rullestolbrukarar kan styra lys og varme med stemma, dyslektikarar kan lesa teksten sin i staden for å gå vegen om tastatur og stavekontroll. Blinde kan få internett-aviser opplesne for seg, og folk med alvorlege skadar i strupen kan få betre taleprotesar, fortel Bente Moxness.

NTNU-samarbeid

NST har sterke band til NTNU. Her ligg det sterkaste fonetikk-miljøet i landet, og Bente Moxness og fleire andre tilsette har hovudfag innan lingvistikk, fonetikk eller andre språkfag frå Trondheim.

- Det er viktig for oss å halda kontakt med NTNU, som har gode forskingsmiljø for både språk og teknologi. Særleg med tanke på rekruttering er Trondheim viktig, men vi vil også samarbeida med fagfolka, seier Moxness. 

Vil ha felles språkbank

NTNU og universiteta i Oslo og Bergen vil oppretta ein gigant-database med norsk tekst og tale. Basen skal vera tilgjengeleg for alle, både forskarar og kommersielle firma.

- Det er viktig å unngå at ei verksemd får monopol på språkteknologi for den norske marknaden. Konkurranse er sunt, og i tillegg er det viktig kulturelt sett at det finst alternativ på dette området, meiner professor Torbjørn Svendsen ved Institutt for teleteknikk. Han er ei av drivkreftene bak prosjektet.

Samla miljø

Universiteta har fått innspel til planlegginga frå Telenor, SINTEF og Nordisk Språkteknologi. Men dei innsamlingane Nordisk Språkteknologi no gjer, skal neppe inn i basen.

- Dei vil nok ikkje gje frå seg ein slik konkurransefordel gratis. Den databasen vi planlegg, vil ikkje vera nok til å utvikla slike system som dei NST arbeider med. Men når basen er ferdig, vert det mykje lettare for nye aktørar å utvikla tilsvarande produkt. Slik kan det skapast rom for til dømes nynorsk-utgåver og system som skjønar dialektar, seier Svendsen. Han strekar under at det viktigaste no er at heile det norske språkteknologi-miljøet står samla bak planane om ein felles, open database.

Dialektar og daglegtale

Databasen skal innehalda mange typar tekst og tale. Øvst på prioriteringslista står opptak av høgtlesing av tekstar på bokmål og nynorsk, med lesarar av begge kjønn og frå flest mogleg dialektområde. Telefontale og vanleg spontan daglegtale skal også inn. Basen skal også innehalda tekst frå aviser, epostmeldingar, sakprosa og skjønnlitteratur, til saman 100 millionar ord på bokmål og like mange på nynorsk. Det siste elementet er såkalla leksikalske data, mellom anna informasjon om uttale av dei ulike orda.

- Ein del av informasjonen me treng, eksisterer allereie. Til dømes har aviser og forlag store tekstarkiv. Skal ein få tilgang til dette, må det opprettast ein uavhengig organisasjon som får ansvar for å forvalta basen. Eit alternativ er å legga det inn under Norsk Språkråd, som allereie vurderer å oppretta eit sekretariat for språkteknologi, seier Svendsen.

Så langt er språkbanken eit papirprosjekt.

- Både Norges forskingsråd og Forskingsdepartementet har vist positiv interesse for ein slik felles nasjonal ressurs, seier Torbjørn Svendsen. Han håpar å koma i gang med å legga inn tekst og tale før nyttår.

Kan forma språket

Talegjenkjenningssystema til Nordisk Språkteknologi krev at brukaren snakkar normert bokmål.

- Dette vil påverka språkutviklinga, seier språkprofessor Brit Mæhlum ved NTNU.

- Sjølvsagt vil ikkje slike system vera avgjerande for korleis det norske språket vert i framtida, men dei gjev signal om kva som er «riktig» språk. Normaltalen er allereie på frammarsj, og dette vil vera enno ei kraft som dreg i same retning, meiner Brit Mæhlum ved Institutt for nordistikk og litteraturvitskap.

- Då radio og seinare fjernsyn kom, vart det sagt at dei ville øydelegga dialektane. Det har jo ikkje skjedd. Men vi ser at lokale dialektskilnader vert borte, og tendensen til ein tydelegare norm for kva som er vanleg norsk, er klar.

Betre enn engelsk

Jon Bing, jusprofessor, science fiction-forfattar og leiar i Norsk Kulturråd, seier det same.

- Men alternativet er at vi må bruka engelsk når vi snakkar til datamaskinen, og det er verre. Eg er uroa for det norske språket i dataalderen. Engelsk dominerer jo allereie på internett. Vi vil sjå at små språk forsvinn eller blir marginaliserte. Norsk vil nok overleva, men det krev at vi kan bruka vårt eige språk også i samband med moderne teknologi. Framtida i Norge er tospråkleg, med norsk og engelsk side om side, meiner Jon Bing.

Håpar på dialektar

Bente Moxness i Nordisk Språkteknologi ser at produkta deira kan påverka språket.

- Når det gjeld talesyntese, ser eg ingen problem. Sjølv om vi har valt å bruka ålesundsdialekt, vil ikkje resten av landet snakka som sunnmøringar. Eg snakkar jo ikkje som Kristin Johnson sjølv om det er hennar stemme eg høyrer når eg ringer til bokklubben, smiler Moxness.

- Men talegjenkjenningssystema kan nok ha ein slik verknad, sidan dei krev at brukarane held seg til eit normert språk utan dialektord. I dag ser nordmenn rart på folk som prøver å snakka ein annan dialekt enn sin eigen. Dersom teknologien tvingar folk til å normera kan dette endra seg. Vi vil gjerne skapa større rom for dialektar i våre system. Samstundes må vi ta omsyn til at dei fleste brukarane våre bur i dei største byane, seier Bente Moxness.

Prøv sjølv!

På telefonnummeret 73 51 78 30 vert du møtt av ei høfleg datamaskin som svarar på spørsmål om bussruter i Trondheim. Systemet er dialogbasert. Brukaren får spørsmål om reisemål, tidspunkt osb., og svarar med enkle ord. Til slutt fortel datamaskinen kva linje som passar best, når bussen går og kor ein må byta buss. Systemet er utvikla ved Institutt for teleteknikk i samarbeid med Institutt for datateknikk og informasjonsvitskap. Orakelet kjenner berre 800 ord, og 700 av desse er stadnamn, men det er nok for ei slik teneste. Maskinen systemet køyrer på, er ein vanleg Pentium-PC. Samtalane med orakelet vert tekne opp og brukte til å utvikla systemet vidare.

Ei meir primitiv utgåve av det same orakelet kan finnast på nettsida http://www.idi.ntnu.no/busstuc/ Denne tenesta har ingen dialogar, men tillet spørsmål stilte på naturleg norsk. Døme: Når går neste buss frå Gløshaugen til Dragvoll?

Desse orakla skal vera oppdaterte med dei siste bussrutene.
 
 


HANS MAGNE ÅDLAND
SISSEL MYKLEBUST (FOTO)

Fakta

* Språkteknologi er ein smeltedigel der akustikk, signalbehandling og programvareutvikling møter språkfag som lingvistikk og fonetikk. Feltet omfattar talegjenkjenning og talesyntese, automatisk kontroll av rettskriving og grammatikk og maskinomsetting av tekst og tale. Dataprogram som kan laga eit samandrag av ein større tekst eller gjennomføra intelligente tekstsøk på internett er også ein del av fagfeltet.

* Ein stor del av teknologien har vore kjend lenge, men først no er vanlege datamaskinar kraftige nok til å køyra dataprogramma. Dermed er ein kjempemarknad opna for slik teknologi.

* Nordisk Språkteknologi AS vert den største aktøren på den nordiske marknaden når dei første produkta er ferdige neste år. For engelsk finst det allereie ei rekke produkt på marknaden. Telenor og andre teleselskap arbeider også med språkteknologi.

* Nordisk Språkteknologi tek utgangspunkt i programvare og metodar frå det belgiske Lenrnout & Hauspie og tilpassar dette til den nordiske marknaden. L&H er delvis eigd av Microsoft, som planlegg å integrera L&H-teknologi i både Windows og ulike brukarprogram, til dømes tekstbehandlaren Word.