Dei lærer
datamaskinen norsk
Den
neste PC-en din snakkar kanskje Ålesund-dialekt. Det gjer mikrobølgeomnen,
stereoanlegget og mobiltelefonen også, dersom firmaet Nordisk Språkteknologi
får det som dei vil.
Kontorfolk kan gløyma musesjuke og stive
skuldrer
- ein mikrofon erstattar mus og tastatur.
Blinde kan surfa på internett med ein talande nettlesar. Rullestolbrukarar
kan tenna lys med stemma.
Vil den nye dataalderen øydelegga språket
vårt? Både teknologar og språkfolk ser at språkteknologi
kan forma språkutviklinga. NTNU-forskarar og kollegaer frå
Oslo og Bergen vil oppretta ein nasjonal språkdatabase som kan brukast
av alle som arbeider med språkteknologi, både forskarar og
bedrifter. Monopol i denne viktige marknaden er farleg, argumenterer dei.
Datamaskinen får munn og øyre
Bente Moxness forklarer korleis datamaskina kjenner igjen
lydbølgene som orda våre er samansett av.
«Dette er ein test. Ein to tre ...» I eit lydisolert
rom ved Lingvistisk institutt på Dragvoll førebur fonetikarane
Jørn Almberg og Anne Sandø seg til å gjera opptak av
leseprøvar. Tusen slike prøvar skal brukast til å utvikla
dataprogram som kan skjøna norsk tale.
- Dikteringsprogram finst allereie for engelsk. Vi held på å
utvikla det første norske, fortel språkingeniør Bente
Moxness i Nordisk Språkteknologi AS (NST).
- Sjølv om ein tekst vert lesen ordrett og feilfritt er det mogleg
å høyra kva del av landet lesaren kjem frå. Ein trønder
uttalar e-lyden i ordet «meg» annleis enn ein austlending.
Dessutan vil det alltid vera individuelle skilnader. Difor treng vi så
mange ulike stemmer, for å gjera stemmegjenkjenninga god nok.
Språk-matematikk
Dataprogram for stemmegjenkjenning er basert på matematiske metodar
og statistikk. Materialet frå stemmeprøvane vert brukt som
samanlikningsgrunnlag. Når nokon snakkar til maskinen, vert lydbølgene
som orda er samansette av, samanlikna med lydar programmet allereie kjenner.
Det næraste ordet eller den næraste lyden vert så valt.
Slik mønstergjenkjenning i lydsignal bygger på velkjende metodar,
men er likevel krevjande å få til i praksis.
Normert bokmål
I første omgang vil dataprogramma til Nordisk Språkteknologi
berre kjenna att tale som ligg nær normert bokmål. Det betyr
at trøndarar ikkje kan seia «mæ» eller «itj»
til maskinen, men «meg» og «ikke». NST er så
vidt i gang med å eksperimentera med nynorsk, men også her
vil gjenkjenninga berre virka for tale som ligg nær opp til skriftnorma.
- Kva med dialektane?
- Våre system kjenner att lydar og tonefall i dialektane, men
ordformene må vera som i skriftnormalen. Skal vi også ta omsyn
til dialektord, må vi samla inn eit mykje større utval av
stemmeprøver, og det vert kostbart. Vi må ta omsyn til at
marknaden vår er størst der talemålet ligg relativt
nær skriftnorma. Dersom dialekt-tale skal gjerast om til vanleg skriftleg
tekst, møter vi også ei stor fagleg utfordring - datamaskinen
må forstå meir av innhaldet enn dersom han berre skal skriva
ned nøyaktig det som vert sagt.
Ålesund-dialekt
Nordisk Språkteknologi vil også laga maskinar som kan snakka
sjølv.
- Telefonbankar og sentralbord snakkar automatisk allereie?
- Slike system spelar berre av ferdig innspelte frasar. Vi driv med
ekte talesyntese - maskinen skal kunna lesa alle tekstar, også ord
den aldri har sett før. Det er vanskeleg - norsk har vanskelege
reglar for uttale. Setningsmelodien må vera korrekt, men det største
problemet er at ord som vert stava likt, kan ha ulik tyding og uttale.
Dette vert kalla tonelag, og det er slik vi skiljar på «badet»
(bestemd form av »eit bad») og «badet» (bokmål
- fortid av verbet «bade»). Slike skilnader er små i
Ålesund-dialekten, og vi har difor valt å etterlikna ei kvinnestemme
derifrå.
Funksjonshemma
Tale- og syntesegjenkjenning har eit stort bruksområde. NST satsar
mellom anna på å levera komponentar til elektroniske journalsystem
på sjukehus. Tanken er at dersom legen kan diktera til ein datamaskin,
slepp han eller ho å gå vegen om sekretær og skrivestove.
Tilsvarande løysingar vert planlagde for oljeproduksjon og andre
typar industri. Talestyring for bilstereo er også aktuelt.
- I tillegg kan teknologien vår brukast i hjelpemiddel for funksjonshemma.
Rullestolbrukarar kan styra lys og varme med stemma, dyslektikarar kan
lesa teksten sin i staden for å gå vegen om tastatur og stavekontroll.
Blinde kan få internett-aviser opplesne for seg, og folk med alvorlege
skadar i strupen kan få betre taleprotesar, fortel Bente Moxness.
NTNU-samarbeid
NST har sterke band til NTNU. Her ligg det sterkaste fonetikk-miljøet
i landet, og Bente Moxness og fleire andre tilsette har hovudfag innan
lingvistikk, fonetikk eller andre språkfag frå Trondheim.
- Det er viktig for oss å halda kontakt med NTNU, som har gode
forskingsmiljø for både språk og teknologi. Særleg
med tanke på rekruttering er Trondheim viktig, men vi vil også
samarbeida med fagfolka, seier Moxness.
Vil ha felles språkbank
NTNU og universiteta i Oslo og Bergen vil oppretta ein gigant-database
med norsk tekst og tale. Basen skal vera tilgjengeleg for alle, både
forskarar og kommersielle firma.
- Det er viktig å unngå at ei verksemd får monopol
på språkteknologi for den norske marknaden. Konkurranse er
sunt, og i tillegg er det viktig kulturelt sett at det finst alternativ
på dette området, meiner professor Torbjørn Svendsen
ved Institutt for teleteknikk. Han er ei av drivkreftene bak prosjektet.
Samla miljø
Universiteta har fått innspel til planlegginga frå Telenor,
SINTEF og Nordisk Språkteknologi. Men dei innsamlingane Nordisk Språkteknologi
no gjer, skal neppe inn i basen.
- Dei vil nok ikkje gje frå seg ein slik konkurransefordel gratis.
Den databasen vi planlegg, vil ikkje vera nok til å utvikla slike
system som dei NST arbeider med. Men når basen er ferdig, vert det
mykje lettare for nye aktørar å utvikla tilsvarande produkt.
Slik kan det skapast rom for til dømes nynorsk-utgåver og
system som skjønar dialektar, seier Svendsen. Han strekar under
at det viktigaste no er at heile det norske språkteknologi-miljøet
står samla bak planane om ein felles, open database.
Dialektar og daglegtale
Databasen skal innehalda mange typar tekst og tale. Øvst på
prioriteringslista står opptak av høgtlesing av tekstar på
bokmål og nynorsk, med lesarar av begge kjønn og frå
flest mogleg dialektområde. Telefontale og vanleg spontan daglegtale
skal også inn. Basen skal også innehalda tekst frå aviser,
epostmeldingar, sakprosa og skjønnlitteratur, til saman 100 millionar
ord på bokmål og like mange på nynorsk. Det siste elementet
er såkalla leksikalske data, mellom anna informasjon om uttale av
dei ulike orda.
- Ein del av informasjonen me treng, eksisterer allereie. Til dømes
har aviser og forlag store tekstarkiv. Skal ein få tilgang til dette,
må det opprettast ein uavhengig organisasjon som får ansvar
for å forvalta basen. Eit alternativ er å legga det inn under
Norsk Språkråd, som allereie vurderer å oppretta eit
sekretariat for språkteknologi, seier Svendsen.
Så langt er språkbanken eit papirprosjekt.
- Både Norges forskingsråd og Forskingsdepartementet har
vist positiv interesse for ein slik felles nasjonal ressurs, seier Torbjørn
Svendsen. Han håpar å koma i gang med å legga inn tekst
og tale før nyttår.
Kan forma språket
Talegjenkjenningssystema til Nordisk Språkteknologi krev at
brukaren snakkar normert bokmål.
- Dette vil påverka språkutviklinga, seier språkprofessor
Brit Mæhlum ved NTNU.
- Sjølvsagt vil ikkje slike system vera avgjerande for korleis
det norske språket vert i framtida, men dei gjev signal om kva som
er «riktig» språk. Normaltalen er allereie på frammarsj,
og dette vil vera enno ei kraft som dreg i same retning, meiner Brit Mæhlum
ved Institutt for nordistikk og litteraturvitskap.
- Då radio og seinare fjernsyn kom, vart det sagt at dei ville
øydelegga dialektane. Det har jo ikkje skjedd. Men vi ser at lokale
dialektskilnader vert borte, og tendensen til ein tydelegare norm for kva
som er vanleg norsk, er klar.
Betre enn engelsk
Jon Bing, jusprofessor, science fiction-forfattar og leiar i Norsk Kulturråd,
seier det same.
- Men alternativet er at vi må bruka engelsk når vi snakkar
til datamaskinen, og det er verre. Eg er uroa for det norske språket
i dataalderen. Engelsk dominerer jo allereie på internett. Vi vil
sjå at små språk forsvinn eller blir marginaliserte.
Norsk vil nok overleva, men det krev at vi kan bruka vårt eige språk
også i samband med moderne teknologi. Framtida i Norge er tospråkleg,
med norsk og engelsk side om side, meiner Jon Bing.
Håpar på dialektar
Bente Moxness i Nordisk Språkteknologi ser at produkta deira kan
påverka språket.
- Når det gjeld talesyntese, ser eg ingen problem. Sjølv
om vi har valt å bruka ålesundsdialekt, vil ikkje resten av
landet snakka som sunnmøringar. Eg snakkar jo ikkje som Kristin
Johnson sjølv om det er hennar stemme eg høyrer når
eg ringer til bokklubben, smiler Moxness.
- Men talegjenkjenningssystema kan nok ha ein slik verknad, sidan dei
krev at brukarane held seg til eit normert språk utan dialektord.
I dag ser nordmenn rart på folk som prøver å snakka
ein annan dialekt enn sin eigen. Dersom teknologien tvingar folk til å
normera kan dette endra seg. Vi vil gjerne skapa større rom for
dialektar i våre system. Samstundes må vi ta omsyn til at dei
fleste brukarane våre bur i dei største byane, seier Bente
Moxness.
Prøv sjølv!
På telefonnummeret 73 51 78 30 vert du møtt av ei
høfleg datamaskin som svarar på spørsmål om bussruter
i Trondheim. Systemet er dialogbasert. Brukaren får spørsmål
om reisemål, tidspunkt osb., og svarar med enkle ord. Til slutt fortel
datamaskinen kva linje som passar best, når bussen går og kor
ein må byta buss. Systemet er utvikla ved Institutt for teleteknikk
i samarbeid med Institutt for datateknikk og informasjonsvitskap. Orakelet
kjenner berre 800 ord, og 700 av desse er stadnamn, men det er nok for
ei slik teneste. Maskinen systemet køyrer på, er ein vanleg
Pentium-PC. Samtalane med orakelet vert tekne opp og brukte til å
utvikla systemet vidare.
Ei meir primitiv utgåve av det same orakelet kan finnast på
nettsida http://www.idi.ntnu.no/busstuc/ Denne tenesta har ingen dialogar,
men tillet spørsmål stilte på naturleg norsk. Døme:
Når går neste buss frå Gløshaugen til Dragvoll?
Desse orakla skal vera oppdaterte med dei siste bussrutene.
HANS MAGNE ÅDLAND
SISSEL MYKLEBUST (FOTO)
Fakta
* Språkteknologi er ein smeltedigel der akustikk, signalbehandling
og programvareutvikling møter språkfag som lingvistikk og
fonetikk. Feltet omfattar talegjenkjenning og talesyntese, automatisk kontroll
av rettskriving og grammatikk og maskinomsetting av tekst og tale. Dataprogram
som kan laga eit samandrag av ein større tekst eller gjennomføra
intelligente tekstsøk på internett er også ein del av
fagfeltet.
* Ein stor del av teknologien har vore kjend lenge, men først
no er vanlege datamaskinar kraftige nok til å køyra dataprogramma.
Dermed er ein kjempemarknad opna for slik teknologi.
* Nordisk Språkteknologi AS vert den største aktøren
på den nordiske marknaden når dei første produkta er
ferdige neste år. For engelsk finst det allereie ei rekke produkt
på marknaden. Telenor og andre teleselskap arbeider også med
språkteknologi.
* Nordisk Språkteknologi tek utgangspunkt i programvare og metodar
frå det belgiske Lenrnout & Hauspie og tilpassar dette til den
nordiske marknaden. L&H er delvis eigd av Microsoft, som planlegg å
integrera L&H-teknologi i både Windows og ulike brukarprogram,
til dømes tekstbehandlaren Word. |
|