Mengtao Sun
Lærer maskiner å lese
Mengtao Sun jobber med å lage algoritmer, som kan forstå det menneskelige språk. Hans første prosjekt går ut på å lage en algoritme som kan analysere folks følelser i anmeldelser på nettet – målet er å gi banksektoren informasjon, som kan omsettes til fruktbare investeringer.

Foto: Jacob Stærk
”Analyse av store mengder tekst tar lang tid og krever store mengder ressurser. Mitt mål er å lage algoritmer, som klarer å analysere tekst og klassifisere store mengder tekst på en troverdig og robust måte.”
Det sier 26-årige Mengtao Sun, Ph.d.-stipendiat på TEFT-lab og master i matematikk fra Beijing University of Technology. Han jobber med det, som innen koding og kunstig intelligens, kalles natural language processing og som går ut på å lære maskiner å avkode språk.
Mengtao Suns prosjekt er inspirert av forsøk innen biomedisin, hvor man har hatt suksess med å benytte kunstig intelligens i flere sammenhenger, og nå prøver han å overføre prinsippene til finansverdenen.
Tekst, ikke minst stemninger og følelser, finansnyheter og markedsanalyser, har stor betydning for vurdering av investeringer, og derfor vil det også være stor økonomisk verdi tilknyttet algoritmer, som kan lese og analysere enorme mengder tekst i rekordfart.
Putter ord i kasser
Det første prosjektet for Mengtao Sun går ut på å lage en algoritme, som kan lese anmeldelser og si om folk er positive eller negative.
For det første har han utviklet en ny modell, som er helt original og som han nå tester; og derutover har han tilført algoritmer til eksisterende modeller for å se om han kan forbedre de modeller som brukes i dag.
I grunnen er det snakk om prosesser, hvor mange millioner matematiske parameter samles i en algoritme, som kan trenes til å utvikle seg og gradvis bli bedre og bedre til å forstå et emne.
”Jeg har to databaser. En jeg bruker til å trene min algoritme, og en jeg bruker til å teste den. Det tok min datamaskin tre dager å gjennomgå all den data som skulle til for å trene mine parameter til et nivå, hvor de blir stabile.”
Ja eller nei
For Mengtao Sun er målet ikke i seg selv å lete fram følelser eller anmeldelser. Han arbeider med språkprosessering og analyse i bred forstand gjennom det som kaldes deep learning.
”Jeg ser på følelser, men de samme prinsipper kan brukes i mange andre sammenhenger. For folk, som ikke jobber med dette, er språkanalyse og følelser kanskje to helt forskjellige saker, men fra et matematisk synspunkt, hvor man lærer en algoritme å skjelne mellom to ting, kan det være en samme og samme sak,” sier Mengtao Sun.
Hans mål er å skape systemer, som kan nå frem til abstrakte konklusjoner. I deep learning gjøres det ved å legge lag på lag av analyse ovenpå hverandre, så datamaskinen gradvis når fram til et resultat som er mer komplekst enn bare ja eller nei.
To prosent mer korrekt
Så hvordan går det med å vurdere følelser? Mengtao Sun tester sin algoritme på en åpen database, som bliver brukt bredt innen forskning i deep learning og som gjør det mulig å sammenlikne resultat med andre forskere. Og ifølge de første testresultat, er hans algoritme omkring to prosent bedre til å klassifisere det datasettet enn de eksisterende algoritmer.
Hva det vil si mer presist, må man nok være litt av en nerd for å kunne forstå. Mengtao Sun er i hvert fall tilfreds. Han håper på å en dag kunne gi et bidrag til forskningen som lærer språkroboter å tenke selv.
”Siri (iPhone sin språkrobot, Red.) klarer bare å forstå spørsmål som allerede har blitt definert. Det helt store mål innen mitt felt er å lage en språkrobot, som klarer å besvare spørsmål den aldri har hørt før. Det kan du ikke skrive, jeg kan. Du kan skrive, jeg håper på, at jeg en dag vil kunne komme med et lite bidrag til forskningen som jobber med dette,” siger Mengtao Sun.