Emne - Intelligent tekstanalyse og språkforståelse - TDT4310
Intelligent tekstanalyse og språkforståelse
Om
Om emnet
Faglig innhold
Emnet omfatter: menneskelige språk og språkbehandling, maskinlæring og statistiske metoder for språkførståelse og tekstanalyse, tekstklassifisering og dyp læring, sentimentanalyse og meninggruvedrift, informasjonaksess og tekstgruvedrift, konverserende agenter, maskinoversettelse, semantikk for naturlige språk, datamaskinell lingvistisk kreativitet.
Læringsutbytte
Studentene skal ha en grunnleggende og praktisk forståelse av aktuelle rammeverk og metoder for tekstanalyse og naturlig språk-forståelse, spesiell bruk av maskinlæringsmetoder for tekstanalyse.
Læringsformer og aktiviteter
Forelesninger og øvinger. Emnet krever en godkjent prosjektrapport med teoretisk og eksperimentelt innhold. Forelesningene vil bli gitt på engelsk, hvis ikke alle studenter snakker norsk.
Obligatoriske aktiviteter
- Øvinger
Mer om vurdering
Mappevurdering gir grunnlag for sluttkarakter i emnet. I mappen inngår avsluttende skriftlig eksamen (25%) og arbeider (75%). Resultatet for delene angis i %-poeng, mens sensur for hele mappen (sluttkarakteren) angis med bokstavkarakter. Ved utsatt eksamen (kontinuasjonseksamen) kan skriftlig eksamen bli endret til muntlig eksamen. Dersom studenten også etter utsatt eksamen har sluttkarakteren F/ikke-bestått, må studenten gjenta hele emnet neste studieår. Arbeider som teller med i sluttkarakteren må gjentas.
Anbefalte forkunnskaper
Emnet er åpent for alle studenter, men forutsetter kunnskap i Pythonprogrammering minst på et nivå tilsvarende emnet TDT4110 ("Informasjonsteknologi, grunnkurs"); programmeringskunnskap på nivå som en datateknikk-/informatikkstudent i 3. klasse anbefales. Grunnleggende kunnskap om maskinlæring er ikke nødvendig, men anbefales. Det forutsettes ingen kunnskap om lingvistikk eller om språkteknologi.
Forkunnskapskrav
TDT4110 ("Informasjonsteknologi, grunnkurs") eller tilsvarende.
Kursmateriell
* "Applied Text Analysis with Python" av Benjamin Bengfort, Tony Ojeda og Rebecca Bilbro (O'Reilly Media, juni, 2018). * "Natural Language Toolkit" (http://www.nltk.org/). Mer detaljert informasjon vil bli gitt ved semesterstart.
Fagområder
- Datateknikk og informasjonsvitenskap
- Anvendt informasjons- og kommunikasjonsteknologi
- Informatikk
- Kunnskapssystemer
- Informasjonssystemer
- Datateknikk
- Anvendt lingvistikk
- Anvendt språkvitenskap
- IKT
- Informasjonsteknologi og informatikk
- Kommunikasjon og informasjonsvitenskap
- Språk, logikk og informasjonteknologi
Kontaktinformasjon
Emneansvarlig/koordinator
Faglærere
Ansvarlig enhet
Eksamen
Eksamen
Ordinær eksamen - Vår 2022
Prosjektoppgave
Hjemmeeksamen (1)
Innlevering 08.06.2022 Tid Utlevering 09:00
Innlevering 13:00 Varighet 4 timer Eksamenssystem Inspera Assessment
- Øvrige kommentarer
- 1) Merk at eksamensform er endret som et smittevernstiltak i den pågående koronasituasjonen.