course-details-portlet

TTK4260 - Multivariat dataanalyse og maskinlæring

Om emnet

Vurderingsordning

Vurderingsordning: Skriftlig skoleeksamen
Karakter: Bokstavkarakterer

Vurdering Vekting Varighet Delkarakter Hjelpemidler
Skriftlig skoleeksamen 100/100 4 timer D

Faglig innhold

Detaljerte beskrivelser av dataanalytiske metoder som er viktige for kybernetikere (se læringsutbytte nedenfor). Oversikt og hands-on demonstrasjon av metoder for maskinlæring/AI. Diskusjoner om hvordan man strukturerer data, hvordan man tolker dataene og resultatene, og hvordan man velger metoder gitt de underliggende problemstillingene.

Kurset vil ha to distinkte "arbeidsmoduser": En der algoritmene vil bli beskrevet i detaljer, og en der algoritmene blir demonstrert. Den første delen omhandler generelle metoder som kybernetikere bør ha kjennskap til. Det andre omhandler også et utvidet utvalg av metoder, og gir en oversikt over mulighetene som tilbys, f.eks. hvordan de kan benyttes i Python Notebooks.

Læringsutbytte

Tiltenkt læringsutbytte

Repetisjon av statistisk terminologi og estimeringsteori:

- motivasjon og filosofi i multivariat modellering - oversikt over metoder for dataanalyse

- validering av modeller - minste kvadraters metode - maximum likelihood

- statistiske kriterier for evaluering av modellresultater - over- og undertilpasning i modellering (bias vs. Variance)

* Detaljert analyse av følgende algoritmer / problemer: - PCA, ICA, PCR, PLS, multiblock og PARAFAC - metoder for detektering av outliers - tidsserie modellering og prediksjon - system identifikasjon - valg av modellers kompleksitet

- planlegging av eksperimenter (Design of Experiments) * Oversikt og demonstrasjon av strategier for: - modellering av tidsavhengige prosesser - subspace identification - nevrale nettverk - random forests - support vector machines - t-SNE - andre metoder for clustering (KNN m.m.) - andre klassifiseringsmetoder

Ikke-kognitive læringsresultater: - forstå filosofiene, styrken og begrensningene ved de forskjellige metodene - forstå betydningen av dataenes kvalitet og struktur for tolkningen av dataene - ble kjent med strategier for dataanalyse; fra forsøksplanlegging til konklusjon - bli uavhengig, selvsikker og kritisk når det gjelder dataanalyse

[1] K. Poynton, Cognitive and non-cognitive learning factors, http://cim.acs-schools.com/wp-content/uploads/2015/08/Cognitive-and-non-cognitive-learning-factors.pdf

Læringsformer og aktiviteter

- forelesninger (tradisjonelt og "flipped classroom") - peer instruction sessions - interaktiv hands-on dataanalyse - prosjektarbeid på utvalgte datasett

Obligatoriske aktiviteter

  • Obligatorisk øving

Mer om vurdering

Vurdering blir gjort på basis av skriftlig eksamen. Ved utsatt eksamen (kontinuasjonseksamen) kan skriftlig eksamen bli endret til muntlig eksamen. Dersom studenten også etter utsatt eksamen har sluttkarakteren F/ikke bestått, må studenten gjenta hele emnet neste studieår.

Forkunnskapskrav

God forståelse av grunnleggende lineær algebra.

Kursmateriell

Kursmateriell vil bli avklart i begynnelsen av semesteret

Flere sider om emnet
Fakta om emnet

Versjon: 1
Studiepoeng:  7.5 SP
Studienivå: Høyere grads nivå

Undervisning

Termin nr.: 1
Undervises:  VÅR 2024

Undervisningsspråk: Engelsk

Sted: Trondheim

Fagområde(r)
  • Kjemometri
  • Signalbehandling
  • Statistisk forsøksplanlegging
  • Teknisk kybernetikk
Kontaktinformasjon

Eksamensinfo

Vurderingsordning: Skriftlig skoleeksamen

Termin Statuskode Vurdering Vekting Hjelpemidler Dato Tid Eksamens- system Rom *
Vår ORD Skriftlig skoleeksamen 100/100 D 21.05.2024 15:00 INSPERA
Rom Bygning Antall kandidater
SL111+SL210 Sluppenvegen 14 40
Sommer UTS Skriftlig skoleeksamen 100/100 D INSPERA
Rom Bygning Antall kandidater
  • * Skriftlig eksamen plasseres på rom 3 dager før eksamensdato. Hvis mer enn ett rom er oppgitt, finner du ditt rom på Studentweb.
Eksamensinfo

For mer info om oppmelding til og gjennomføring av eksamen, se "Innsida - Eksamen"

Mer om eksamen ved NTNU