Emne - Datasyn og dyp læring - TDT4265
TDT4265 - Datasyn og dyp læring
Om emnet
Vurderingsordning
Vurderingsordning: Mappevurdering
Karakter: Bokstavkarakterer
Vurdering | Vekting | Varighet | Delkarakter | Hjelpemidler |
---|---|---|---|---|
Hjemmeeksamen | 60/100 | 4 timer | ||
Arbeider | 40/100 |
Faglig innhold
Datasyn danner grunnlaget for en automatisk forståelse av digitale bilder som i dag kan tas opp med mange forskjellige kameraenheter (f.eks. mobiltelefoner, webkameraer, dybde-bilder, MR, Ultralyd...).
Innholdet i kurset varierer fra den klassiske tilnærmelsen til datasyn hvor egenskaper blir trukket ut og klassifisert til mer moderne metoder for bilde forståelse basert på maskin læring og dype nett. Kurset inneholder også en kort gjennomgang av nødvendig programmerings kunnskap og matematikk, i tillegg til basis metoder innenfor bildebehandling/analyse, dette for at alle skal ha den nødvendige ballast for å gå videre med de mer avanserte delene av kurset.
Temaer som blir adressert i kurset er det menneskelige øye og bildedannelse, filtrering i både romlig og frekvens domenet, hierarkiske strukturer og scale space, principal components analysis (PCA), egenskapsuttrekking (f.eks. Harris, SIFT) og matching (f.eks. RANSAC), unsupervised and supervised klassifisering & gjenkjenning så vel som ulike maskinlæringsmetoder, stereosyn, den essensielle og den fundamentale matrisen, optisk flow, tracking (Kalman/Particle), og sist men ikke minst dype nett for datasyn, dvs. fully connected feedforward NNs (Shallow ANNs, forward pass, matrix-based notation and activation functions etc.), learning (cost functions, gradient descent and backpropagation etc.), generalization (overfitting, regularization, initialization, hyper-parameters, vanishing gradients / unstable gradients and deep NNs etc.), CNNs and Image Classification (different layers, especially the conv layer, learning features and sharing parameters, AlexNet and later versions etc.), object detection and semantic segmentation (R-CNN, Fast R-CNN, Faster R-CNN, R-FCN, YOLO / YOLO v2, SSD and Mask R-CNN etc.).
Eksempler vil bli hentet fra ulike applikasjonsdomener som medisin, autonomi (droner, biler, skip) & robotikk, industriell inspeksjon osv.
Læringsutbytte
Kurset gir en oversikt og forståelse av flere grunnleggende teknikker i Datasyn (Computer Vision). Avansert kunnskap på dette feltet blir stadig viktigere. Dette er spesielt sant i lys av den stadig økende tall av kameraer og annet bildebehandlingsenheter i nesten alle områder av vårt samfunn. Kurset bidrar til å bygge kompetanse for å designe og konstruere datasynsmoduler som fungerer i et totalsystem for å løse relevante problemer. Bruksområder inkluderer industri anvendelser, autonomi (droner, biler og skip), robotikk og medisinsk bildeanalyse. Disse emnene kan være basis for ansettelse i industri eller offentlig sektor, eller de kan følges videre i forskning på doktorgradsnivå i Norge eller utenlands.
Læringsformer og aktiviteter
Forelesninger og arbeider. Undervisningsspråk er engelsk. En viktig del av arbeider er et større prosjekt hvor man adresserer en reell problemstilling.
Mer om vurdering
Mappevurdering gir grunnlag for sluttkarakteren i emnet. I mappen inngår skriftlig eksamen 60% og arbeider 40%. Resultater for delene angis i %-poeng, mens vurdering for hele mappen (sluttkarakteren) angis med bokstavkarakter. Oppnådde poeng for arbeider kan benyttes ved en evt senere eksamen.
Ved utsatt eksamen (kontinuasjonseksamen) kan skriftlig eksamen bli endret til muntlig eksamen. Eksamensoppgaven gis kun på engelsk.
Dersom studenten også etter utsatt eksamen har sluttkarakteren F/ikke-bestått, må studenten gjenta hele emnet neste studieår. Arbeider som teller med i sluttkarakteren må gjentas.
Anbefalte forkunnskaper
TDT4195 Visuell databehandling, eller tilsvarende.
Kursmateriell
Bok: Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods (Publisher: Pearson)
Bok: Neural Networks and Deep Learning, Michael Nielsen (online)
Bok: Deep Learning, Ian Goodfellow et. al. (online)
Studiepoengreduksjon
Emnekode | Reduksjon | Fra | Til |
---|---|---|---|
SIF8066 | 7.5 |
Ingen
Versjon: 1
Studiepoeng:
7.5 SP
Studienivå: Høyere grads nivå
Termin nr.: 1
Undervises: VÅR 2022
Undervisningsspråk: Engelsk
Sted: Trondheim
- Informatikk
- Teknologiske fag
Ansvarlig enhet
Institutt for datateknologi og informatikk
Eksamensinfo
Vurderingsordning: Mappevurdering
- Termin Statuskode Vurdering Vekting Hjelpemidler Dato Tid Eksamens- system Rom *
-
Vår
ORD
Arbeider
40/100
Innlevering
06.05.2022
14:00 -
Rom Bygning Antall kandidater -
Vår
ORD
Hjemme-eksamen (1)
60/100
Utlevering
21.05.2022Innlevering
21.05.2022
09:00
INSPERA
13:00 -
Rom Bygning Antall kandidater - Sommer UTS Arbeider 40/100
-
Rom Bygning Antall kandidater - Sommer UTS Hjemme-eksamen 60/100 INSPERA
-
Rom Bygning Antall kandidater
- * Skriftlig eksamen plasseres på rom 3 dager før eksamensdato. Hvis mer enn ett rom er oppgitt, finner du ditt rom på Studentweb.
- 1) Merk at eksamensform er endret som et smittevernstiltak i den pågående koronasituasjonen.
For mer info om oppmelding til og gjennomføring av eksamen, se "Innsida - Eksamen"