Emne - Datagruvedrift på store datasett - DT8116
Datagruvedrift på store datasett
Velg studieårOm
Om emnet
Faglig innhold
Emnet omhandler algoritmer for å analysere svært store datamengder. Viktige utfordringer som dekkes inkluderer likhetssøk, og analyse av datastrømmer og sosiale nettverk.
Læringsutbytte
Kunnskap: Introduksjon til problemer, prinsipper, mekanismer og teknikker knyttet til datagruvedrift på store datasett. Ferdigheter: Likhetssøk, analyse av datastrømmer og sosiale nettverk, synopser for store datamengder. Kompetanse: Datagruvedrift på store datasett.
Læringsformer og aktiviteter
Kollokvium og selvstudie. Individuelt forskningsprosjekt knyttet til temaer som studeres i emnet. Dersom emnet tas av et stort antall studenter, kan muntlig eksamen bli endret til skriftlig eksamen.
Mer om vurdering
Vurdering:
A: Rapport (enten en kort rapport om et eget forskningsprosjekt, eller en lengre oversiktsartikkel om et valgt tema).
B: Avsluttende muntlig eksamen.
Endelig karakter er bestått eller ikke bestått. For å bestå emnet må både rapporten og eksamen være bestått.
Anbefalte forkunnskaper
Kurset er primært, men ikke utelukkende, ment for PhD-studenter med en mastergrad i datateknikk/informatikk. Studentene skal ha gjennomført emner innen algoritmer og databasesystemer.
Kursmateriell
Gis ved semesterstart. Hoveddelen av pensum vil være utvalgte kapitler fra boken Mining Massive Datasets av Jure Leskovec, Anand Rajaraman og Jeffrey D. Ullman.
Fagområder
- Datateknikk og informasjonsvitenskap