course-details-portlet

KP8907

Datavitenskap og maskinlæring i naturvitenskap

Velg studieår

Nytt fra studieåret 2025/2026

Studiepoeng 7,5

Nivå Doktorgrads nivå

Undervisningsstart Høst 2025

Varighet 1 semester

Undervisningsspråk Engelsk

Sted Trondheim

Vurderingsordning Prosjekt

Om emnet

Faglig innhold

Dette kurset gir en kortfattet, men likevel omfattende innføring i integrasjonen og nytten av maskinlæring (ML) innen naturvitenskap. Deltakerne vil lære om klyngedannelse og dimensjonsreduksjon for å gruppere og visualisere høy-dimensjonale data. Videre vil deltakerne lære om maskinlæringsmetoder som Quantitative Structure-Activity Relationship (QSAR) for prediksjon og klassifisering av molekylære egenskaper, fysikkinformerte metoder for å kombinere fysiske prinsipper med maskinlæring, samt surrogatmodeller for å akselerere modellens kjøretid. Kurset gir deltakerne ferdigheter og kunnskap til å anvende maskinlæring effektivt i sine respektive felt ved å kombinere teori med praktiske eksempler. I tillegg vil studentene utvikle en forståelse av forholdet mellom ML-prinsipper og tradisjonelle fagområder som matematikk, kjemometri og automatisk kontroll, noe som bidrar til å avmystifisere maskinlæring og gir en tydelig vei til dens praktiske anvendelse innen naturvitenskap.

Læringsutbytte

Læringsutbytte:

Utvikle avanserte maskinlæringsmetoder ved å utnytte fagspesifikk kontekst, og sikre at disse er teoretisk solide og praktisk anvendelige for å løse vitenskapelige utfordringer innen naturvitenskap.
Anvende maskinlæringsteknikker på forskningsproblemer innen naturvitenskap, og kombinere data-drevne modeller med fysiske lover for å generere nye innsikter og utvide eksisterende vitenskapelig kunnskap.

Læringsmål - Etter å ha fullført dette kurset, vil du kunne:

Programmere i Python eller Julia i et Jupyter Notebook-miljø.
Laste inn CSV-filer i Python DataFrames, visualisere variabler, velge kolonner, oppsummere data og fylle inn manglende verdier.
Løse oppgaver innen veiledet læring, som regresjon og klassifisering.
Løse oppgaver innen uveiledet læring, som klyngedannelse, dimensjonsreduksjon og tetthetsestimering.
Forstå og bruke den matematiske strukturen til dype nevrale nettverk og deres anvendelse på regresjon og klassifisering.
Forstå grunnleggende teori innen automatisk kontroll og anvend denne i sammenhenger med datavitenskap og maskinlæring.
Utvikle og anvende modeller som kombinerer fysisk kunnskap med maskinlæring for å forbedre prediksjonsevnen.
Formulere og løse problemet med prediksjon av molekylære egenskaper som en regresjons- eller klassifiseringsoppgave.
Formulere og løse tidsserieprognoser som en regresjonsoppgave.