course-details-portlet

TKP4198

Datavitenskap og maskinlæring i naturvitenskap

Velg studieår

Nytt fra studieåret 2025/2026

Studiepoeng 7,5

Nivå Høyere grads nivå

Undervisningsstart Høst 2025

Varighet 1 semester

Undervisningsspråk Engelsk

Sted Trondheim

Vurderingsordning Prosjekt

Om emnet

Faglig innhold

Dette kurset gir en kortfattet, men likevel omfattende innføring i integrasjonen og nytten av maskinlæring (ML) innen naturvitenskap. Deltakerne vil lære om klyngedannelse og dimensjonsreduksjon for å gruppere og visualisere høy-dimensjonale data. Videre vil deltakerne lære om maskinlæringsmetoder som Quantitative Structure-Activity Relationship (QSAR) for prediksjon og klassifisering av molekylære egenskaper, fysikkinformerte metoder for å kombinere fysiske prinsipper med maskinlæring, samt surrogatmodeller for å akselerere modellens kjøretid. Kurset gir deltakerne ferdigheter og kunnskap til å anvende maskinlæring effektivt i sine respektive felt ved å kombinere teori med praktiske eksempler. I tillegg vil studentene utvikle en forståelse av forholdet mellom ML-prinsipper og tradisjonelle fagområder som matematikk, kjemometri og automatisk kontroll, noe som bidrar til å avmystifisere maskinlæring og gir en tydelig vei til dens praktiske anvendelse innen naturvitenskap.

Læringsutbytte

Læringsutbytte:

Forstå forholdet mellom prinsipper for datavitenskap og tradisjonelle fagområder som kjemometri og automatisk kontroll, og oversett denne forståelsen effektivt til å utvikle maskinlæringsmodeller som adresserer praktiske utfordringer innen naturvitenskap.
Anvende maskinlæringsmetoder og integrere fagspesifikk kunnskap for å løse problemer innen naturvitenskap, og sikre at modellene er pålitelige og anvendelige i virkelige sammenhenger.

Læringsmål - Etter å ha fullført dette kurset, vil du kunne:

Programmere i Python eller Julia i et Jupyter Notebook-miljø.
Laste inn CSV-filer i Python DataFrames, visualisere variabler, velge kolonner, oppsummere data og fylle inn manglende verdier.
Løse oppgaver innen veiledet læring, som regresjon og klassifisering.
Løse oppgaver innen uveiledet læring, som klyngedannelse, dimensjonsreduksjon og tetthetsestimering.
Forstå og bruke den matematiske strukturen til dype nevrale nettverk og deres anvendelse på regresjon og klassifisering.
Forstå grunnleggende teori innen automatisk kontroll og anvend denne i sammenhenger med datavitenskap og maskinlæring.
Utvikle og anvende modeller som kombinerer fysisk kunnskap med maskinlæring for å forbedre prediksjonsevnen.
Formulere og løse problemet med prediksjon av molekylære egenskaper som en regresjons- eller klassifiseringsoppgave.
Formulere og løse tidsserieprognoser som en regresjonsoppgave.