Emne - Datavitenskap og maskinlæring i naturvitenskap - TKP4198
Datavitenskap og maskinlæring i naturvitenskap
Nytt fra studieåret 2025/2026
Om
Om emnet
Faglig innhold
Dette kurset gir en kortfattet, men likevel omfattende innføring i integrasjonen og nytten av maskinlæring (ML) innen naturvitenskap. Deltakerne vil lære om klyngedannelse og dimensjonsreduksjon for å gruppere og visualisere høy-dimensjonale data. Videre vil deltakerne lære om maskinlæringsmetoder som Quantitative Structure-Activity Relationship (QSAR) for prediksjon og klassifisering av molekylære egenskaper, fysikkinformerte metoder for å kombinere fysiske prinsipper med maskinlæring, samt surrogatmodeller for å akselerere modellens kjøretid. Kurset gir deltakerne ferdigheter og kunnskap til å anvende maskinlæring effektivt i sine respektive felt ved å kombinere teori med praktiske eksempler. I tillegg vil studentene utvikle en forståelse av forholdet mellom ML-prinsipper og tradisjonelle fagområder som matematikk, kjemometri og automatisk kontroll, noe som bidrar til å avmystifisere maskinlæring og gir en tydelig vei til dens praktiske anvendelse innen naturvitenskap.
Læringsutbytte
Læringsutbytte:
- Forstå forholdet mellom prinsipper for datavitenskap og tradisjonelle fagområder som kjemometri og automatisk kontroll, og oversett denne forståelsen effektivt til å utvikle maskinlæringsmodeller som adresserer praktiske utfordringer innen naturvitenskap.
- Anvende maskinlæringsmetoder og integrere fagspesifikk kunnskap for å løse problemer innen naturvitenskap, og sikre at modellene er pålitelige og anvendelige i virkelige sammenhenger.
Læringsmål - Etter å ha fullført dette kurset, vil du kunne:
- Programmere i Python eller Julia i et Jupyter Notebook-miljø.
- Laste inn CSV-filer i Python DataFrames, visualisere variabler, velge kolonner, oppsummere data og fylle inn manglende verdier.
- Løse oppgaver innen veiledet læring, som regresjon og klassifisering.
- Løse oppgaver innen uveiledet læring, som klyngedannelse, dimensjonsreduksjon og tetthetsestimering.
- Forstå og bruke den matematiske strukturen til dype nevrale nettverk og deres anvendelse på regresjon og klassifisering.
- Forstå grunnleggende teori innen automatisk kontroll og anvend denne i sammenhenger med datavitenskap og maskinlæring.
- Utvikle og anvende modeller som kombinerer fysisk kunnskap med maskinlæring for å forbedre prediksjonsevnen.
- Formulere og løse problemet med prediksjon av molekylære egenskaper som en regresjons- eller klassifiseringsoppgave.
- Formulere og løse tidsserieprognoser som en regresjonsoppgave.
Læringsformer og aktiviteter
Problemstyrt læring foregår ukentlig (4 timer) med tilhørende øvelser og veiledning (2 timer).
Obligatoriske aktiviteter
- Obligatoriske oppgaver
Mer om vurdering
Rapport og presentasjon fra prosjektarbeidet utgjør 100% av karakteren. 6 øvelser må være godkjente for å få karakter.
Spesielle vilkår
Krever opptak til studieprogram:
Biology and Sustainability (MSBIOL)
Fysikk og matematikk (MTFYMA)
Industriell kjemi og bioteknologi (MTKJ)
Industriell kjemi, materialer og bioteknologi (MTKMB)
Materials Science and Chemical Engineering (MSMATCH)
Materials Science and Engineering (MSMT)
Materialteknologi (MTMT)
Nanoteknologi (MTNANO)
Sustainable Chemical and Biochemical Engineering (MSCHEMBI)
Kursmateriell
Data Analysis with Python online book - For Modules 1, 2 and 3, Chapters 2 to 7.
Multivariable Feedback Control: Analysis and Design, 2nd Edition Sigurd Skogestad, Ian Postlethwaite
Applications of Deep Neural Networks with Keras by Jeff Heaton for deep learning -Modules and 10.
Parallel Computing and Scientific Machine Learning (SciML): Methods and Applications
Fagområder
- Teknologiske fag
Kontaktinformasjon
Emneansvarlig/koordinator
Faglærere
Ansvarlig enhet
Eksamen
Eksamen
Ordinær eksamen - Høst 2025
Prosjekt
Innlevering 19.12.2025 Tid Utlevering 08:00
Innlevering 12:00 Eksamenssystem Inspera Assessment