Emne - Datavitenskap og maskinlæring i naturvitenskap - TKP4198
Datavitenskap og maskinlæring i naturvitenskap
Nytt fra studieåret 2025/2026
Om
Om emnet
Faglig innhold
Dette kurset gir en kortfattet, men likevel omfattende innføring i integrasjonen og nytten av maskinlæring (ML) innen naturvitenskap. Deltakerne vil lære om klyngedannelse og dimensjonsreduksjon for å gruppere og visualisere høy-dimensjonale data. Videre vil deltakerne lære om maskinlæringsmetoder som Quantitative Structure-Activity Relationship (QSAR) for prediksjon og klassifisering av molekylære egenskaper, fysikkinformerte metoder for å kombinere fysiske prinsipper med maskinlæring, samt surrogatmodeller for å akselerere modellens kjøretid. Kurset gir deltakerne ferdigheter og kunnskap til å anvende maskinlæring effektivt i sine respektive felt ved å kombinere teori med praktiske eksempler. I tillegg vil studentene utvikle en forståelse av forholdet mellom ML-prinsipper og tradisjonelle fagområder som matematikk, kjemometri og automatisk kontroll, noe som bidrar til å avmystifisere maskinlæring og gir en tydelig vei til dens praktiske anvendelse innen naturvitenskap.
Læringsutbytte
Læringsutbytte:
- Forstå forholdet mellom prinsipper for datavitenskap og tradisjonelle fagområder som kjemometri og automatisk kontroll, og oversett denne forståelsen effektivt til å utvikle maskinlæringsmodeller som adresserer praktiske utfordringer innen naturvitenskap.
- Anvende maskinlæringsmetoder og integrere fagspesifikk kunnskap for å løse problemer innen naturvitenskap, og sikre at modellene er pålitelige og anvendelige i virkelige sammenhenger.
Læringsmål - Etter å ha fullført dette kurset, vil du kunne:
- Programmere i Python eller Julia i et Jupyter Notebook-miljø.
- Laste inn CSV-filer i Python DataFrames, visualisere variabler, velge kolonner, oppsummere data og fylle inn manglende verdier.
- Løse oppgaver innen veiledet læring, som regresjon og klassifisering.
- Løse oppgaver innen uveiledet læring, som klyngedannelse, dimensjonsreduksjon og tetthetsestimering.
- Forstå og bruke den matematiske strukturen til dype nevrale nettverk og deres anvendelse på regresjon og klassifisering.
- Forstå grunnleggende teori innen automatisk kontroll og anvend denne i sammenhenger med datavitenskap og maskinlæring.
- Utvikle og anvende modeller som kombinerer fysisk kunnskap med maskinlæring for å forbedre prediksjonsevnen.
- Formulere og løse problemet med prediksjon av molekylære egenskaper som en regresjons- eller klassifiseringsoppgave.
- Formulere og løse tidsserieprognoser som en regresjonsoppgave.
Læringsformer og aktiviteter
Problemstyrt læring foregår ukentlig (4 timer) med tilhørende øvelser og veiledning (2 timer).
Obligatoriske aktiviteter
- Obligatoriske oppgaver
Mer om vurdering
Rapport og presentasjon fra prosjektarbeidet utgjør 100% av karakteren. 6 øvelser må være godkjente for å få karakter.
Spesielle vilkår
Kursmateriell
Data Analysis with Python online book - For Modules 1, 2 and 3, Chapters 2 to 7.
Multivariable Feedback Control: Analysis and Design, 2nd Edition Sigurd Skogestad, Ian Postlethwaite
Applications of Deep Neural Networks with Keras by Jeff Heaton for deep learning -Modules and 10.
Parallel Computing and Scientific Machine Learning (SciML): Methods and Applications
Fagområder
- Teknologiske fag
Kontaktinformasjon
Emneansvarlig/koordinator
Faglærere
Ansvarlig enhet
Eksamen
Eksamen
Ordinær eksamen - Høst 2025
Prosjekt
Innlevering 19.12.2025 Tid Utlevering 08:00
Innlevering 12:00 Eksamenssystem Inspera Assessment