Emne - Datavitenskap og maskinlæring i naturvitenskap - KP8907
Datavitenskap og maskinlæring i naturvitenskap
Om
Om emnet
Faglig innhold
Dette kurset gir en kortfattet, men likevel omfattende innføring i integrasjonen og nytten av maskinlæring (ML) innen naturvitenskap. Deltakerne vil lære om klyngedannelse og dimensjonsreduksjon for å gruppere og visualisere høy-dimensjonale data. Videre vil deltakerne lære om maskinlæringsmetoder som Quantitative Structure-Activity Relationship (QSAR) for prediksjon og klassifisering av molekylære egenskaper, fysikkinformerte metoder for å kombinere fysiske prinsipper med maskinlæring, samt surrogatmodeller for å akselerere modellens kjøretid. Kurset gir deltakerne ferdigheter og kunnskap til å anvende maskinlæring effektivt i sine respektive felt ved å kombinere teori med praktiske eksempler. I tillegg vil studentene utvikle en forståelse av forholdet mellom ML-prinsipper og tradisjonelle fagområder som matematikk, kjemometri og automatisk kontroll, noe som bidrar til å avmystifisere maskinlæring og gir en tydelig vei til dens praktiske anvendelse innen naturvitenskap.
Læringsutbytte
Læringsutbytte:
- Utvikle avanserte maskinlæringsmetoder ved å utnytte fagspesifikk kontekst, og sikre at disse er teoretisk solide og praktisk anvendelige for å løse vitenskapelige utfordringer innen naturvitenskap.
- Anvende maskinlæringsteknikker på forskningsproblemer innen naturvitenskap, og kombinere data-drevne modeller med fysiske lover for å generere nye innsikter og utvide eksisterende vitenskapelig kunnskap.
Læringsmål - Etter å ha fullført dette kurset, vil du kunne:
- Programmere i Python eller Julia i et Jupyter Notebook-miljø.
- Laste inn CSV-filer i Python DataFrames, visualisere variabler, velge kolonner, oppsummere data og fylle inn manglende verdier.
- Løse oppgaver innen veiledet læring, som regresjon og klassifisering.
- Løse oppgaver innen uveiledet læring, som klyngedannelse, dimensjonsreduksjon og tetthetsestimering.
- Forstå og bruke den matematiske strukturen til dype nevrale nettverk og deres anvendelse på regresjon og klassifisering.
- Forstå grunnleggende teori innen automatisk kontroll og anvend denne i sammenhenger med datavitenskap og maskinlæring.
- Utvikle og anvende modeller som kombinerer fysisk kunnskap med maskinlæring for å forbedre prediksjonsevnen.
- Formulere og løse problemet med prediksjon av molekylære egenskaper som en regresjons- eller klassifiseringsoppgave.
- Formulere og løse tidsserieprognoser som en regresjonsoppgave.
Læringsformer og aktiviteter
Problemstyrt læring foregår ukentlig (4 timer) med tilhørende øvelser og veiledning (2 timer).
Undervisningen kan bli avlyst eller endret dersom færre enn fem personer er påmeldt, og/eller dersom Institutt for kjemisk prosessteknologi ikke har tilstrekkelig undervisningskapasitet
Obligatoriske aktiviteter
- Obligatoriske oppgaver
Mer om vurdering
Rapport og presentasjon fra prosjektarbeidet utgjør 100% av karakteren. 6 øvelser må være godkjente for å få karakter.
Spesielle vilkår
Krever opptak til studieprogram:
Kjemisk prosessteknologi (PHKJPROS)
Kursmateriell
Data Analysis with Python online book - For Modules 1, 2 and 3, Chapters 2 to 7.
Multivariable Feedback Control: Analysis and Design, 2nd Edition Sigurd Skogestad, Ian Postlethwaite
Applications of Deep Neural Networks with Keras by Jeff Heaton for deep learning -Modules and 10.
Parallel Computing and Scientific Machine Learning (SciML): Methods and Applications
Fagområder
- Teknologiske fag