Kursplan

Reinforcement learning del 1, 3 högskolepoäng

Reinforcement Learning Part 1, 3 Credits

Kurskod: DT707A Högskolepoäng: 3
Huvudområde: Datateknik Fördjupning: A1N
    Senast ändrad: 2020-03-13
Utbildningsnivå: Avancerad nivå Beslutad av: Prefekt
Inrättad: 2019-12-02 Litteraturlista fastställd: 2020-03-13
Giltig fr.o.m.: Höstterminen 2020 Revision: 1

Mål

Mål för utbildning på avancerad nivå

Utbildning på avancerad nivå ska innebära fördjupning av kunskaper, färdigheter och förmågor i förhållande till utbildning på grundnivå och ska, utöver vad som gäller för utbildning på grundnivå,

  • ytterligare utveckla studenternas förmåga att självständigt integrera och använda kunskaper,
  • utveckla studenternas förmåga att hantera komplexa företeelser, frågeställningar och situationer, och
  • utveckla studenternas förutsättningar för yrkesverksamhet som ställer stora krav på självständighet eller för forsknings- och utvecklingsarbete.

(1 kap. 9 § högskolelagen)

Kursens mål

Kunskap och förståelse
Genom att slutföra kursen kommer studenten att känna till de grundläggande begreppen i förstärkningsinlärning, olika typer av miljöer, olika typer av grundläggande algoritmer för förstärkningsinlärning och sätt att välja och tillämpa olika grundläggande algoritmer för förstärkningsinlärning. Vidare kommer studenten att lära sig sätt att utvärdera prestanda av grundläggande förstärkande inlärningssystem.

Färdighet och förmåga
Genom att slutföra kursen ska studenten kunna förbereda data och tillämpa grundläggande förstärkningsinlärande metoder för att uppnå ett mål med en intelligent förstärkningsinlärning agent.

Värderingsförmåga och förhållningssätt
Genom att slutföra kursen ska studenten kunna bedöma lämpligheten av ett grundläggande förstärkningsinlärningsparadigm för ett givet problem och tillgänglig data, förstå förmågan och begränsningarna i de övervägande grundläggande förstärkningsinlärningsalgoritmerna och kunna identifiera problem eller vilseledande resultat.

Kursens huvudsakliga innehåll

  • Grundläggande begrepp och grundläggande algoritmer som används för förstärkningsinlärning.
  • Användning av grundläggande algoritmer för förstärkningsinlärning.
  • Typer och formalisering av omgivningar.
  • Grundläggande algoritmer för förstärkningsinlärning för ändliga tillståndsrymder.
  • Praktiska rekommendationer för tillämpning av grundläggande algoritmer för förstärkningsinlärning.
  • Utvärdering och analys av grundläggande algoritmer för förstärkningsinlärning.
  • Ytterligare ämnen: Markov-egenskapen, erfarenhetsuppspelning och tillståndsrepresentation.

Studieformer

Kursen är utformad som en distanskurs med ett fåtal obligatoriska träffar i klassrum. Den består av en serie internetbaserade föreläsningar, gruppdiskussioner, obligatoriska självstudier med övningar och en projektuppgift.

Den som antagits till och registrerats på en kurs har rätt att erhålla undervisning och/eller handledning under den tid som angavs för kurstillfället som den sökande blivit antagen till (se universitetets antagningsordning). Därefter upphör rätten till undervisning och/eller handledning.

Examinationsformer

Övningar, 1,5 högskolepoäng (Provkod: A001)
Examination sker genom skriftliga inlämningsuppgifter.

Presentation på seminarium, 1,5 högskolepoäng (Provkod: A002)
Examination sker genom presentation på seminarium.


För studenter med dokumenterad funktionsnedsättning kan universitetet besluta om anpassning av examination eller annan examinationsform.

För ytterligare information se universitetets regler för examination inom utbildning på grundnivå och avancerad nivå.

Betyg

Enligt 6 kap. 18 § högskoleförordningen ska betyg sättas på en genomgången kurs om inte universitetet föreskriver något annat. Universitetet får föreskriva vilket betygssystem som ska användas. Betyget ska beslutas av en av universitetet särskilt utsedd lärare (examinator).

Enligt universitetets föreskrifter om betygssystem för utbildning på grundnivå och avancerad nivå (beslut ORU 2018/00929) ska något av uttrycken underkänd, godkänd eller väl godkänd användas som betyg. För utbildning som ingår i en internationell magister- eller masterutbildning eller i universitetets kursutbud för utbytesstudenter ska betygsskalan A-F användas. Rektor, eller den rektorn bestämmer, får besluta om undantag från denna bestämmelse för en viss kurs om det finns särskilda skäl.

Som betyg på kursen används Underkänd (U), Godkänd (G) eller Väl godkänd (VG).

Övningar
Som betyg används Underkänd (U), Godkänd (G) eller Väl godkänd (VG).

Presentation på seminarium
Som betyg används Underkänd (U), Godkänd (G) eller Väl godkänd (VG).

För ytterligare information se universitetets regler för examination inom utbildning på grundnivå och avancerad nivå.

Kommentar till betyg

Betyg på hel kurs
För att få betyget Väl Godkänd (VG) på kursen som helhet krävs Väl Godkänd (VG) på båda examinationsmomenten.

Särskild behörighet och andra villkor

180 högskolepoäng varav 15 högskolepoäng programmering samt Engelska 5/Engelska A.

För ytterligare information se universitetets antagningsordning.

Tillgodoräknande av tidigare utbildning

Student som tidigare genomgått utbildning eller fullgjort annan verksamhet ska enligt högskoleförordningen tillgodoräknas detta som en del av den aktuella utbildningen under förutsättning att den tidigare utbildningen eller verksamheten uppfyller vissa krav.

För ytterligare information se universitetets lokala regler för tillgodoräknanden.

Övriga föreskrifter

Kursen ges på engelska.

Kurslitteratur och övriga läromedel

Ingen kurslitteratur krävs.