logo-polimi
Loading...
Manifesto
Struttura Corso di Studi
Cerca/Visualizza Manifesto
Dati Insegnamento
Scarica il Manifesto
Regolamento didattico
Regolamento non disponibile
Elenco docenti
Strutture didattiche
Dati quantitativi
Internazionalizzazione
Orario Personalizzato
Il tuo orario personalizzato è disabilitato
Abilita
Ricerche
Cerca Docenti
Cerca Insegnamenti
Cerca insegnamenti degli Ordinamenti precedenti al D.M.509
Erogati in lingua Inglese

Legenda
Semestre (Sem)
1Primo Semestre
2Secondo Semestre
AInsegnamento Annuale
Attività formative
BCaratterizzanti
Lingua d'erogazione
Insegnamento completamente offerto in lingua italiana
Insegnamento completamente offerto in lingua inglese
--Non definita
Didattica innovativa
I CFU riportati a fianco a questo simbolo indicano la parte dei CFU dell'insegnamento erogati con Didattica Innovativa.
Tali CFU riguardano:
  • Cotutela con mondo esterno
  • Blended Learning & Flipped Classroom
  • Massive Open Online Courses (MOOC)
  • Soft Skills
Dati Insegnamento
Contesto
Anno Accademico 2014/2015
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Corso di Studi (Mag.)(ord. 270) - MI (434) Ingegneria Informatica
Piano di Studio preventivamente approvato T2A - Sistemi e applicazioni dell'Informatica
Anno di Corso 2

Scheda Insegnamento
Codice Identificativo 093549
Denominazione Insegnamento REINFORCEMENT LEARNING
Tipo Insegnamento Monodisciplinare
Crediti Formativi Universitari (CFU) 5.0
Semestre --
Programma sintetico Reinforcement learning deals with solving sequential decision making problems, when no (or minimal) prior information is available. Solving sequential decision making problems means to find their optimal control policies. Using reinforcement-learning algorithms, the optimal policy is learned through the direct interaction between the agent (or controller) and the system to be controlled. The course will introduce the main modeling frameworks, will analyze the most relevant reinforcement-learning techniques, and, finally, some interesting applications of these techniques to real-world domains will be shown. 1) Models * Finite Markov Decision Processes * Continuous Markov Decision Processes * Partially Observable Markov Decision Processes * Semi Markov Decision Processes * Markov Games 2) Algorithms * Value Iteration based algorithms (Q-learning, SARSA, TD(lambda)) * Policy Iteration based algorithms (actor-critic methods, LSPI) * Policy Search algorithms (policy gradient methods and stochastic search techniques) * Exploration techniques (R-MAX, model-based Interval Estimation) * Model-free vs Model-based algorithms * Batch algorithms (Fitted Q-iteration) * Function approximation in Reinforcement Learning algorithms * Hierarchical Learning (options, HAMs, MAX-Q) * Multi-Agent Learning techniques (basic elements) 3) Applications * Autonomic Computing * Robot Control * Water Resources Management
Settori Scientifico Disciplinari (SSD)
Attività formative Codice SSD Descrizione SSD CFU
B
ING-INF/05
SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
5.0

Orario: aggiungi e rimuoviScaglioneDocenteLingua offertaProgramma dettagliato
Da (compreso)A (escluso)
--AZZZZRestelli Marcello
manifesti v. 3.1.9 / 3.1.9
Area Servizi ICT
22/11/2019