logo-polimi
Loading...
Manifesto
Struttura Corso di Studi
Cerca/Visualizza Manifesto
Regolamento didattico
Internazionalizzazione
Orario Personalizzato
Il tuo orario personalizzato è disabilitato
Abilita
Ricerche
Cerca Docenti
Attività docente
Cerca Insegnamenti
Cerca insegnamenti degli Ordinamenti precedenti al D.M.509
Erogati in lingua Inglese
Le informazioni sulla didattica, sulla ricerca e sui compiti istituzionali riportate in questa pagina sono certificate dall'Ateneo; ulteriori informazioni, redatte a cura del docente, sono disponibili sulla pagina web personale e nel curriculum vitae indicati nella scheda.
Informazioni sul docente
DocenteRestelli Marcello
QualificaProfessore associato a tempo pieno
Dipartimento d'afferenzaDipartimento di Elettronica, Informazione e Bioingegneria
Settore Scientifico DisciplinareING-INF/05 - Sistemi Di Elaborazione Delle Informazioni
Curriculum Vitae--
OrcIDhttps://orcid.org/0000-0002-6322-1076

Contatti
Orario di ricevimento
DipartimentoPianoUfficioGiornoOrarioTelefonoFaxNote
DEI----MercoledìDalle 11:00
Alle 13:00
4015--Si consiglia di prendere appuntamento via email con il docente
E-mailmarcello.restelli@polimi.it
Pagina web redatta a cura del docente--

Fonte dati: RE.PUBLIC@POLIMI - Research Publications at Politecnico di Milano

Elenco delle pubblicazioni e dei prodotti della ricerca per l'anno 2019
Nessun prodotto attualmente registrato nell'anno 2019


Elenco delle pubblicazioni e dei prodotti della ricerca per l'anno 2018 (Mostra tutto | Nascondi tutto)
Tipologia Titolo Pubblicazione/Prodotto
Articoli su riviste
Improving multi-armed bandit algorithms in online pricing settings (Mostra >>)
Contributo in Atti di convegno
Importance Weighted Transfer of Samples in Reinforcement Learning (Mostra >>)
Configurable Markov Decision Processes (Mostra >>)
Stochastic Variance-Reduced Policy Gradient (Mostra >>)
A Combinatorial-Bandit Algorithm for the Online Joint Bid/Budget Optimization of Pay-per-Click Advertising Campaigns (Mostra >>)
Does Reinforcement Learning outperform PID in the control of FES-induced elbow flex-extension? (Mostra >>)
Reinforcement Learning Control of Functional Electrical Stimulation of the upper limb: a feasibility study. (Mostra >>)
An upper limb Functional Electrical Stimulation controller based on Reinforcement Learning: A feasibility case study. (Mostra >>)
Targeting Optimization for Internet Advertising by Learning from Logged Bandit Feedback (Mostra >>)


Elenco delle pubblicazioni e dei prodotti della ricerca per l'anno 2017 (Mostra tutto | Nascondi tutto)
Tipologia Titolo Pubblicazione/Prodotto
Contributo in Atti di convegno
Adaptive Batch Size for Safe Policy Gradients (Mostra >>)
Estimating the maximum expected value in continuous reinforcement learning problems (Mostra >>)
Compatible Reward Inverse Reinforcement Learning (Mostra >>)
Boosted Fitted Q-Iteration (Mostra >>)
Exploiting structure and uncertainty of Bellman updates in Markov decision processes (Mostra >>)
Gradient-based minimization for multi-expert Inverse Reinforcement Learning (Mostra >>)
Designing Learning Algorithms over the Sequence Form of an Extensive-Form Game (Mostra >>)
User context estimation for public travel assistance and intelligent service scheduling (Mostra >>)


Elenco delle pubblicazioni e dei prodotti della ricerca per l'anno 2016 (Mostra tutto | Nascondi tutto)
Tipologia Titolo Pubblicazione/Prodotto
Articoli su riviste
Extensive-form games with heterogeneous populations: solution concepts, equilibria characterization, learning dynamics (Mostra >>)
Multi-objective Reinforcement Learning through Continuous Pareto Manifold Approximation (Mostra >>)
Policy Search for the Optimal Control of Markov Decision Processes: A Novel Particle-Based Iterative Scheme (Mostra >>)
Contributo in Atti di convegno
Sequence-Form and Evolutionary Dynamics: Realization Equivalence to Agent Form and Logit Dynamics (Mostra >>)
Inverse Reinforcement Learning through Policy Gradient Minimization (Mostra >>)
Estimating Maximum Expected Value through Gaussian Approximation (Mostra >>)


Elenco delle pubblicazioni e dei prodotti della ricerca per l'anno 2015 (Mostra tutto | Nascondi tutto)
Tipologia Titolo Pubblicazione/Prodotto
Articoli su riviste
Policy gradient in Lipschitz Markov Decision Processes (Mostra >>)
Sparse multi-task reinforcement learning (Mostra >>)
Contributo in Atti di convegno
Estimating a mean-path from a set of 2-D curves (Mostra >>)
Following Newton direction in Policy Gradient with parameter exploration (Mostra >>)
Multi-objective reinforcement learning with continuous pareto frontier approximation (Mostra >>)
manifesti v. 3.1.2 / 3.1.2
Area Servizi ICT
15/10/2019