Suchergebnisse

24 Ergebnisse

Sortierung:

Open Access#12015

Recherche locale de politique dans un espace convexe

BASE

Open Access#22015

Recherche locale de politique dans un espace convexe

BASE

Open Access#32012

Optimisation de contrôleurs par essaim particulaire

BASE

Open Access#42012

Optimisation de contrôleurs par essaim particulaire

BASE

Open Access#52013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#62013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#72013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#82013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#92012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#102012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#112012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#122011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#132011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#142011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#152011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE