Suchergebnisse

16 Ergebnisse

Sortierung:

Open Access#12013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#22013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#32013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#42013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#52012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#62012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#72012

Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO

BASE

Open Access#82011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#92011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#102011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#112011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#122011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#132011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#142011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#152009

Différences Temporelles de Kalman

BASE