Suchergebnisse

48319 Ergebnisse

Sortierung:

Open Access#12013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#22013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#32013

Classification régularisée par la récompense pour l'Apprentissage par Imitation

BASE

Open Access#42013

Apprentissage par démonstrations : vaut-il la peine d'estimer une fonction de récompense?

BASE

Open Access#52011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#62011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#72011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#82011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#92011

Apprentissage par imitation dans un cadre batch, off-policy et sans modèle

BASE

Open Access#102011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#112011

Apprentissage par Renforcement Inverse pour la Simulation d'Utilisateurs dans les Systèmes de Dialogue

BASE

Open Access#122009

Différences Temporelles de Kalman

BASE

Open Access#132009

Différences Temporelles de Kalman

BASE

Open Access#142012

Planification Optimiste pour Systèmes Déterministes

BASE

Open Access#152012

Planification Optimiste pour Systèmes Déterministes

BASE