Discussion:Temporal difference learning

Cet article est indexé par les projets Informatique et Intelligence artificielle.

Les projets ont pour but d’enrichir le contenu de Wikipédia en aidant à la coordination du travail des contributeurs. Vous pouvez modifier directement cet article ou visiter les pages de projets pour prendre conseil ou consulter la liste des tâches et des objectifs.

**Évaluation** de l’article « **Temporal difference learning** »
Avancement	Importance	pour le projet
Bon début	À évaluer		Informatique (discussion • critères • liste • stats • hist. • comité • stats vues)
Bon début	À évaluer		Intelligence artificielle (discussion • critères • liste • stats • hist. • comité • stats vues)

Cet article ne comporte pas de liste de tâches suggérées. Vous pouvez saisir une liste de tâches à accomplir (par exemple sous forme d'une liste à puces), puis sauvegarder. Vous pouvez aussi consulter la page d'aide.

Article incohérent : <<Le Temporal Difference (TD) learning est une classe d'algorithmes d'apprentissage par renforcement sans modèle.>> : donc il n'y a pas de "modèle". Puis << Ces méthodes échantillonnent l'environnement de manière aléatoire, à la manière des méthodes de Monte Carlo et mettent à jour leur modèle>> : donc il y a un modèle. Pourriez vous expliquer? Merci

Our website is made possible by displaying online advertisements to our visitors. Please consider supporting us by disabling your ad blocker.

Discussion:Temporal difference learning

Our website is made possible by displaying online advertisements to our visitors.
Please consider supporting us by disabling your ad blocker.