Optimisation stochastique
dans Algèbre
Hey coucou guys !
j'ai essayé de faire cet exercice mais je suis pas trop sûre de mes demarches , pourriez vous me donner un coup de main svp :-)
j'ai joint le fichier afin de faciliter la lecture
On considère un programme dynamique en horizon infini dans lequel l’ensemble des états est X = {1, 2). L’ensemble des décisions admissibles pour ces deux états est identique; il est dénoté U = {u1, u2}. Les matrices de transition associées aux décisions u1 et u2 sont respectivement
et .
Les coûts associés à u1 et u2 sont donnés par les vecteurs
et .
On souhaite minimiser le coût espéré total actualisé sur horizon infini. Le facteur d’actualisation est
a) À partir du vecteur initial exécuter une itération de la méthode d’itération de valeurs.
b) En appliquant la méthode d’itération de politiques à partir de la politique, déterminer la politique optimale µ* et le vecteur de coût espéré optimal J*.
c) Pouvait-on déterminer a priori une borne supérieure sur le nombre d’itérations qui seraient nécessaires pour trouver µ*? Si oui, pourquoi et quelle était cette borne?
j'ai essayé de faire cet exercice mais je suis pas trop sûre de mes demarches , pourriez vous me donner un coup de main svp :-)
j'ai joint le fichier afin de faciliter la lecture
On considère un programme dynamique en horizon infini dans lequel l’ensemble des états est X = {1, 2). L’ensemble des décisions admissibles pour ces deux états est identique; il est dénoté U = {u1, u2}. Les matrices de transition associées aux décisions u1 et u2 sont respectivement
et .
Les coûts associés à u1 et u2 sont donnés par les vecteurs
et .
On souhaite minimiser le coût espéré total actualisé sur horizon infini. Le facteur d’actualisation est
a) À partir du vecteur initial exécuter une itération de la méthode d’itération de valeurs.
b) En appliquant la méthode d’itération de politiques à partir de la politique, déterminer la politique optimale µ* et le vecteur de coût espéré optimal J*.
c) Pouvait-on déterminer a priori une borne supérieure sur le nombre d’itérations qui seraient nécessaires pour trouver µ*? Si oui, pourquoi et quelle était cette borne?
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres