From 18ffdb23ec98a7a10a543021c1771859b1f9043b Mon Sep 17 00:00:00 2001 From: Timothee Rocquet Date: Sat, 9 Dec 2023 16:00:14 +0100 Subject: [PATCH] mise a jour piece truquee --- src/piece_truquee.tex | 42 +++++++++++++++++++++++++++++------------- 1 file changed, 29 insertions(+), 13 deletions(-) diff --git a/src/piece_truquee.tex b/src/piece_truquee.tex index 8aaf419..0a193f8 100644 --- a/src/piece_truquee.tex +++ b/src/piece_truquee.tex @@ -1,8 +1,9 @@ \section{Pièces truquées} -A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $N$, A lance donc $N+1$ fois la pièce (on suppose les lancers indépendants) et B fait $N$ prédictions pour les lancers $1$, $2$, ..., $N$. +A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $n$, A lance donc $n+1$ fois la pièce (on suppose les lancers indépendants) et B fait $n$ prédictions pour les lancers $1$, $2$, ..., $n$. -Un exemple de partie, pour $N=2$, est : +Un exemple de partie, pour $n=2$, est : +\small \begin{itemize} \item A tire pile \item B prédit face @@ -10,6 +11,7 @@ Un exemple de partie, pour $N=2$, est : \item B prédit pile \item A tire face \end{itemize} +\normalsize Dans ce cas, B a fait une première prédiction juste et une deuxième prédiction fausse. \q B gagne un point par prédiction juste. Quelle est l'espérance de son gain si sa prédiction est @@ -27,29 +29,43 @@ Dans ce cas, B a fait une première prédiction juste et une deuxième prédicti Maintenant $B$ veut maximiser ses chances d'obtenir un bon score. Il ne connaît pas la valeur de $p$ mais il sait que $p\in P$ où $P$ est une partie de $[0,1]$. -Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in P$, ie. pour celle où ce gain espéré est minimal. +Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in \mathcal{P}$, ie. pour celle où ce gain espéré est minimal. \q Si $P=[0,1]$ (ie. on n'au aucune information a priori sur la valeur de $p$), quel est le gain minimal espéré pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? \q Quelle stratégie $\mathcal{S}$ donne le plus grand minimal espéré $\mathcal{G}_{\mathcal{S},P}$ et quel est-il si \begin{enumerate} - \item $P=[0,\frac{1}{2}]$ ? - \item $P=[0,1]$ ? - \item $P=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ? + \item $\mathcal{P}=[0,\frac{1}{2}]$ ? + \item $\mathcal{P}=[0,1]$ ? + \item $\mathcal{P}=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ? \end{enumerate} -A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $N+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$. +A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $n+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$. \q Quel est l'espérance du gain de B dans ce cadre pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? Quelle stratégie est la meilleure possible (celle qui maximise l'espérance du gain obtenu) ? -B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire. B gagne $M$ point si sa déclaration est correcte, pert 1 point par lancer supplémentaire, et peut demander au maximum $N$ lancers en plus de celui effectué initialement. +B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire, dans une limite de $n$ lancers demandés. B gagne $m$ point si sa déclaration est correcte (et aucun point s'il se trompe) et perd 1 point par lancer supplémentaire demandé. -\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? +Un exemple de partie, pour $n=3, m= 2$, est : +\begin{itemize} + \item A choisit la pièce 1 + \item A tire pile + \item B demance un lancer supplémentaire + \item A tire face + \item B demance un lancer supplémentaire + \item A tire face + \item B déclare que la pièce 1 a été choisie +\end{itemize} +Dans ce cas, B a demandé 2 lancers supplémentaires, ce qui est bien inférieur ou égal à $n=3$, et sa déclaration était juste donc son score est $-1-1+2=0$. -\q Maintenant A commence par tirer la pièce 1 puis, à partir du K-ième lancer, tire la pièce 2, où K est choisi uniformément au hasard. B essaye de deviner K et gagne N - |K-K'| points, où K' est sa prédiction. +\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? Que se passe-t-il quand $n\to\infty$ (ie. on ne fixe plus de limite au nombre de lancers demandés) ? + +Désormais, A possède toujours deux pièces mais change de pièce en cours de route. Avant la partie, il choisit uniformément au hasard un nombre $K$ entre $1$ et $n$ (inclus). Il tire la pièce $1$ pour les lancers $0, ..., K-1$ et la pièce $2$ pour les lancers $K, ..., n$. B B connaît toujours les probabilités $p_1$, $p_2$. + +\q B doit deviner quel $K$ a été choisi par A. \begin{enumerate} - \item Il annonce sa prédiction à la fin des N lancers. Quelle est la meilleure stratégie ? Quelle est alors son gain moyen ? - \item Il fait sa prédiction après le lancer K'. Quel est la meilleure stratégie ? Quel est son gain moyen ? + \item Il annonce sa prédiction après les $N+1$ lancers. Quelle stratégie lui permet de maximiser la probabilité d'avoir raison ? Quelle est alors cette probabilité ? + \item Après chaque lancer, $B$ peut décider de continuer ou annoncer \og{} la pièce a déjà changé \fg{}, auquel cas le jeu s'arrête. S'il a raison, il gagne $n-(m-K)$ points, où $m$ est le numéro du lancer après lequel l'annonce a été faite ($0$ pour le premier, $N$ pour le dernier). Autrement dit, si il fait l'annonce après le lancer $m$, soit $m