From 18ffdb23ec98a7a10a543021c1771859b1f9043b Mon Sep 17 00:00:00 2001
From: Timothee Rocquet <titigami31@gmail.com>
Date: Sat, 9 Dec 2023 16:00:14 +0100
Subject: [PATCH] mise a jour piece truquee

---
 src/piece_truquee.tex | 42 +++++++++++++++++++++++++++++-------------
 1 file changed, 29 insertions(+), 13 deletions(-)

diff --git a/src/piece_truquee.tex b/src/piece_truquee.tex
index 8aaf419..0a193f8 100644
--- a/src/piece_truquee.tex
+++ b/src/piece_truquee.tex
@@ -1,8 +1,9 @@
 \section{Pièces truquées}
 
-A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $N$, A lance donc $N+1$ fois la pièce (on suppose les lancers indépendants) et B fait $N$ prédictions pour les lancers $1$, $2$, ..., $N$.
+A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $n$, A lance donc $n+1$ fois la pièce (on suppose les lancers indépendants) et B fait $n$ prédictions pour les lancers $1$, $2$, ..., $n$.
 
-Un exemple de partie, pour $N=2$, est :
+Un exemple de partie, pour $n=2$, est :
+\small
 \begin{itemize}
 	\item A tire pile
 	\item B prédit face
@@ -10,6 +11,7 @@ Un exemple de partie, pour $N=2$, est :
 	\item B prédit pile
 	\item A tire face
 \end{itemize}
+\normalsize
 Dans ce cas, B a fait une première prédiction juste et une deuxième prédiction fausse.
 
 \q B gagne un point par prédiction juste. Quelle est l'espérance de son gain si sa prédiction est
@@ -27,29 +29,43 @@ Dans ce cas, B a fait une première prédiction juste et une deuxième prédicti
 
 Maintenant $B$ veut maximiser ses chances d'obtenir un bon score. Il ne connaît pas la valeur de $p$ mais il sait que $p\in P$ où $P$ est une partie de $[0,1]$.
 
-Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in P$, ie. pour celle où ce gain espéré est minimal.
+Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in \mathcal{P}$, ie. pour celle où ce gain espéré est minimal.
 
 \q Si $P=[0,1]$ (ie. on n'au aucune information a priori sur la valeur de $p$), quel est le gain minimal espéré pour les stratégie a), b), c) décrites dans la question \textbf{1.} ?
 
 \q Quelle stratégie $\mathcal{S}$ donne le plus grand minimal espéré $\mathcal{G}_{\mathcal{S},P}$ et quel est-il si
 \begin{enumerate}
-	\item $P=[0,\frac{1}{2}]$ ?
-	\item $P=[0,1]$ ?
-	\item $P=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
+	\item $\mathcal{P}=[0,\frac{1}{2}]$ ?
+	\item $\mathcal{P}=[0,1]$ ?
+	\item $\mathcal{P}=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
 \end{enumerate}
 
-A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $N+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.
+A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $n+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.
 
 \q Quel est l'espérance du gain de B dans ce cadre pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? Quelle stratégie est la meilleure possible (celle qui maximise l'espérance du gain obtenu) ?
 
-B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire. B gagne $M$ point si sa déclaration est correcte, pert 1 point par lancer supplémentaire, et peut demander au maximum $N$ lancers en plus de celui effectué initialement.
+B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire, dans une limite de $n$ lancers demandés. B gagne $m$ point si sa déclaration est correcte (et aucun point s'il se trompe) et perd 1 point par lancer supplémentaire demandé.
 
-\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ?
+Un exemple de partie, pour $n=3, m= 2$, est :
+\begin{itemize}
+	\item A choisit la pièce 1
+	\item A tire pile
+	\item B demance un lancer supplémentaire
+	\item A tire face
+	\item B demance un lancer supplémentaire
+	\item A tire face
+	\item B déclare que la pièce 1 a été choisie
+\end{itemize}
+Dans ce cas, B a demandé 2 lancers supplémentaires, ce qui est bien inférieur ou égal à $n=3$, et sa déclaration était juste donc son score est $-1-1+2=0$.
 
-\q Maintenant A commence par tirer la pièce 1 puis, à partir du K-ième lancer, tire la pièce 2, où K est choisi uniformément au hasard. B essaye de deviner K et gagne N - |K-K'| points, où K' est sa prédiction.
+\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? Que se passe-t-il quand $n\to\infty$ (ie. on ne fixe plus de limite au nombre de lancers demandés) ?
+
+Désormais, A possède toujours deux pièces mais change de pièce en cours de route. Avant la partie, il choisit uniformément au hasard un nombre $K$ entre $1$ et $n$ (inclus). Il tire la pièce $1$ pour les lancers $0, ..., K-1$ et la pièce $2$ pour les lancers $K, ..., n$. B  B connaît toujours les probabilités $p_1$, $p_2$.
+
+\q B doit deviner quel $K$ a été choisi par A.
 \begin{enumerate}
-	\item Il annonce sa prédiction à la fin des N lancers. Quelle est la meilleure stratégie ? Quelle est alors son gain moyen ?
-	\item Il fait sa prédiction après le lancer K'. Quel est la meilleure stratégie ? Quel est son gain moyen ?
+	\item Il annonce sa prédiction après les $N+1$ lancers. Quelle stratégie lui permet de maximiser la probabilité d'avoir raison ? Quelle est alors cette probabilité ?
+	\item Après chaque lancer, $B$ peut décider de continuer ou annoncer \og{} la pièce a déjà changé \fg{}, auquel cas le jeu s'arrête. S'il a raison, il gagne $n-(m-K)$ points, où $m$ est le numéro du lancer après lequel l'annonce a été faite ($0$ pour le premier, $N$ pour le dernier). Autrement dit, si il fait l'annonce après le lancer $m$, soit $m<K$ et il ne gagne pas de point, soit $m\geq K$ et il gagne $n$ points mais perd un point par tour de retard de son annonce. Quelle stratégie lui permet de maximiser l'espérance de son gain ? Quel est alors son gain moyen ?
 \end{enumerate}
 
-\q A possède maintenant deux pièces qui tombent sur pile avec probabilités respectives $p_1$ et $p_2$.
\ No newline at end of file
+\q Proposer et étudier d'autres pistes de recherche. On pourra par exemple changer les lois de probabilité du problème, considérer des lancers non indépendants, étudier des cas avec plus de pièces...
\ No newline at end of file