TFJM-2024/src/piece_truquee.tex

\section{Pièces truquées}

A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $n$, A lance donc $n+1$ fois la pièce (on suppose les lancers indépendants) et B fait $n$ prédictions pour les lancers $1$, $2$, ..., $n$.

Un exemple de partie, pour $n=2$, est :
\small
\begin{itemize}
	\item A tire pile
	\item B prédit face
	\item A tire face
	\item B prédit pile
	\item A tire face
\end{itemize}
\normalsize
Dans ce cas, B a fait une première prédiction juste et une deuxième prédiction fausse.

\q B gagne un point par prédiction juste. Quelle est l'espérance de son gain si sa prédiction est
\begin{enumerate}
	\item toujours pile ?
	\item le résultat du lancer précédent ?
	\item pile si le nombre de pile déjà tirés est pair, face sinon ?
\end{enumerate}

\q Le gain de B si sa prédiction est juste est désormais variable. Dans les cas a et b de la question 1, quel est l'espérance de son gain si
\begin{enumerate}
	\item il gagne $m$ points pour une prédiction juste au lancer $m$ ?
	\item il gagne autant de points qu'il a fait de prédiction juste jusqu'à présent (1 point pour la première prédiction juste, 2 pour la deuxième...) ?
\end{enumerate}

Maintenant $B$ veut maximiser ses chances d'obtenir un bon score. Il ne connaît pas la valeur de $p$ mais il sait que $p\in P$ où $P$ est une partie de $[0,1]$.

Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in \mathcal{P}$, ie. pour celle où ce gain espéré est minimal.

\q Si $P=[0,1]$ (ie. on n'au aucune information a priori sur la valeur de $p$), quel est le gain minimal espéré pour les stratégie a), b), c) décrites dans la question \textbf{1.} ?

\q Quelle stratégie $\mathcal{S}$ donne le plus grand minimal espéré $\mathcal{G}_{\mathcal{S},P}$ et quel est-il si
\begin{enumerate}
	\item $\mathcal{P}=[0,\frac{1}{2}]$ ?
	\item $\mathcal{P}=[0,1]$ ?
	\item $\mathcal{P}=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
\end{enumerate}

A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $n+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.

\q Quel est l'espérance du gain de B dans ce cadre pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? Quelle stratégie est la meilleure possible (celle qui maximise l'espérance du gain obtenu) ?

B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire, dans une limite de $n$ lancers demandés. B gagne $m$ point si sa déclaration est correcte (et aucun point s'il se trompe) et perd 1 point par lancer supplémentaire demandé.

Un exemple de partie, pour $n=3, m= 2$, est :
\begin{itemize}
	\item A choisit la pièce 1
	\item A tire pile
	\item B demance un lancer supplémentaire
	\item A tire face
	\item B demance un lancer supplémentaire
	\item A tire face
	\item B déclare que la pièce 1 a été choisie
\end{itemize}
Dans ce cas, B a demandé 2 lancers supplémentaires, ce qui est bien inférieur ou égal à $n=3$, et sa déclaration était juste donc son score est $-1-1+2=0$.

\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? Que se passe-t-il quand $n\to\infty$ (ie. on ne fixe plus de limite au nombre de lancers demandés) ?

Désormais, A possède toujours deux pièces mais change de pièce en cours de route. Avant la partie, il choisit uniformément au hasard un nombre $K$ entre $1$ et $n$ (inclus). Il tire la pièce $1$ pour les lancers $0, ..., K-1$ et la pièce $2$ pour les lancers $K, ..., n$. B  B connaît toujours les probabilités $p_1$, $p_2$.

\q B doit deviner quel $K$ a été choisi par A.
\begin{enumerate}
	\item Il annonce sa prédiction après les $N+1$ lancers. Quelle stratégie lui permet de maximiser la probabilité d'avoir raison ? Quelle est alors cette probabilité ?
	\item Après chaque lancer, $B$ peut décider de continuer ou annoncer \og{} la pièce a déjà changé \fg{}, auquel cas le jeu s'arrête. S'il a raison, il gagne $n-(m-K)$ points, où $m$ est le numéro du lancer après lequel l'annonce a été faite ($0$ pour le premier, $N$ pour le dernier). Autrement dit, si il fait l'annonce après le lancer $m$, soit $m<K$ et il ne gagne pas de point, soit $m\geq K$ et il gagne $n$ points mais perd un point par tour de retard de son annonce. Quelle stratégie lui permet de maximiser l'espérance de son gain ? Quel est alors son gain moyen ?
\end{enumerate}

\q Proposer et étudier d'autres pistes de recherche. On pourra par exemple changer les lois de probabilité du problème, considérer des lancers non indépendants, étudier des cas avec plus de pièces...