generated from Timothee/TFJM-Template
71 lines
6.0 KiB
TeX
71 lines
6.0 KiB
TeX
\section{Pièces truquées}
|
|
|
|
A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $n$, A lance donc $n+1$ fois la pièce (on suppose les lancers indépendants) et B fait $n$ prédictions pour les lancers $1$, $2$, ..., $n$.
|
|
|
|
Un exemple de partie, pour $n=2$, est :
|
|
\small
|
|
\begin{itemize}
|
|
\item A tire pile
|
|
\item B prédit face
|
|
\item A tire face
|
|
\item B prédit pile
|
|
\item A tire face
|
|
\end{itemize}
|
|
\normalsize
|
|
Dans ce cas, B a fait une première prédiction juste et une deuxième prédiction fausse.
|
|
|
|
\q B gagne un point par prédiction juste. Quelle est l'espérance de son gain si sa prédiction est
|
|
\begin{enumerate}
|
|
\item toujours pile ?
|
|
\item le résultat du lancer précédent ?
|
|
\item pile si le nombre de pile déjà tirés est pair, face sinon ?
|
|
\end{enumerate}
|
|
|
|
\q Le gain de B si sa prédiction est juste est désormais variable. Dans les cas a et b de la question 1, quel est l'espérance de son gain si
|
|
\begin{enumerate}
|
|
\item il gagne $m$ points pour une prédiction juste au lancer $m$ ?
|
|
\item il gagne autant de points qu'il a fait de prédiction juste jusqu'à présent (1 point pour la première prédiction juste, 2 pour la deuxième...) ?
|
|
\end{enumerate}
|
|
|
|
Maintenant $B$ veut maximiser ses chances d'obtenir un bon score. Il ne connaît pas la valeur de $p$ mais il sait que $p\in P$ où $P$ est une partie de $[0,1]$.
|
|
|
|
Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in \mathcal{P}$, ie. pour celle où ce gain espéré est minimal.
|
|
|
|
\q Si $P=[0,1]$ (ie. on n'au aucune information a priori sur la valeur de $p$), quel est le gain minimal espéré pour les stratégie a), b), c) décrites dans la question \textbf{1.} ?
|
|
|
|
\q Quelle stratégie $\mathcal{S}$ donne le plus grand minimal espéré $\mathcal{G}_{\mathcal{S},P}$ et quel est-il si
|
|
\begin{enumerate}
|
|
\item $\mathcal{P}=[0,\frac{1}{2}]$ ?
|
|
\item $\mathcal{P}=[0,1]$ ?
|
|
\item $\mathcal{P}=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
|
|
\end{enumerate}
|
|
|
|
A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $n+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.
|
|
|
|
\q Quel est l'espérance du gain de B dans ce cadre pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? Quelle stratégie est la meilleure possible (celle qui maximise l'espérance du gain obtenu) ?
|
|
|
|
B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire, dans une limite de $n$ lancers demandés. B gagne $m$ point si sa déclaration est correcte (et aucun point s'il se trompe) et perd 1 point par lancer supplémentaire demandé.
|
|
|
|
Un exemple de partie, pour $n=3, m= 2$, est :
|
|
\begin{itemize}
|
|
\item A choisit la pièce 1
|
|
\item A tire pile
|
|
\item B demance un lancer supplémentaire
|
|
\item A tire face
|
|
\item B demance un lancer supplémentaire
|
|
\item A tire face
|
|
\item B déclare que la pièce 1 a été choisie
|
|
\end{itemize}
|
|
Dans ce cas, B a demandé 2 lancers supplémentaires, ce qui est bien inférieur ou égal à $n=3$, et sa déclaration était juste donc son score est $-1-1+2=0$.
|
|
|
|
\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? Que se passe-t-il quand $n\to\infty$ (ie. on ne fixe plus de limite au nombre de lancers demandés) ?
|
|
|
|
Désormais, A possède toujours deux pièces mais change de pièce en cours de route. Avant la partie, il choisit uniformément au hasard un nombre $K$ entre $1$ et $n$ (inclus). Il tire la pièce $1$ pour les lancers $0, ..., K-1$ et la pièce $2$ pour les lancers $K, ..., n$. B B connaît toujours les probabilités $p_1$, $p_2$.
|
|
|
|
\q B doit deviner quel $K$ a été choisi par A.
|
|
\begin{enumerate}
|
|
\item Il annonce sa prédiction après les $N+1$ lancers. Quelle stratégie lui permet de maximiser la probabilité d'avoir raison ? Quelle est alors cette probabilité ?
|
|
\item Après chaque lancer, $B$ peut décider de continuer ou annoncer \og{} la pièce a déjà changé \fg{}, auquel cas le jeu s'arrête. S'il a raison, il gagne $n-(m-K)$ points, où $m$ est le numéro du lancer après lequel l'annonce a été faite ($0$ pour le premier, $N$ pour le dernier). Autrement dit, si il fait l'annonce après le lancer $m$, soit $m<K$ et il ne gagne pas de point, soit $m\geq K$ et il gagne $n$ points mais perd un point par tour de retard de son annonce. Quelle stratégie lui permet de maximiser l'espérance de son gain ? Quel est alors son gain moyen ?
|
|
\end{enumerate}
|
|
|
|
\q Proposer et étudier d'autres pistes de recherche. On pourra par exemple changer les lois de probabilité du problème, considérer des lancers non indépendants, étudier des cas avec plus de pièces... |