generated from Timothee/TFJM-Template
mise a jour piece truquee
This commit is contained in:
parent
c2efdbf18f
commit
18ffdb23ec
|
@ -1,8 +1,9 @@
|
|||
\section{Pièces truquées}
|
||||
|
||||
A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $N$, A lance donc $N+1$ fois la pièce (on suppose les lancers indépendants) et B fait $N$ prédictions pour les lancers $1$, $2$, ..., $N$.
|
||||
A et B jouent à un jeu de pile ou face. A possède une pièce truquée qui tombe sur pile avec probabilité $p\in[0,1]$. Le jeu se déroule de la manière suivante : A lance une première fois la pièce, puis B essaye de prédire le résultat du lancer suivant, A lance à nouveau la pièce, B fait une prédiction et ainsi de suite. Si on numérote les lancers de $0$ à $n$, A lance donc $n+1$ fois la pièce (on suppose les lancers indépendants) et B fait $n$ prédictions pour les lancers $1$, $2$, ..., $n$.
|
||||
|
||||
Un exemple de partie, pour $N=2$, est :
|
||||
Un exemple de partie, pour $n=2$, est :
|
||||
\small
|
||||
\begin{itemize}
|
||||
\item A tire pile
|
||||
\item B prédit face
|
||||
|
@ -10,6 +11,7 @@ Un exemple de partie, pour $N=2$, est :
|
|||
\item B prédit pile
|
||||
\item A tire face
|
||||
\end{itemize}
|
||||
\normalsize
|
||||
Dans ce cas, B a fait une première prédiction juste et une deuxième prédiction fausse.
|
||||
|
||||
\q B gagne un point par prédiction juste. Quelle est l'espérance de son gain si sa prédiction est
|
||||
|
@ -27,29 +29,43 @@ Dans ce cas, B a fait une première prédiction juste et une deuxième prédicti
|
|||
|
||||
Maintenant $B$ veut maximiser ses chances d'obtenir un bon score. Il ne connaît pas la valeur de $p$ mais il sait que $p\in P$ où $P$ est une partie de $[0,1]$.
|
||||
|
||||
Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in P$, ie. pour celle où ce gain espéré est minimal.
|
||||
Une \emph{stratégie} pour B est donc une manière de choisir quelle prédiction il va faire avant le lancer $m$ en fonction des résultats des lancers $0,1,2,...,m-1$. La question 1 donne donc trois exemples de stratégies. Si on appel $G_\mathcal{S}$ le gain (aléatoire) obtenu pour la stratégie $\mathcal{S}$, le \emph{gain minimal espéré} pour la stratégie $\mathcal{S}$ est $\mathcal{G}_{\mathcal{S},P}=\min_{p\in P} \mathbb{E}_p(G_\mathcal{S})$ où $\mathbb{E}_p$ désigne l'espérance dans le cas où la pièce tombe sur pile avec probabilité $p$. Autrement dit, $\mathcal{G}_\mathcal{S}$ est l'espérance du gain apporté par la stratégie $\mathcal{S}$ pour la pire des valeurs de $p\in \mathcal{P}$, ie. pour celle où ce gain espéré est minimal.
|
||||
|
||||
\q Si $P=[0,1]$ (ie. on n'au aucune information a priori sur la valeur de $p$), quel est le gain minimal espéré pour les stratégie a), b), c) décrites dans la question \textbf{1.} ?
|
||||
|
||||
\q Quelle stratégie $\mathcal{S}$ donne le plus grand minimal espéré $\mathcal{G}_{\mathcal{S},P}$ et quel est-il si
|
||||
\begin{enumerate}
|
||||
\item $P=[0,\frac{1}{2}]$ ?
|
||||
\item $P=[0,1]$ ?
|
||||
\item $P=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
|
||||
\item $\mathcal{P}=[0,\frac{1}{2}]$ ?
|
||||
\item $\mathcal{P}=[0,1]$ ?
|
||||
\item $\mathcal{P}=[0,\frac{1}{4}]\cup [\frac{3}{4},1]$ ?
|
||||
\end{enumerate}
|
||||
|
||||
A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $N+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.
|
||||
A partir de maintenant, le joueur A possède deux pièces, d'apparences indistinguables, qui tombent sur pile avec des probabilités respectives $p_1$ et $p_2$. Il commence par choisir au hasard une deux deux pièces : il prend la pièce $1$ avec probabilité $q$ (donc la pièce $2$ avec probabilité $1-q$) puis tire $n+1$ fois la pièce choisie, comme avant. On suppose que le joueur B connaît les probabilités $p_1$, $p_2$, $q$.
|
||||
|
||||
\q Quel est l'espérance du gain de B dans ce cadre pour les stratégie a), b), c) décrites dans la question \textbf{1.} ? Quelle stratégie est la meilleure possible (celle qui maximise l'espérance du gain obtenu) ?
|
||||
|
||||
B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire. B gagne $M$ point si sa déclaration est correcte, pert 1 point par lancer supplémentaire, et peut demander au maximum $N$ lancers en plus de celui effectué initialement.
|
||||
B n'essaye plus de deviner les lancers mais plutôt quelle pièce a été choisie. Comme précédemment, A lance plusieurs fois la pièce la pièce mais, après chaque lancer, B peut choisir de déclarer quelle pièce a été choisie selon lui, auquel cas le jeu s'arrête, ou de demander un lancer supplémentaire, dans une limite de $n$ lancers demandés. B gagne $m$ point si sa déclaration est correcte (et aucun point s'il se trompe) et perd 1 point par lancer supplémentaire demandé.
|
||||
|
||||
\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ?
|
||||
Un exemple de partie, pour $n=3, m= 2$, est :
|
||||
\begin{itemize}
|
||||
\item A choisit la pièce 1
|
||||
\item A tire pile
|
||||
\item B demance un lancer supplémentaire
|
||||
\item A tire face
|
||||
\item B demance un lancer supplémentaire
|
||||
\item A tire face
|
||||
\item B déclare que la pièce 1 a été choisie
|
||||
\end{itemize}
|
||||
Dans ce cas, B a demandé 2 lancers supplémentaires, ce qui est bien inférieur ou égal à $n=3$, et sa déclaration était juste donc son score est $-1-1+2=0$.
|
||||
|
||||
\q Maintenant A commence par tirer la pièce 1 puis, à partir du K-ième lancer, tire la pièce 2, où K est choisi uniformément au hasard. B essaye de deviner K et gagne N - |K-K'| points, où K' est sa prédiction.
|
||||
\q Quelle est la meilleure stratégie pour B (celle qui maximise l'espérance du gain obtenu) ? Que se passe-t-il quand $n\to\infty$ (ie. on ne fixe plus de limite au nombre de lancers demandés) ?
|
||||
|
||||
Désormais, A possède toujours deux pièces mais change de pièce en cours de route. Avant la partie, il choisit uniformément au hasard un nombre $K$ entre $1$ et $n$ (inclus). Il tire la pièce $1$ pour les lancers $0, ..., K-1$ et la pièce $2$ pour les lancers $K, ..., n$. B B connaît toujours les probabilités $p_1$, $p_2$.
|
||||
|
||||
\q B doit deviner quel $K$ a été choisi par A.
|
||||
\begin{enumerate}
|
||||
\item Il annonce sa prédiction à la fin des N lancers. Quelle est la meilleure stratégie ? Quelle est alors son gain moyen ?
|
||||
\item Il fait sa prédiction après le lancer K'. Quel est la meilleure stratégie ? Quel est son gain moyen ?
|
||||
\item Il annonce sa prédiction après les $N+1$ lancers. Quelle stratégie lui permet de maximiser la probabilité d'avoir raison ? Quelle est alors cette probabilité ?
|
||||
\item Après chaque lancer, $B$ peut décider de continuer ou annoncer \og{} la pièce a déjà changé \fg{}, auquel cas le jeu s'arrête. S'il a raison, il gagne $n-(m-K)$ points, où $m$ est le numéro du lancer après lequel l'annonce a été faite ($0$ pour le premier, $N$ pour le dernier). Autrement dit, si il fait l'annonce après le lancer $m$, soit $m<K$ et il ne gagne pas de point, soit $m\geq K$ et il gagne $n$ points mais perd un point par tour de retard de son annonce. Quelle stratégie lui permet de maximiser l'espérance de son gain ? Quel est alors son gain moyen ?
|
||||
\end{enumerate}
|
||||
|
||||
\q A possède maintenant deux pièces qui tombent sur pile avec probabilités respectives $p_1$ et $p_2$.
|
||||
\q Proposer et étudier d'autres pistes de recherche. On pourra par exemple changer les lois de probabilité du problème, considérer des lancers non indépendants, étudier des cas avec plus de pièces...
|
Loading…
Reference in New Issue