From 164852a5071842ec9e15b8bdadf2177adf1bd6c8 Mon Sep 17 00:00:00 2001
From: Timothee Rocquet <titigami31@gmail.com>
Date: Sat, 23 Mar 2024 01:47:38 +0100
Subject: [PATCH] =?UTF-8?q?mise=20=C3=A0=20jour=20fiche=20pi=C3=A8ce=20tru?=
 =?UTF-8?q?qu=C3=A9e?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 fiches/piece_truquee-fiche.tex | 25 +++++++++----------------
 1 file changed, 9 insertions(+), 16 deletions(-)

diff --git a/fiches/piece_truquee-fiche.tex b/fiches/piece_truquee-fiche.tex
index fd01b6c..3f723df 100644
--- a/fiches/piece_truquee-fiche.tex
+++ b/fiches/piece_truquee-fiche.tex
@@ -32,30 +32,23 @@ On commence par le constat suivant : si on sait a priori que la pièce $1$ a ét
 
 Supposons maintenant qu'on a droit à un lancer et qu'on l'utilise. Si $X$ désigne le résultat du lancer ($0=\text{pile}$, $1=\text{face}$) et $P$ est la pièce tirée ($1$ ou $2$), alors
 $$\mathbb{P}(P=1|X=1)=\frac{qp_1}{qp_1+(1-q)p_2}=\varphi_1(q)\quad \mathbb{P}(P=1|X=0)=\frac{q(1-p_1)}{q(1-p_1)+(1-q)(1-p_2)}=\varphi_0(q).$$
-Ainsi, après le premier lancer, la probabilité que la pièce choisie soit la pièce $1$ est $\varphi_X(q)$ et le meilleur gain espéré est alors $$\mathbb{E}(g(\varphi_X(q))-1)=(qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1$$
-La meilleure stratégie consiste donc à ne pas demander de lancer supplémentaire si on a $g(q)>((qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1)$ et à en demander un sinon. En adoptant cette stratégie, le gain espéré est
-$$g_1(q) = g_(q)\wedge ((qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1)$$
-Ce raisonnement se généralise : en appelant $g_k(q)$ le meilleur gain espéré (c'est à dire l'espérance du gain obtenu en utilisant la stratégie qui maximise cette espérance) si on a le droit de demander $k$ lancers et si la pièce $1$ est choisie avec probabilité $q$, on a la relation
+Ainsi, après le premier lancer, la probabilité que la pièce choisie soit la pièce $1$ est $\varphi_X(q)$ et le meilleur gain espéré est alors $$\mathbb{E}(g(\varphi_X(q))-1)=(qp_1+(1-q)p_2)g(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g(\varphi_2(q))-1$$
+La meilleure stratégie consiste donc à ne pas demander de lancer supplémentaire si on a l'inégalité $g(q)>((qp_1+(1-q)p_2)g(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g(\varphi_2(q))-1)$ et à en demander un sinon. En adoptant cette stratégie, le gain espéré est
+$$g_1(q) = g(q)\wedge ((qp_1+(1-q)p_2)g(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g(\varphi_2(q))-1)$$
+Ce raisonnement se généralise : en appelant $g_k(q)$ le meilleur gain espéré (c'est à dire l'espérance du gain obtenu en utilisant la stratégie qui maximise cette espérance) si on a le droit de demander $k$ lancers et si la pièce $1$ est choisie avec probabilité $q$, on a $g_0=g$ et
 \begin{align*}
-g_{k+1}(q) = &  \alpha q \wedge \alpha (1-q) \wedge ((qp_1+(1-q)p_2)g_k(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_k(\varphi_2(q))-1)\\
+g_{k+1}(q) = & g(q) \wedge ((qp_1+(1-q)p_2)g_k(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_k(\varphi_2(q))-1)\\
 = & \alpha q \wedge \alpha (1-q) \wedge \big((qp_1+(1-q)p_2)g_k\left(\tfrac{qp_1}{qp_1+(1-q)p_2}\right) \\
-& \qquad \qquad \qquad \qquad +(q(1-p_1)+(1-q)(1-p_2))g_k\left(\tfrac{q(1-p_1)}{q(1-p_1)+(1-q)(1-p_2)}\right)-1\big)\\
-= & Tg_k(q)
+& \qquad \qquad +(q(1-p_1)+(1-q)(1-p_2))g_k\left(\tfrac{q(1-p_1)}{q(1-p_1)+(1-q)(1-p_2)}\right)-1\big) = Tg_k(q)
 \end{align*}
 où $T$ est un opérateur agissant sur les fonctions continues de $[0,1]$ dans $\mathbb{R}$.
 
-Ainsi, en posant $g_k = T^kg_0 = T^k g$, la meilleure stratégie est la suivante : si on a déjà demandé $k$ lancers sur les $n$ et que les résultats sont $x_0,...,x_{k-1}$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_{k-1}=x_{k-1})=\varphi_{x_{k-1}}\circ ... \circ \varphi_{x_0}(q)$. Si $g(z)=g_{n-k}(z)$ alors on s'arrête et on parie sur la pièce $1$ si $q>1/2$, sur la pièce $2$ sinon. Sinon on demande un lancer supplémentaire.
+Ainsi, en posant $g_k = T^kg_0 = T^k g$, la meilleure stratégie est : si on a déjà demandé $k$ lancers sur $n$ dont les résultats sont $x_0,...,x_k$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_k=x_k)=\varphi_{x_k}\circ ... \circ \varphi_{x_0}(q)$. Si $g(z)=g_{n-k}(z)$ alors on s'arrête et on parie sur la pièce $1$ si $q>1/2$, sur la pièce $2$ sinon. Sinon on demande un lancer supplémentaire.
 
-\medskip
-
-En utilisant l'expression de $g_0$ et des fonctions $g_k$, on montre par récurrence immédiate que pour tout $k$, $g_k(0)=g_k(1)=\alpha$ et la fonction $g_k$ s'exprime comme un maximum de fonctions affines. Par conséquent, elle est convexe et coïncide avec $g$ sur $[0,\varepsilon_k]\cup [\eta_k,1]$ donc la condition $g(z)=g_{n-k}(z)$ se réécrit $z\notin ]\varepsilon_k, \eta_k[$.
-
-On peut montrer (c'est difficile) que $g_k$ converge vers une fonction limite $g_\infty$ quand $k\to\infty$ qui coïncide avec $g$ sur $[0,\varepsilon_\infty]\cup [\eta_\infty,1]$. Par conséquent, pour $N\in\infty$, la stratégie optimale est : après le lancer $k$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_{k-1}=x_{k-1})$. Si $z<\varepsilon_\infty$ on annonce la pièce $2$, si $z>\eta_\infty$ on annonce la pièce $1$, sinon on demande un lancer supplémentaire.
-
-\medskip
+En utilisant l'expression de $g_0$ et des fonctions $g_k$, on montre par récurrence immédiate que pour tout $k$, $g_k(0)=g_k(1)=\alpha$ et la fonction $g_k$ s'exprime comme un maximum de fonctions affines. Par conséquent, elle est convexe et coïncide avec $g$ sur $[0,\varepsilon_k]\cup [\eta_k,1]$ donc la condition $g(z)=g_{n-k}(z)$ se réécrit $z\notin ]\varepsilon_k, \eta_k[$. De plus, $g_{k+1}\geq g_k$ par convexité donc $g_k$ converge vers une fonction limite $g_\infty$ quand $k\to\infty$ qui coïncide avec $g$ sur $[0,\varepsilon_\infty]\cup [\eta_\infty,1]$ donc pour $n\to\infty$, la stratégie optimale est : après le lancer $k$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_k=x_k)$. Si $z<\varepsilon_\infty$ on annonce la pièce $2$, si $z>\eta_\infty$ on annonce la pièce $1$, sinon on demande un lancer supplémentaire.
 
 On a donc une stratégie explicite. Cependant, le calcul exact des seuils $\varepsilon_k, \eta_k$ semble compliqué et a fortiori l'espérance exacte du gain obtenu en utilisant cette stratégie aussi.
 
-\q a) (moyen) Par formule de Bayes, on calcule pour tout $k$ la probabilité que $K=k$ sachant les lancers obtenus puis on annonce le $k$ correspondant à la valeur maximale.
+\q a) (moyen mais calculs pénibles) Par formule de Bayes, on calcule pour tout $k$ la probabilité que $K=k$ sachant les lancers obtenus puis on annonce le $k$ correspondant à la valeur maximale.
 
 b) (ouvert)
\ No newline at end of file