From b18d749136429fcabca19c07dbc585df117750a9 Mon Sep 17 00:00:00 2001
From: Timothee Rocquet <titigami31@gmail.com>
Date: Fri, 22 Mar 2024 21:45:39 +0100
Subject: [PATCH] =?UTF-8?q?mise=20=C3=A0=20jour=20fiche=20pi=C3=A8ce=20tru?=
 =?UTF-8?q?qu=C3=A9e?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 fiches/piece_truquee-fiche.tex    | 42 +++++++++++++++++++++++++++----
 fiches/rebonds_etranges-fiche.tex |  6 ++---
 2 files changed, 40 insertions(+), 8 deletions(-)

diff --git a/fiches/piece_truquee-fiche.tex b/fiches/piece_truquee-fiche.tex
index 07b5f98..fd01b6c 100644
--- a/fiches/piece_truquee-fiche.tex
+++ b/fiches/piece_truquee-fiche.tex
@@ -4,7 +4,7 @@
 
 b) (facile) Le gain moyen est $n(p^2+(1-p)^2)=n(2p^2-2p+1)$.
 
-c) (moyen) Pour le lancer $k$, la probabilité que la prédiction soit la bonne est $\frac{1}{2}(1-(1-2p)^{k+1})$ donc en sommant pour $k=1, ..., n$, l'espérance du gain est $\frac{1}{2}(n-(1-2p)^2\frac{1-(1-2p)^n}{2p})$.
+c) (moyen) La probabilité que la prédiction soit la bonne est $\frac{1}{2}(1-(1-2p)^{k+1})$ pour le lancer $k$ donc en sommant pour $k=1, ..., n$, l'espérance du gain est $\frac{1}{2}(n-(1-2p)^2\frac{1-(1-2p)^n}{2p})$.
 
 \q (facile) Il s'agit de calculer le minimum pour $p\in [0,1]$ des trois fonctions précédentes.
 
@@ -16,14 +16,46 @@ Cas c) : $\frac{n}{2}$, atteint en $p=\frac{1}{2}$.
 
 \q (Idée facile mais démonstration propre difficile)
 
-a) La meilleure stratégie consiste à toujours prédire face. Le gain minimal espéré est alors $\frac{2}{3}n$.
+a) Comme la pièce a toujours plus de chance de tomber sur face, la meilleure stratégie consiste à toujours prédire face. Le gain minimal espéré est alors $\frac{2}{3}n$.
 
 b) Si $p=\frac{1}{2}$, quelle que soit la stratégie choisie, le gain moyen sera toujours $\frac{1}{2}n$ donc le gain minimal espéré est $\frac{1}{2}n$.
 
 c) On peut montrer que la meilleure stratégie est la suivante : avant le lancer $k$, on regarde les résultats $0,...,k-1$ et on prédit le résultat majoritaire. En cas d'égalité, on prédit le résultat du lancer $0$. On peut montrer (mais ce n'est pas facile à faire proprement) qu'aucune stratégie ne peut donner un gain moyen strictement meilleur, et ce quelle que soit la valeur de $p$. Le gain minimal espéré est le gain moyen pour cette stratégie quand $p=\frac{3}{4}$ ou $p=\frac{1}{4}$ mais il est difficile à calculer (pas de formule close).
 
-\q Pour les cas de la question \textbf{1.}, l'espérance du gain est à chaque fois $q\times (\text{espérance avec } p_1) + (1-q)\times (\text{espérance avec } p_2)$.
+\q (facile-moyen mais démonstration propre difficile) Pour les cas de la question \textbf{1.}, l'espérance du gain est à chaque fois $q\times (\text{espérance avec } p_1) + (1-q)\times (\text{espérance avec } p_2)$.
 
-De manière générale, si Clara connaît $q,p_1,p_2$, le meilleur choix à faire est de prédire le résultat le plus probable sachant ce qui a déjà été tiré. Concrètement, si $X_i$ désigne le résultat du lancer $i$ ($1=\text{pile}$, $0=\text{face}$), si les lancers $0$ à $k-1$ ont déjà eu lieu et ont pour valeur $x_0,...,x_{k-1}$, Clara calcule $\mathbb{P}(X_k=1|X_0=x_0,X_1=x_1,...,X_{k-1}=x_{k-1})$ et $\mathbb{P}(X_k=0|X_0=x_0,X_1=x_1,...,X_{k-1}=x_{k-1})$ et fait le choix correspondant à la plus grande des deux valeurs.
+De manière générale, si Clara connaît $q,p_1,p_2$, le meilleur choix à faire est de prédire le résultat le plus probable sachant ce qui a déjà été tiré. Concrètement, si $X_i$ désigne le résultat du lancer $i$ ($1=\text{pile}$, $0=\text{face}$), si les lancers $0$ à $k-1$ ont déjà eu lieu et ont pour valeur $x_0,...,x_{k-1}$, Clara calcule $\mathbb{P}(X_k=1|X_0=x_0,X_1=x_1,...,X_{k-1}=x_{k-1})$ et $\mathbb{P}(X_k=0|X_0=x_0,...,X_{k-1}=x_{k-1})$ et fait le choix correspondant à la plus grande des deux valeurs.
 
-\q 
+\q (difficile) Il existe une stratégie explicite dont on peut montrer qu'elle est la meilleure possible mais qui est difficile à calculer en pratique. Voici l'idée intuitive, qui peut être rendue rigoureuse avec des arguments de programmation dynamique.
+
+On commence par le constat suivant : si on sait a priori que la pièce $1$ a été tirée avec probabilité $q$ et qu'on n'a le droit à aucun lancer, la meilleure prédiction à faire est $1$ si $q>1-q$, $2$ sinon. La probabilité de succès est alors $q\wedge (1-q)$ et le gain associé est $\alpha\times (q\wedge (1-q))=g(q)$.
+
+Supposons maintenant qu'on a droit à un lancer et qu'on l'utilise. Si $X$ désigne le résultat du lancer ($0=\text{pile}$, $1=\text{face}$) et $P$ est la pièce tirée ($1$ ou $2$), alors
+$$\mathbb{P}(P=1|X=1)=\frac{qp_1}{qp_1+(1-q)p_2}=\varphi_1(q)\quad \mathbb{P}(P=1|X=0)=\frac{q(1-p_1)}{q(1-p_1)+(1-q)(1-p_2)}=\varphi_0(q).$$
+Ainsi, après le premier lancer, la probabilité que la pièce choisie soit la pièce $1$ est $\varphi_X(q)$ et le meilleur gain espéré est alors $$\mathbb{E}(g(\varphi_X(q))-1)=(qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1$$
+La meilleure stratégie consiste donc à ne pas demander de lancer supplémentaire si on a $g(q)>((qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1)$ et à en demander un sinon. En adoptant cette stratégie, le gain espéré est
+$$g_1(q) = g_(q)\wedge ((qp_1+(1-q)p_2)g_0(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_0(\varphi_2(q))-1)$$
+Ce raisonnement se généralise : en appelant $g_k(q)$ le meilleur gain espéré (c'est à dire l'espérance du gain obtenu en utilisant la stratégie qui maximise cette espérance) si on a le droit de demander $k$ lancers et si la pièce $1$ est choisie avec probabilité $q$, on a la relation
+\begin{align*}
+g_{k+1}(q) = &  \alpha q \wedge \alpha (1-q) \wedge ((qp_1+(1-q)p_2)g_k(\varphi_1(q))+(q(1-p_1)+(1-q)(1-p_2))g_k(\varphi_2(q))-1)\\
+= & \alpha q \wedge \alpha (1-q) \wedge \big((qp_1+(1-q)p_2)g_k\left(\tfrac{qp_1}{qp_1+(1-q)p_2}\right) \\
+& \qquad \qquad \qquad \qquad +(q(1-p_1)+(1-q)(1-p_2))g_k\left(\tfrac{q(1-p_1)}{q(1-p_1)+(1-q)(1-p_2)}\right)-1\big)\\
+= & Tg_k(q)
+\end{align*}
+où $T$ est un opérateur agissant sur les fonctions continues de $[0,1]$ dans $\mathbb{R}$.
+
+Ainsi, en posant $g_k = T^kg_0 = T^k g$, la meilleure stratégie est la suivante : si on a déjà demandé $k$ lancers sur les $n$ et que les résultats sont $x_0,...,x_{k-1}$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_{k-1}=x_{k-1})=\varphi_{x_{k-1}}\circ ... \circ \varphi_{x_0}(q)$. Si $g(z)=g_{n-k}(z)$ alors on s'arrête et on parie sur la pièce $1$ si $q>1/2$, sur la pièce $2$ sinon. Sinon on demande un lancer supplémentaire.
+
+\medskip
+
+En utilisant l'expression de $g_0$ et des fonctions $g_k$, on montre par récurrence immédiate que pour tout $k$, $g_k(0)=g_k(1)=\alpha$ et la fonction $g_k$ s'exprime comme un maximum de fonctions affines. Par conséquent, elle est convexe et coïncide avec $g$ sur $[0,\varepsilon_k]\cup [\eta_k,1]$ donc la condition $g(z)=g_{n-k}(z)$ se réécrit $z\notin ]\varepsilon_k, \eta_k[$.
+
+On peut montrer (c'est difficile) que $g_k$ converge vers une fonction limite $g_\infty$ quand $k\to\infty$ qui coïncide avec $g$ sur $[0,\varepsilon_\infty]\cup [\eta_\infty,1]$. Par conséquent, pour $N\in\infty$, la stratégie optimale est : après le lancer $k$, on calcule $z = \mathbb{P}(P=1|X_0=x_0,...,X_{k-1}=x_{k-1})$. Si $z<\varepsilon_\infty$ on annonce la pièce $2$, si $z>\eta_\infty$ on annonce la pièce $1$, sinon on demande un lancer supplémentaire.
+
+\medskip
+
+On a donc une stratégie explicite. Cependant, le calcul exact des seuils $\varepsilon_k, \eta_k$ semble compliqué et a fortiori l'espérance exacte du gain obtenu en utilisant cette stratégie aussi.
+
+\q a) (moyen) Par formule de Bayes, on calcule pour tout $k$ la probabilité que $K=k$ sachant les lancers obtenus puis on annonce le $k$ correspondant à la valeur maximale.
+
+b) (ouvert)
\ No newline at end of file
diff --git a/fiches/rebonds_etranges-fiche.tex b/fiches/rebonds_etranges-fiche.tex
index d16ff29..c8d251f 100644
--- a/fiches/rebonds_etranges-fiche.tex
+++ b/fiches/rebonds_etranges-fiche.tex
@@ -2,9 +2,9 @@
 
 \q a) (Facile) Oui Nicolas peut emmener l'électron n'importe où. Puisque la distance maximale entre deux demi-tours est $2$, le nombre minimal de demi-tours pour aller de $A$ à $B$ est $\lceil\frac{AB}{2}\rceil -1$.
 
-b) (Moyen) On suppose $A=(0,0)$, $B=(\ell,0)$. On pose $P(t)$ la position de l'électron au temps $t$. On remarque que trouver le plus court chemin allant de $A$ à $B$ revient à trouver le plus court chemin allant de d'un point d'abscisse $0$ à un point d'abscisse $\ell$. En effet, si on considère un tel chemin de longueur $T$, si $P(0) = (0,0)$ et $P(T) = (\ell,h)$ alors si $h\neq 0$ on a $T'< T$ tel que $P(0)P(T') = \ell < P(0)P(T)$ donc en tournant globalement le chemin, va de $(0,0)$ à $(0,\ell)$ en un temps $T'<T$.
+b) (Moyen) On suppose $A=(0,0)$, $B=(\ell,0)$ où $\ell>0$. On pose $P(t)$ la position de l'électron au temps $t$. On remarque que trouver le plus court chemin allant de $A$ à $B$ revient à trouver le plus court chemin allant d'un point d'abscisse $0$ à un point d'abscisse $\ell$. En effet, si on considère un tel chemin de longueur $T$, si $P(0) = (0,0)$ et $P(T) = (\ell,h)$ alors si $h\neq 0$ on a $T'< T$ tel que $P(0)P(T') = \ell < P(0)P(T)$ donc en tournant globalement le chemin, va de $(0,0)$ à $(0,\ell)$ en un temps $T'<T$.
 
-On peut donc se contenter de regarder les abscisses $x(t)$ de $P(t)=(x(t),y(t))$. Si on observe le vecteur vitesse $v(t)$ du point, il s'agit d'un vecteur unitaire qui tourne à vitesse angulaire constante et qui fait demi-tour de temps à autre. Si $v(t)\cdot \overrightarrow{AB} < 0$ pour $t\in [t_1,t_2]$, en rajourant un demi-tour entre $t_1$ et $t_2$, on obtient une nouvelle trajectoire $P'(t)=(x'(t),y'(t))$ telle que $v'(t_2) = v(t_2)$ et $x'(t_2)>x(t_2)$ donc $x'$ atteint $\ell$ en un temps strictement plus court que $x$ donc si $P$ est le plus court chemin alors $v(t)\cdot \overrightarrow{AB} \geq 0 \;\forall t$. Les demi-tours ont donc lieu exactement quand $v(t)$ pointe vers le bas.
+On peut donc se contenter de regarder les abscisses $x(t)$ de $P(t)=(x(t),y(t))$. Si on observe le vecteur vitesse $v(t)$ du point, il s'agit d'un vecteur unitaire qui tourne à vitesse angulaire constante et qui fait demi-tour quand on appuie sur le bouton. Si $v(t)\cdot \overrightarrow{AB} < 0$ pour $t\in [t_1,t_2]$, en rajoutant un demi-tour en $t_1$ et en $t_2$, on obtient une nouvelle trajectoire $P'(t)=(x'(t),y'(t))$ telle que $v'(t_2) = v(t_2)$ et $x'(t_2)>x(t_2)$ donc $x'$ atteint $\ell$ en un temps strictement plus court que $x$ donc si $P$ est le plus court chemin alors $v(t)\cdot \overrightarrow{AB} \geq 0 \;\forall t$. Les demi-tours ont donc lieu exactement quand $v(t)$ pointe vers le haut.
 
 $x(t)$ augmente de $2$ quand $v$ fait un cycle complet (c'est-à-dire parcourt un demi-cercle) donc il reste à regarder ce qu'il se passe pour $\ell < 2$. On peut le faire avec $0$ ou $1$ demi-tour mais on constate que le trajet sans demi-tour est plus court.
 
@@ -20,7 +20,7 @@ Finalement, si $AB=\ell=2n+r$ où $n$ entier et $r\in [0,2[$, le chemin le plus
 
 (moyen) $N$ est continue à gauche : pour tout $r>0$, il existe $\varepsilon >0$ tel que $N(r')=N(r)$ pour tout $r' \in ]r-\varepsilon,r]$. En effet, en prenant une trajectoire avec $N(r)$ demi-tours, on peut toujours réduire un peu le cercle interdit de sorte qu'il ait un rayon $r'<r$ et que la trajectoire se trouve toujours à l'intérieur. On a alors $N(r')\leq N(r)$ (car le cercle de rayon $r'$ contient une trajectoire avec $N(r)$ demi-tours) et $N(r')\geq N(r)$ (par décroissance, car $r'<r$) donc $N(r')=N(r)$.
 
-(difficile) $N(r)\to +\infty$ quand $r\to +\infty$ : Si ce n'est pas le cas, on a $N_0$ et $M$ tels que pour tout $k\geq M$, $N(1+1/k)=N_0$. Pour tout $k\geq M$, on regarde $T_k$ une trajectoire partant de $(0,0)$ et restant à l'intérieur du cercle de centre $(1+1/k,0$ et de rayon $1+1/k$. $T_k$ est composée $M+1$ arcs de cercles de centres $C_k=(C_{k,0},...,C_{k,M})$ et de $M$ points de demi-tours $P_k=(P_{k,0},...,P_{k,M-1})$. Par compacité, quitte à extraire une sous-suite, $C_k \to C^\ast = (C_0^\ast,...,C_M^\ast)$ et $P_k \to P = (P_0^\ast,...,P_{M-1}^\ast)$. On a alors une trajectoire qui a les centres de ces arcs en $C_0^\ast,...,C_M^\ast$ et fait demi-tour aux points $P_0^\ast,...,P_{M-1}^\ast$. De plus, cette trajectoire limite est incluse dans le disque fermé $\mathcal{D}$ de centre $(1,1)$ et de rayon $1$ et vérifie $C_M^\ast=(1,0)$ ce qui est absurde car $P_{M-1}^\ast$ est alors à la fois dans $\mathcal{D}$ et hors de $\mathcal{D}$.
+(difficile) $N(r)\to +\infty$ quand $r\to +\infty$ : Si ce n'est pas le cas, on a $N_0$ et $M$ tels que pour tout $k\geq M$, $N(1+1/k)=N_0$. Pour tout $k\geq M$, on regarde $T_k$ une trajectoire partant de $(0,0)$ et restant à l'intérieur du cercle de centre $(1+1/k,0)$ et de rayon $1+1/k$. $T_k$ est composée $M+1$ arcs de cercles de centres $C_k=(C_{k,0},...,C_{k,M})$ et de $M$ points de demi-tours $P_k=(P_{k,0},...,P_{k,M-1})$. Par compacité, quitte à extraire une sous-suite, $C_k \to C^\ast = (C_0^\ast,...,C_M^\ast)$ et $P_k \to P = (P_0^\ast,...,P_{M-1}^\ast)$. On a alors une trajectoire qui a les centres de ses arcs en $C_0^\ast,...,C_M^\ast$ et fait demi-tour aux points $P_0^\ast,...,P_{M-1}^\ast$. De plus, cette trajectoire limite est incluse dans le disque fermé $\mathcal{D}$ de centre $(1,1)$ et de rayon $1$ et vérifie $C_M^\ast=(1,0)$ ce qui est absurde car $P_{M-1}^\ast$ est alors à la fois dans $\mathcal{D}$ et hors de $\mathcal{D}$.
 
 \q (Ouvert) Pour $N$ points en position générale aucun arc de cercle de contient $3$ points donc il faut au moins $N/2$ demi-tours et on peut se débrouiller pour que chaque arc de cercle contienne au moins un point donc il faut au plus $N$ demi-tours. Cas général d'un disque de rayon $R$ entièrement ouvert.