优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
$ M2 X& v. F% X8 y4 }5 U7 E& _
$ H( E# M# r0 u# I% A
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
1 X) H+ j+ ~/ ~8 e! \
g) D7 H/ {, W3 Z6 P8 `1 n
问题
) g5 ~- l1 L" i, f0 K$ h5 o
- } ?. D8 a1 r9 |% D- d
" f5 u+ _: L6 y9 f. }
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
! g6 @* X7 S% n* P
& o! l T0 G2 i y6 b+ x5 ?
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
. o5 M* N. ~7 a! ^, Y2 H
4 i0 w' E) \7 t* a
本文
( l0 S/ N: A! y# z0 S$ J- x- ?. ~
5 \5 U& M- X0 y& v& u$ F
/ t1 P8 S$ f$ v$ x
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
. e' ^3 \' e' A9 L& y
7 Y0 D1 ^3 v3 J/ f
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
3 b! N1 b/ N( q3 [/ r# I
+ l; M0 \9 V5 O( E# V/ R0 J
% K4 w& p* F6 P6 B2 L" e
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
b: g7 c5 v% R) g
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
. |' j$ F" Y* T$ L
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
% o2 {) V1 e. G: U* ^
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
) ~6 t! ~% R8 ?3 V. \. h3 }
) Z7 g6 a' e1 ~1 }! F$ l
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
0 W0 ^4 y3 g: w" K# n# [6 }
8 J2 |5 [6 y! `0 b; ]! j* f
++,
& G8 Z0 T, B k
+-++,-+++,
) A O: U; S) }& S. U! W2 g- Q. v
+-+-++,+-+++,-++-++,-+-+++,
4 L9 K- J7 \8 V1 W2 l# H- T$ M
。
' N) Z! T) F2 S& j: ?
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
9 f7 A- r4 A. |. e8 E4 B
# v" p/ X% |$ c" r9 x" |: U- \
. |; s, ^) Z% k. u
! D+ V- K6 @, |% X- q: u, X
$ B, Y# a) v, y7 Y3 N
" z# q. e0 Y3 T$ e
( L3 j" S% L% t+ @( l2 Y
4 z2 [& I2 P! m7 K0 S6 P
; g3 L" _- t: u5 ^6 w; N
6 y- | Z; i' h/ e
: U; R, r; x9 q E; Z1 T
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
) @+ Z, H' [, |7 Z0 q
. H" Z5 K4 q3 k
++,+-+,
( ?( K3 `- R- Z6 I! P- `" b6 d( d
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
+ ~$ \2 a: k) F9 F) b
-+-+++,-+-++-+,
0 ?5 N" x4 ~8 [ u/ h; G3 m+ f
3 T% F- _1 j7 m- E7 S6 A! B
, ,
6 L. l" { ]7 `1 X5 T8 c' Z
。
) i2 G( t) Q2 |* Z; {& X
: h! ]( Y( Q! c6 v
仿上之计算,可得此时甲赢的机率为
7 }$ _1 N. S1 q/ B
+ l! I4 Y! f1 U3 ?
5 U; n- ]( J" R
: J6 A( n- w6 M, r# f
. ?( y$ E2 c9 F
& f# i) O/ T9 A$ J! F! Z
, X" C& h% c7 z/ ^+ J0 y# R( L1 ]7 P" U
- j& b) W* e9 e
5 a$ | r+ [$ a1 G
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
* I/ f5 h! H, g
. D9 \ P7 _# h, I: f) x
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
" U4 I8 u( M$ C% Z6 _$ ]1 G
+ _* O- B6 {7 A! b0 R, |
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
6 ^" v# b8 W; x) j+ S& G8 O
0 d5 }3 z$ a9 A% I L/ J/ ?
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
# o& L) E0 W, a8 s5 F" A% ~: q
/ ]) j0 [! I }
/ A& H3 r5 L' v9 | \6 x
情况一:
: G% K0 V1 n7 X* U& @
此时不论甲如何下注, 恒等于 c/(m+c)。
. o& l' t. I4 x" u
7 c# G/ k8 C" g c
情况二:
- F+ }) r e% O% s" r; R; m
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
9 x, j, k p8 V
8 H5 Z; y* U6 m2 Z7 ^% b
情况三:
( i+ H* @( `' S: V. Y
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
- M6 I1 m% t* r. Z
+ b5 M. ` z2 Q; |
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
% I7 y7 }2 @7 W& ?7 X2 X
, m* b2 n; T# t( s1 I+ N0 T& d- a. f
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
6 A2 I* u% u3 X5 b- W% _; U
L, H _0 s, u# v+ p
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
0 ^/ l# l# Y- }: S w1 i$ l5 @
0 f# z5 c6 k( f
3 n+ C: _4 @) }- t- Z7 x( S
情况一:
. W) ~& o' O `" u6 p4 @$ g
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
8 e9 V" Q1 j# v4 B% J/ A+ _
2 y! K5 {$ E5 g6 N4 b. _
5 J9 E6 D$ Q( N7 V" k
! ?' ]0 z4 R/ X! `8 R
) a2 ~' c7 X. z: {8 i
- z2 P0 E- m. ?- c4 f
1 F: k2 O" x" r
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
3 @, [8 ]. l' w! n
/ C+ Y" X7 U2 D% [
情况二:
- E1 Q' W' z8 k
令 q=1-p。此时对 ν 我们有方程式
0 S9 O: c! t8 E7 p
! j& m/ U' d0 V
P- U. G, x8 G) q, T& e
+ O2 \% C/ I) u
. ^7 x! \ S3 J# R; X
8 |4 {& D6 X6 P
, O( g* h$ k! _1 g. X& A1 @8 L
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
4 C& u9 @: f5 Q% ?' C
利用p+q=1,上组方程式可改写为
% Z& ]8 m( C# {0 o/ w
! g) r: c T6 l! x7 u2 d
) z! ]1 J/ _" ]8 ?. e' T
+ V8 h; D1 A8 p s5 ^& q2 C3 w
9 b- I# }$ ^* k2 N/ T# j
. [6 L* z; x* ^6 t# C
8 a4 ]- ^1 i' n. ^% Y
两边相加,并利用 、,得
/ F9 t5 F; F$ \% F A, I% u
/ F. d5 k2 i9 z: i9 b, J& F7 O( O0 z
8 B2 Y/ T+ ~2 K
: z) p' R: @2 m" w' u1 i
9 m0 P, u- z# G% `% D d0 Q3 U& y
+ N4 d! f" K6 s0 m8 O
! q- m0 i, g0 K1 m6 y$ f! x3 N6 }
若取前 c 项相加,则得
( E( Z2 x. w( F z! c
' c2 ~" y8 c6 D5 B: O
6 i% r- y7 r( s7 d+ x# ?
7 v1 m8 m: p+ r1 `& N6 j |
4 Z) W/ G5 ~2 K+ e/ h2 {
, N/ G8 n" ]- u6 [0 ^* q
, Y0 @* L) M& n, q! p
情况三:
8 O! G5 e: A0 m6 x5 U/ @, o* \
仿二之解法,可求得
( ~2 r2 T* k( ^9 z) `2 T
& q" k4 S6 U+ D
6 l6 s- c2 X$ Z6 v# [& {
: Y+ X, M# C! G1 m
7 u& z# z- Z1 ^ d3 z
, A1 h4 ~/ o, z
% F, D. _) U3 G* d& I/ k
8 e u4 p5 I6 {( G
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
! t2 Q% S. G: I( @
$ S+ [7 {7 D" w
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
7 }0 a- A# e$ q5 w# s/ }
) L& T4 `, t6 ?0 w% a- X# A' O) e
6 u3 }# s. i8 R3 c) a2 U
定理:
" \. c: J, R7 D: C% e
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
- ^& j" o1 x9 I( \& i, w* i& d
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
9 U1 O; O. c! a3 F
! ]! m- R4 j* s* Z5 G2 f6 S* D
现在我们就拿这定理来证明先前我们所下之结论。
& i/ F8 Y; U; k/ s3 t: N
( q/ B& D e3 _* N+ M& f; F
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
6 _8 X3 A/ S5 N! p" A) b1 z
( x- W. h! O. \7 [6 P: S7 c: d* m
至于在情况二或三时,我们取 。此时若给定 Sn,则
/ f# p) F5 x0 K3 V5 P
% s4 T4 F3 q! L; ^
) E4 h" A# N7 N5 ^6 i
# E. x; U Y4 o7 B
3 T! {% R0 w. b2 J/ V
' E3 u& k0 G$ j5 F' ?9 D. H+ M
k& k5 Q2 r0 A0 e
0 H/ E$ x" L; T
+ X# Y- o" c8 [- p
其中 为所下注之金额。利用
7 G# c% j* z1 W! y( C0 Y D
6 ~- K" o, w1 Z4 Z( U
3 h6 u' k* l! s8 [" K% A
, d0 \; x4 r; g
9 y- D( r4 U; G, b6 ?7 Z; J
5 g. a! z+ I; p/ i, W( o0 E
4 G" A! I5 n6 Z
% ?4 G1 v: E' q; n4 K. s* \
, V2 _% h* [0 D
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
1 u1 L/ C [- F5 b! v
& K% i# K8 h' p7 f5 h- k
: X3 J6 ?# x& \) T5 `
: k5 V, V- C& i. Q0 s
3 o/ J+ |: t+ E, ^$ [
9 H7 x: t$ a, n$ [$ t0 C
) x# a0 S* u7 T: c1 J% ]- n
6 K: O5 z& E1 z+ p; h% V: N- Q
1 ?% a( T( W, `$ |! y9 J k7 f
因此可得在情况二, 时,
- {$ v1 @) T/ g z% x4 Z
) n8 `' c3 m, P; u7 z5 w
( k9 i8 W7 G! N" X9 [3 L
' A- \9 G2 q f& Y( ^/ g; H f/ }
: h" Q" @7 s/ `
1 c# [# N% V/ p; b# |+ t0 \
: e t) J, V; U$ q0 V
- S9 |3 [+ h$ p) ]0 u( i
# I/ j$ N6 h1 T: k# |
而在情况三, 时,
# ^$ _' j9 b- t. z; c
: C7 t+ u4 _' w, E( X# ?2 ^9 ^
/ E; G1 @3 [* q* U
R. ~& {% E& A
# G8 D# _% T p: C( J% v3 F
; }# {2 \; b6 J/ B+ O" _. [( R* Y
: _9 K: j& s1 y& n
+ w2 Q& P) X6 [- [: e; I
: |; R5 q& l% T1 c* w
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
' R) ~, g- }1 h# R/ X' S5 f$ S. ?
5 x0 ^' Z* _. ^/ b- o- C
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
5 ` x2 v* O4 k" U
5 a/ q8 l6 U- w' q A
附录
: E* D8 h- y, X2 y6 Q7 H
+ O- }& H9 P; V5 z# o
! a% }7 r3 h5 F/ Z7 a) n3 b7 }
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
5 }3 b9 k4 v1 {+ V% S* J
1 o% l% N8 q ~- ]& r/ N
, s3 D' W! c+ k
! d2 v% \% y3 X) S& p
/ a `/ ^/ [% f
+ M' S6 D" [6 a: ~4 R: d8 n/ d" O2 N
3 V N- l: s% N2 o
8 Q9 F6 z* \: j% {- u1 U
9 L# i, }4 M5 M K
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://tcelue.co/)
Powered by Discuz! X3.1