优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
- |. y: y$ h' ]9 t
( n, e: x0 F8 W; c
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
, e, M# U6 v5 i. L
% A3 P y+ h$ v$ z/ {8 O
问题
: `6 I5 m. ?$ K* D* \$ b$ z
7 F" v6 ?1 k1 X8 p' k2 \6 g: _
! M3 P9 v2 p9 B3 n$ X
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
4 q, F6 @& @$ b; u
( R2 A4 a8 | p5 W6 }2 \9 Q q. J4 O
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
5 R! G$ F( p5 H/ x; U( E- R& L
! u0 _! e1 }+ L; ]/ j
本文
[3 L# c. I5 j% y$ t. |, v
! {+ I9 S" s) ]/ }/ [- F5 h/ n& A
2 E% Y2 e; D$ w1 g2 ?
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
! \7 B/ W: Q2 w, P1 m: }
0 y" ~8 b9 i6 e% ~0 L! A
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
" x* h3 @5 m# x: u+ M
& |2 j% ]+ p2 \: m, j" x" ?
2 @; B+ m: ~) e+ D. E3 d4 h
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
3 b( C& J+ g0 U, G% Y% a, B
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
+ c; A7 |. F/ `4 o! P ]9 m
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
5 e- @8 q1 a& n5 B2 J
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
$ P D- \7 [$ m0 F% l8 }7 U
) a9 M" k" _$ |
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
9 R- Y2 F3 G5 R+ Y2 O1 T* i$ C
. U/ x+ w. L6 m ^' O+ `/ X" P
++,
4 Q" x: i/ ]( j. P, _
+-++,-+++,
, f. Z& N9 R8 m5 ?- q# @% u
+-+-++,+-+++,-++-++,-+-+++,
9 t w: X$ l" E) ~' \
。
/ N7 k7 f0 v/ b0 v4 x o" y
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
& ^- @. t K# F. o1 f$ ^- @
2 P9 J( ~: B; J3 u
, f9 k. p' B7 D7 P4 }, `: j* f0 g+ p. V
3 g" [' ^, w j' H% D/ a# y- k
3 A2 N7 c/ K; t% ]6 d: x* \" c
9 u5 `, `7 P8 I( ~$ D+ W7 q
1 d3 V* K/ a) I" o5 S: B
0 m# T8 C2 |9 X0 J0 \, A
& r/ c0 Y' n7 q& ~7 l6 X. R
$ ~% c3 j( M1 d6 g' j+ m
! c7 Q' F; ?" ^" ?
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
0 V/ s% W8 A% r I
4 z2 B- X2 B5 R0 k+ |
++,+-+,
9 ]; f. M2 {8 q+ b7 ]) e
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
' C, ~! O9 b' ^5 h% ~" _! J
-+-+++,-+-++-+,
6 f2 u* T ]; ~$ n& C
$ n% T! @: M k3 @8 s, E. _# I1 ]
, ,
( e- x! f( Z2 j& R. U
。
2 ]: J$ @) g; s) g: v! J; r
% z [( H7 A3 u5 R: v
仿上之计算,可得此时甲赢的机率为
) @0 j W+ s; ^2 Z1 R* _! E/ I- l; R
9 c% f4 [* e7 }4 c
( |2 \, u @, R8 Q# A0 v0 T
2 a. r8 P2 j- g
2 P2 H- Z& @2 {6 `- r
& ?/ @ _* \7 f' W6 T
5 r" Y, H) t$ k5 Y( m: M+ s1 }
, e% M. K; E$ m! ^" Q5 O
( F0 L0 j8 O# L) o# u( m
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
" ?4 ]1 |! F+ F2 W8 T
2 f4 l% b9 o$ N2 R% H
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
[' y6 }4 X v) T2 t/ _4 u) x" ?
+ \. ?. W+ t6 _
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
9 }6 _1 r$ c/ C, b
2 |' t" c4 W: b
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
/ R9 {2 y4 f1 \+ ?2 ^$ w( {; h
1 _ E- Z% e7 i" T* a0 X
: w8 p. u& W# U3 `0 J
情况一:
4 _$ S/ y5 c, @3 J) o5 X2 g. t
此时不论甲如何下注, 恒等于 c/(m+c)。
9 q t" V/ O4 D! k
8 B/ }: E0 A# q1 A8 R4 ?
情况二:
2 o X+ H! J7 e
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
0 X/ N! x- F! a& H* |
$ r. k V+ J x( n4 [0 H) V$ ^. t
情况三:
- a: T% N5 S- f4 R$ Q, W" ]
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
. g3 `0 [; x. u) o0 C3 M5 U p
2 h7 R9 h/ H d; B3 }
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
; |3 f/ `* g. F2 }6 D8 t1 u
4 P; Y' V$ F4 _- `$ z& n6 E! B
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
' A V8 C& ~- \1 E
3 N$ X( t3 K3 [* n4 ?
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
6 @: f# f% @3 j- F2 E% b
& K6 n5 d9 q; x5 D
2 ?1 Q# F/ q/ ]+ b7 T
情况一:
6 r$ a: E6 Z# X9 G; Y _4 S# O
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
7 l G: l- B9 q7 T* [9 [! Q
8 N ^" k- j8 C0 X* f8 d
8 O! ]( P8 q8 k! F$ Q
" L( R8 q, f- w9 X2 L4 K
+ } `1 e$ x0 ^8 J: V; |
* F! Q& z; G, \$ a' b' @+ L. I# ~4 B
9 ~) q. [( I8 [8 r ^$ G4 k
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
7 S7 N2 O+ K* A, M5 q
& p7 H" W1 [8 `; m
情况二:
) @6 l" X$ P; P. Z3 A3 H
令 q=1-p。此时对 ν 我们有方程式
% f0 ]4 I0 T* ~3 r
; C4 D E& Y% W7 o9 K- L
$ p. P! W+ E% e; m' w: M
* M2 g Z$ }9 @; G8 i; G, `+ X
+ C3 T/ v: r j
7 x; k U2 \4 c2 ~& J3 V
- O4 Y. h5 }, U% T$ @# U9 S
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
- @' u A+ J Y
利用p+q=1,上组方程式可改写为
- H: _- C: E* t+ A: W6 \: b5 l
# i2 _7 |+ Z9 \, h% h4 }; j7 P
$ S8 z7 b& n9 \; o8 p* j
: J/ v: C: _$ }6 I( D: E7 e
8 @, b6 l! { M. a
8 c+ q+ _ M+ u: o3 m, T) \) w3 ^
$ t0 \: q; @. ]6 O
两边相加,并利用 、,得
6 x' R+ }/ k5 R0 L5 ?
! a- Z V8 t9 O0 l* Q# t8 d
! ?9 g! K, x3 Y
( r2 Z: S9 T; z' } r
6 P% y8 j% o7 g
5 y1 |. \( h( l& F& S
; i: H% V% n1 l: W i
若取前 c 项相加,则得
/ e, m2 s) e! c1 F, n
+ _) d, r, B% p! B7 N$ G& [
, C( Z' |; I4 |2 W" q( p
# k3 `' e* `" ^) X- B+ t; E6 j3 W
) }0 [9 o4 S9 P/ h
" I6 N8 h! O# G% ^. u P
, o1 `8 b8 N* D% b# M
情况三:
$ C& y: Y" f5 W5 t
仿二之解法,可求得
' W; z3 h c9 u; |4 u0 e7 n1 x7 \$ \
- \* `. @% e' o
0 y a& n8 ?0 E7 s; a& }
3 g: s" j: j# R' @3 |. q% }
* ?2 S# G* i" f; Q
& y S9 H2 l) M; x! Y; o8 G! l
7 f: O+ E4 r6 {8 x$ D8 H
4 t9 @% P0 Q8 T% u
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
, r p/ ^7 f! G
. o) _( d4 f% |1 `+ Y% g# j, E
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
! _- }4 U! D+ t1 f3 g# M
2 X! j7 U& ~* R5 R- j) P
0 {* v- V; s8 ]: _
定理:
9 f1 S6 I# {( n v
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
+ i* _# Y' M3 V- B/ m6 k: }
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
+ C. C* P/ a. U3 W9 G
8 \1 S9 z) B7 t9 N4 j6 M7 W
现在我们就拿这定理来证明先前我们所下之结论。
% q6 V0 v m1 W5 q7 C. L
7 N& v3 T, j" r: F+ r/ u2 w, o8 K
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
) S c1 i. E5 A/ }0 n6 u; d( @
7 e# i4 e' c; _' V0 ]% d# a3 s. h( i( ^
至于在情况二或三时,我们取 。此时若给定 Sn,则
. F2 w% H) {2 i# ~9 ]1 d4 _
4 y9 {6 {) H; D+ p
" Q4 y9 Q# U9 n, ?; d, a6 ?$ ]
/ V/ C; l' ]% v5 R
2 i% M" N% x. ^& k# r
' d* Q% z1 D8 P- [& m
7 H" g, |: Y* r$ N1 s& s
q6 i5 ]* y+ w8 |) _' L
% ~! q; a# h4 y1 i
其中 为所下注之金额。利用
# x( c3 I7 z9 ?! j- m
$ P$ f" B: ~- e* t/ [
; p1 _0 K( U; I' w1 w6 I4 W7 J' y
" p1 O$ K% \" D' Z, j/ }2 |! j6 U; y) F
- u. }5 c9 G9 M( S/ z7 u# I
1 o% g7 j9 H y# v Q3 g0 E' N
! Q7 i2 ], J- T3 ?
" g( @4 A. l4 q, s
4 m; M+ B* B+ M) ^, W- e& f
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
/ F, a* r0 {3 o/ l. e \- x" ]6 H" \% z
- i/ k/ O" F$ l& Z7 u" W
1 k* C: ]: L9 C! N1 ^( ]5 o
! y" [* R1 B$ u/ o+ W1 Z
8 y" j5 L, ~- ?* v2 n
x+ B* H& F" [ t
% C6 R$ A$ G4 J. k Y; ?0 W8 i" M
) t! q/ b4 k6 P) f& }, @
! ~5 h2 T- b" {% \- z
因此可得在情况二, 时,
" p0 c# v) c! k# ^( N; S
3 ]/ |+ e) d% H( d7 ]
* i4 \4 H2 Q) a
% R# z7 ^. X4 B! h1 S
9 Y' w/ }4 _ X# t) t1 r
9 e0 V6 G. v" ]4 v3 b( ^8 l& Y. N
u3 R$ l3 s! d; q$ Q5 d% F
) m# P1 j! S. Y, h
7 w0 A; q7 `+ { Q$ `. m: `
而在情况三, 时,
, i; b6 _& l' `/ n* ?
% Z) m5 {) V5 f' @
) m/ O) n. J% s/ A) m: u
$ c7 s' V/ \' p
4 `* V/ _/ ?% B6 o* f
- N. G" T5 J# M9 y$ F! N
' v6 l/ q1 D Z c! U6 A
, s3 C0 f3 J9 a! u& s7 z
6 m0 E' R8 ]8 o/ n( d
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
. a6 ~. b- k" C/ P5 J& j @
- h: b0 ?2 M. B* X( ?1 p4 c
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
1 E0 Y7 Y. _9 }
5 \) s0 @" R# l3 f T9 F# e* w
附录
3 f8 f& O3 v1 J! A$ D$ u
1 }4 v6 E4 k( M* X3 f. g+ Z
/ }7 J+ [) A, z7 Z/ s* f0 B8 N% z
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
. H; B1 X4 Q. m" T+ H! i: e9 n
- W3 v" [% y8 r8 V
+ s E- f3 {5 a5 ~7 y6 y4 Y
8 K0 o0 S0 d1 @1 m% r' \
- D' l8 ^, ^$ \. ?4 ^5 k
2 c9 N5 ~2 i/ m# j. ?6 z
; B8 b5 I+ A) i* a! J* a- r
. W* u7 e7 h7 w; q; G% G+ _2 R- g
4 I7 S( U2 N2 Y
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (http://tcelue.co/)
Powered by Discuz! X3.1