优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
* q" s" y: x. d/ v2 R
$ }: S1 [6 m( ?$ f U8 F& l
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
/ N4 y- g; X" v
. _1 [0 H: r6 @; y6 ]/ S
问题
2 [- x. O% |; x4 E. Q! k$ M! ^
' |! g* q$ f2 ?2 e& Q, i3 E# F/ {
; O a" B# ?8 t6 ]) {
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
- \0 W+ q/ ^* c4 g2 W
# x+ Y# V/ w) D+ v) l; b7 @
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
) j8 @, M9 b8 `
' O2 M. Z! A4 q S+ z
本文
3 f* U7 v$ P& G6 v7 \; W Q
5 s1 X- y/ D3 D
! h8 C' F. V8 {- c) }
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
& M; a- c+ w3 g0 `9 T
+ [; Q" h; I% Y) t% z
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
' C2 O4 @; I/ @: ~' Z7 N6 [7 B
4 i9 U' v2 A6 S/ d
' X* l5 Z2 s% ]/ w- ?8 M
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
! X% a D+ R t
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
% N8 t. E* S5 ]) y! g) v
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
0 U/ E4 v% B: u7 u- r/ `# j) M* _: n
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
( S( z, q3 y8 u. z' u; H+ C* ?
2 @9 @ W% n# \+ p2 z1 _. T- ~
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
* J# P' I* U# t+ L' d
1 ]* |: h& y" @* [4 n9 z
++,
1 {) @5 l1 g5 m/ {+ i$ M
+-++,-+++,
, C" M! S6 \5 b3 H3 u
+-+-++,+-+++,-++-++,-+-+++,
7 R8 Y; H6 P' m1 w3 m' E# X
。
; W! h7 l5 u, ?' L3 q
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
5 o7 _0 C6 h1 D+ ~* c
' k% _$ m, f! W2 x! P* \% V: I
2 h3 O( [0 f7 n5 t* y6 Y; ]
: V% T4 L( i. ]4 I5 `
, ]8 G# v4 L9 v: c6 b7 k
0 g0 a1 Y9 m* d4 o
# |+ Z) R w7 b$ j( D+ o2 t
6 t) p0 \; n) r3 {, g
B/ {+ Y* n& [& J N N
# \! ^1 x E t8 Y9 a' ?
* Q7 d: }5 {# @1 m @. w4 {4 q/ H
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
* J {% b+ T. U' g8 _! T3 v3 ~
& c1 L+ a! S; J! D) G: v
++,+-+,
4 F7 h0 _/ O% E9 ^5 w2 I. R' \
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
" u5 `8 D: P9 N3 A- Q$ K' z q* Q
-+-+++,-+-++-+,
- @4 n _9 G2 Y7 Y+ {% k
% P, W7 Z: v. l: H; U
, ,
, d) k5 v9 Q* a" w4 R' R8 e. b- P
。
/ \, z( @- |% G, z3 d$ H/ T
; F# b' y* ^$ }% ~" j2 `1 F7 E0 @
仿上之计算,可得此时甲赢的机率为
: N3 [" Q" O: t2 w5 F) ^
9 A" {8 i) Z Y& J {" ?
$ ^: ?- l$ E# Q$ P1 S$ m. D
; e; N" W6 d; `. P* S
3 U. f4 V6 ^% G6 v6 q- D
5 q! s) q( h8 E& N4 C s$ O {, G6 q+ f! y
) }% Y2 c9 y5 f( ~3 ~; t, j% }$ ]
" F) z0 U- \- S# |
) f3 W' t* v/ c' x' L9 H
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
! m& G! u8 a) L- R
- C" S: Z% K" Q; I! O
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
J( s' D) _1 U
1 z8 T8 U6 B9 T: c2 b/ w2 _
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
' s" @6 Q) w% ]7 E! {0 U3 a
# b: I# i+ L( H! j2 U# ]6 ~
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
3 a' Y3 |5 v/ A I. ~
2 X* ~0 P& z9 e% c8 Q3 s) e
9 A& b4 z' d4 f& t) M( [
情况一:
# T; Q; w4 z% k( k2 r b
此时不论甲如何下注, 恒等于 c/(m+c)。
) C* t% c& v+ y
' Q6 y: k* Q' |6 j i- h
情况二:
4 I: U, K% T! h& u: |) ^
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
! M! t3 @: b! k1 ~8 U5 }: e* l
' @* c' h3 ^( Y
情况三:
5 }- t8 O. m' {) x
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
1 l) c7 e8 B) y: w% j
. D' ^% k. F* s4 N& J) d
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
* q3 U; C6 C- r: d/ z- `
& M+ J% X+ Z; [1 V: u
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
9 P- D' L! U: i0 K( l, o
) G1 s$ [$ {2 h: d
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
% E+ |( J! P& l
- {2 r) f# o: m# M' q
0 O1 a3 N/ w& {9 J9 J9 W+ a/ }
情况一:
2 P0 Y. C* ~. Q( |
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
# l# i6 ]5 |; m( b' d
( Z: k1 u* d: J- E7 Z9 a
9 i/ L* ^" {( ^4 r
, F& I- H" Q0 x" k, n9 |
. }5 _4 E7 }1 i0 U
8 t; N, @! z- n: S3 b @
/ n: w2 C6 D) D; Q
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
y/ M+ `- ^& {5 X \
9 i' K% F' k) X1 I/ U
情况二:
+ z% j. m) p# o- m& U
令 q=1-p。此时对 ν 我们有方程式
! E- N; O% h; f6 Y I2 X2 d
# ], ?: w% X! X1 ~- l
& v; r0 U' [- l3 U4 _; H3 j
% D7 T5 t" b$ J$ {
4 M# v1 G$ l, g8 e
# d; ^4 b* E, ?& r, A: k9 ]% |
7 W" S7 o% K5 r) e
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
! o) r2 |3 l' f; c. z6 b
利用p+q=1,上组方程式可改写为
& |" G* `( |/ G/ s
Y. S+ v# Q& F
; D& n: s) P8 B- f8 A3 g2 S
A& @6 F0 n# A! q! V) `
j* v+ y' O5 C& d& z3 V* ^
5 }& k/ C! a) J9 \3 O3 l l) @, q
; `4 b4 M% y. M) Q8 W1 z
两边相加,并利用 、,得
7 S5 H- r' y2 U; I7 _" w% v
0 ?" U* p. M+ K* G% s
$ G" m( _2 \* a+ Z: v) U
) b2 G! J* x9 C! o0 t4 P1 l9 ]
0 L, c" _! h: U% [
( x9 T, ]1 R" p/ o
/ W/ a) b, R5 @/ I1 @
若取前 c 项相加,则得
0 t! ^& p/ ^1 Q; R
3 b5 Z8 I0 J2 t$ B
6 I1 x; q" r( z, ]
4 ^' _" H/ [9 }; q
; N( W* [9 I/ I* R) Q4 k8 x! w* Y
. K7 o m: e8 y6 T% |$ J8 X8 x
; L5 a N G3 |# p8 } k* D' ?5 V
情况三:
+ g. l: S3 c0 k+ {' Z9 f& f
仿二之解法,可求得
C$ \$ @0 P$ r
7 o$ e t3 H( N9 m$ G# w7 f
. F$ |! T( S, d2 s. ~2 |
5 ]3 G4 F+ J% \& j+ R$ |* _
* {% a: D7 W9 m. _ B+ |, E& T
; R |: U+ B! e! h8 |
) z8 W8 C( E. L7 j; o f" k7 i
+ C- t* h8 w) `% {) Y) _% j" n
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
# ~- H$ r) [! `
5 ]. J- J* n7 Y, }% A1 d
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
, q1 z6 c9 i3 A5 K: h
" w% z+ ?- s, T# f, D) Y1 @
; v2 T) k- y8 W* z; ^. Y8 Z
定理:
) r4 S& w" n x4 ]) ~
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
! v1 g( g9 I! O! L% I, ?
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
7 Y8 M% @/ n: e# U+ `9 _5 J
, l$ a! p1 A% Q) l5 b
现在我们就拿这定理来证明先前我们所下之结论。
' R! w' g- c% W' v4 N/ r
% r+ u& Q( ^7 a; D
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
" ]* o# ]9 L5 C7 y1 m0 ]
) \1 e% h+ r# d& `; L6 [+ w
至于在情况二或三时,我们取 。此时若给定 Sn,则
3 N; ?2 O4 A R& O" D# Q- X" q: T
2 O) O8 T ?4 z5 f, b
+ w) J+ S: F( W
& V( p, }' q8 ]+ R6 I) A
5 o8 n8 P, y6 Y" T
& L0 N3 B8 `! X, s+ C8 d3 H% j) _
2 g5 h: @: F% y& _3 P2 a( A
: J# R, O `/ E/ \7 B1 b1 m8 W6 S
^5 l1 I0 w4 @& M) L `# J7 M4 E
其中 为所下注之金额。利用
. }0 v* A6 h4 U! O6 t: M$ w
, o6 S2 |: T' {, g0 J8 M
/ k8 u. `; o% Y& e
$ l4 Y, f! w0 A8 U4 }& e+ F- j8 L0 N
" J( n0 W& D& A) s: F, Z
* V+ c( ^; F# ~# m( u7 J/ N/ J
5 l4 E% n+ c. `3 [: X0 U3 x
" t! U* H, d; o8 ^9 v$ U
; V' b3 d: c/ K+ W/ _3 e8 ^1 _
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
1 P5 T1 V* G+ c0 Q* {
$ j5 M& h' K7 F$ y1 M
* ?. t6 f4 U2 A) S, G
7 S" W! d, ?! r8 o; l7 L, l
5 G8 }0 U# T% e' C
% b% h5 n. l/ f9 L' J! z
2 o/ r, h6 i' B4 i9 ^7 P+ K* O7 `+ x
$ b5 d4 c+ P4 i/ }
5 H, ~$ E* A/ \; R; r" f
因此可得在情况二, 时,
9 R) X, d: k9 L
& V6 F% D* j. \2 [: m
6 a9 w/ ~2 G9 z, C
4 W5 z( A% L9 p7 Z& M
3 P) R1 R& ]+ y
* F' a6 f7 S1 P% P) d
& F1 p* {+ u) ~# S2 l: c$ ?
' H2 L6 H. \+ o+ X( b& `- J$ F4 c% U9 q
# v! m1 A) A2 ]. P" C
而在情况三, 时,
9 \* N: u. f) c @
( E7 |% U$ y5 I
9 z* ]; C' w& ]- }6 l( w
0 P) W6 p" f8 f$ E6 f9 f
. I) U2 w j3 Q5 K! ~" t( _8 d) B
& I+ d" G( @' O- p* N3 J3 M
$ S$ v, N- C$ H
7 O& P: u( W. B4 Y) a h
* t2 z# i; P" ?2 Z3 h0 h, L
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
3 `6 e" S7 c- E
# F' K$ \1 v7 h* K1 v, r# h
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
: a8 `$ ]2 t$ |6 @
3 ?: V" V+ L. U; Z+ U9 W
附录
2 ~" t. a* r: F% n3 P: O( q( o
; E0 O5 o, l! i
0 D4 m% S! t, u) u# l
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
: D( k' w+ d% y: A- \. f; h8 j
/ K: f1 i& n& j7 }; R
- D* J2 b% s" K H
2 g) [! d8 w, J# r% j" `) u
% ~; \* ^, D6 k" @3 L5 o G
6 w, A; D: R) J# N( t1 N- W( @" y
% X* D) @( i# N+ |+ I6 m4 J/ m
- W1 l0 n+ ~5 I4 O/ s1 p1 m7 D
/ h8 X* ^# V9 w* f( |3 D+ h4 W( D
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (http://www.tcelue.cc/)
Powered by Discuz! X3.1