优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
( F) t3 K# U: d- E7 }; n% @4 \
8 ^8 U. F1 |9 `- A- P
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
. K/ R' x0 j# I: K
4 H3 ]) @# ]3 K, L" G
问题
' P/ A2 U H% L8 y
8 A. }% _& P, g1 P$ Q/ \
' X8 r' ^4 z! K' A9 ]* T z
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
! I7 ~0 p' R9 w' x5 o) n
& H' V1 ?; |5 m7 }( K
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
# ^8 j; K% | ?- J# @
' ^5 A3 W" k$ _6 k
本文
, W) r: t, p; o! ^7 z
1 L) A6 f4 f, M* w# Z& ^
& H' M4 `! t& r" d3 x
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
6 B9 C0 G# p8 T
T+ s! [( n& l6 T% j. `
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
. J! q( @8 r/ a1 B
5 l% }* w+ t# @# B/ P
3 l/ R9 q4 r" W& v% D. `9 t: j% }
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
/ Y9 g* @" o+ D% c! C- X
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
6 L/ P3 o# w0 p5 @
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
X* B" y3 I* r5 N, T
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
% S( m' y& Q" I4 H! r: b! I
- r4 K; A/ N' N
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
4 Z" O6 O$ k8 m) i: m
' o& u' ~ ], X& v
++,
, X* h9 y9 k4 O
+-++,-+++,
- F4 I. A& M/ w4 O
+-+-++,+-+++,-++-++,-+-+++,
/ e ^$ \: {" I3 [) {- L: Q! `6 {
。
' C" E. m! Y2 S9 `% h# _* H+ w
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
" N* d" e2 ^8 Z3 D1 M$ i4 t- b7 x; i- y
6 `* r6 S( N: y3 y$ U8 H
b& b t2 z* m4 _+ c6 ]: L
/ v9 S* T9 ?6 _4 N! Z! K, |
. w" R, g& [' I' R1 }: j0 {
* V/ u1 N7 j& {
3 G' G8 {9 [1 v7 z. Y# R5 E+ m' v2 f
1 _" ^# G" z1 `# H
8 g @5 a$ Q( z1 G
7 i( H5 x, F! m$ B4 k; h
+ l; u6 j! s4 E) v
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
1 l0 P+ i' J: ~5 O
6 ?# n% Y& G9 [* B
++,+-+,
+ A5 k. s4 ^2 U0 F1 l4 Z8 J
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
5 j% R* O8 v6 K8 f8 S) R; [& {5 V
-+-+++,-+-++-+,
* i2 l% m/ _2 G5 y. F; Q! q
0 T9 o% N4 |: [/ [
, ,
2 ~+ h% E9 f8 M7 I0 t
。
2 Z& |8 h6 H' b. h j, L
4 M8 T' J B# ^+ W2 o6 N; A: ]
仿上之计算,可得此时甲赢的机率为
* l! _4 i7 {9 `) M8 Q3 a6 a
3 \; F7 @$ H; L/ d7 l- _ U
: Q) @+ q! d, q( k8 p: q8 k! [& n
* V4 r8 ^$ X( o9 w) A* q
# \% j8 K# L# e$ X& z8 p' k: O+ ^
$ \$ F8 i5 f/ \8 M+ p* z/ y, Z, F d
! ~' p* w8 m6 \ ?7 d$ }& B
0 y! [. ~4 x9 O0 [# T9 P3 Z7 r S
8 H3 J/ t! H( C% H! _
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
5 u* j% q5 [( O
* ?* L- a6 W) r
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
- A9 p) Y: l+ ?! \* `7 T
G7 u- ~; S0 Y4 j5 g, |- }3 I3 {
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
2 d2 O$ C3 _) f9 ?7 ?+ e
0 g9 R% L0 I5 {
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
" h( h6 f) r" @7 y" j
! ]/ {) y; {4 t: t1 |" X
" P" ?. V" b( r
情况一:
. e6 w$ ~" A. o( v$ q+ e
此时不论甲如何下注, 恒等于 c/(m+c)。
8 T" @: W1 o# L
0 e: G+ q ]$ u6 T: {5 O+ R
情况二:
( t |3 n9 {( ^1 B* L
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
% F2 B/ X2 t/ Y5 Y% q }' ]
7 |% p) b4 s- T3 I; p0 o( W
情况三:
& J- v# S, B. u& P4 D3 U
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
* |0 {2 [8 m9 C0 k% n
5 V0 ?. i9 w1 R5 C* q1 A2 K+ S+ i
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
6 N1 R# W+ q7 @ j
- {# K$ S3 r% O
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
" e& c% S! r- l- E% Y% ^ `# a" N
. u& N; |: R4 E- e9 F5 [% G
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
: D, o5 }" F }
& v1 o b9 X5 D
+ u& T$ l5 J: ^! m% c6 F
情况一:
$ A2 I/ k$ W+ \1 g( \! R
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
- R, N& w i6 @6 O
) a8 o1 a" Z1 C5 T* M; Z. x
" x4 u6 q2 E. O4 u( i% s3 {
# Y$ j8 r, D3 q$ c- w
+ x3 ~2 w2 U' R [! Q" Q0 U
! V% U/ Y8 v. y+ o. [
9 u2 L5 T8 n, y* l- T7 [
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
( X5 f& h' c) F4 j
& l( k/ }; Y7 X- H- W
情况二:
$ X$ L6 }( ?% @1 a
令 q=1-p。此时对 ν 我们有方程式
* ]" F( ^0 i0 P4 R, H7 e0 `5 ?/ `! S
. l2 _# s9 z Y5 a, L. {+ Y
n. i( D6 s( p4 R0 h4 p2 x
! ~$ G7 X8 Y! P7 |; H
. _" l/ z4 M& g/ Y
3 W; \- V" r! o( r: ^8 \, Y) i
: ^2 P! v, P# R0 h; Q2 U) z0 _
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
% K) r' O+ I1 d& C/ S
利用p+q=1,上组方程式可改写为
2 ?1 T) J$ A/ M7 I* d* ~1 D& Y
( `6 ?" K; @5 ?" W! u, A6 Y) f
: a2 u% b _3 S; ^7 c" g( ?
# ^ F. w4 V" w. h9 v; }, q! t. d
; W$ t; t& d4 w* [) Q: l& B
& g' P4 z0 E( v
) m7 x9 J/ {( m. q; }$ k; I
两边相加,并利用 、,得
: }8 C2 {6 ^. Y" c; z
% h# d3 y& k3 n ~1 L9 T, h4 a
; F# {0 T+ _8 w W1 R W; {
( D/ {; j( K' F. A4 [- X" z
! X% u$ A4 S6 a& R }; V
- l; V7 J: y: k. i
- F) R+ k: N9 y" i; Q" C- E/ n
若取前 c 项相加,则得
3 ~: P* L Z' }& Z3 r6 g8 g
3 _9 O5 y4 c3 R5 s% u
: l7 K. R2 ?& b' j6 k
$ m9 e0 _; J2 R
: s- v% p% y9 \) b
! W+ `# h, \; d* S' @& Z- f# g( r
3 _+ J. P; q3 m, j
情况三:
) A) ]+ u8 ~- z
仿二之解法,可求得
1 U# A8 k/ E1 _" Y7 T
- j" F# g0 u0 l& t+ f: [
% q# A9 N8 H- U% U
0 P0 m( |6 T! X) p; `
6 c. W; t7 X+ [9 O8 L. [; j# \
, T" q2 E) E: L* ]
! j1 R- }* M `" h7 j% F9 C
& I' E! f- ~1 k- h9 | P2 `2 q3 w
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
0 Q9 O2 b. ]* k- \6 y% H
# G' Z6 C' Q) I. t7 |
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
5 H$ m5 T# `" L
2 v; F1 A2 c5 u9 E" W. ^1 {
7 p8 ?. p4 U+ N5 h( l6 a
定理:
6 d$ |5 K' y2 o
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
. I q, I0 z; g
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
0 A/ Y* T4 V) L
8 R1 B, F$ c- B5 h# I
现在我们就拿这定理来证明先前我们所下之结论。
% i# C y/ u& A. S
5 h7 u% R4 A3 h
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
# {+ K% Z; x& z) G; O
' m5 ]" s0 G! h* K( k
至于在情况二或三时,我们取 。此时若给定 Sn,则
/ Q8 o# ^1 v; C% W& ~( s
: _9 U& I7 ` E0 T; @0 l
0 s# N4 r+ f3 o. Q# n4 `
1 Z) u9 M* G( p& T1 W- r
; @* k% e1 @+ f; q0 ?+ n4 w* r
b7 I7 M: P6 | t* Y' z
W9 W4 l4 C2 U! w
+ |2 ?9 o' `$ i. r' v, V5 x% a$ d
# t3 v& G2 T9 v$ V$ i
其中 为所下注之金额。利用
- q: v$ f# L9 H7 r. I
9 n& U# U9 s7 @. W/ J6 l3 }3 i
4 T" S$ Q$ D7 J& @% s1 A" U
3 I* w+ [; w% ^/ \ l- }
; J# l g" {$ B1 B% _3 i- }
+ K# {. M8 j/ ]) k
8 Y; n# ?, X) V6 v6 X9 p c; K9 R# Z% z/ T
' J* A% X/ {) S" U" u
( ?8 F. ?4 s# U% y( j/ X2 \- f/ L
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
) x. p& y J7 R: [6 @; m: q8 I4 k
& Q9 X6 ?0 N# F2 @! L2 @! M
3 S: p6 O) O/ F! Y; y
8 {6 Z# c8 L I3 p5 F$ J; a
) \5 P$ j0 X( z: b' o
. g) n, E( E3 @1 B6 h
; n: E* O, h+ |0 m1 Y; D
) B2 ~' N {0 H6 [; q! E# @
: c% G5 ^( I6 H. l
因此可得在情况二, 时,
5 N# h5 t" m8 U9 J( d
% I2 U) J7 ]2 d5 @/ C
: _% m" ?, W. W( {5 d% S0 c4 G
# }4 H4 P* R" M% m+ p
6 r& G W8 E* b9 r( F
$ L6 r3 O1 G* x* V/ j
6 C2 ]& N% H# H6 w
4 d" O4 O$ Q+ R6 X0 a. T
# H/ ~* b/ R/ |8 J8 s
而在情况三, 时,
0 @& J" h' v# s, L, C8 S0 X, q8 {
( J0 {9 q2 V8 _+ R7 M& S+ r2 ^3 X
2 H5 l9 O" z/ C8 q$ h) e
. i; I* p( s1 t# {' |0 n' S0 Y7 `8 ^! y
: @# r7 x. y! v) I) k6 {% \
: H+ J' |8 T# B9 Q5 \' O9 M$ s+ e
$ m/ G# j$ [' g" f
: h* W0 M! Y- l5 T2 }6 M
; I1 g' | w5 p
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
2 {. O1 G9 h; {5 I5 I `4 Z6 ~
/ X% V) Q% t* H: m- N' u& U' v
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
, ]' w8 P. _7 Y8 {% F8 O
0 [# @% \9 N' i- P) J' p1 b: z- z
附录
5 C J7 B9 o. E# J/ U' ?
5 ?$ l( W1 t+ }# r' \( i
4 m* J- ?" p Q8 w/ Q- v
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
6 e) r2 k" X0 L; Q
9 B: d# V* G7 B/ A6 W( N
+ o# Y Q# J3 O$ b
7 \1 U1 y9 I/ J; e
$ P, f& Q; |1 N$ ~+ l* |4 X
: g# w/ A) v) V: _" k; T: p
" u t3 f# {+ O6 q0 g' c7 M. w
: V4 K: _' P/ n0 c
, ` V+ s3 a. I+ z, a3 k0 y
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://www.tcelue.cc/)
Powered by Discuz! X3.1