1763年12月23日,托马斯·贝叶斯的遗产受赠者R. Price牧师在英国皇家学会宣读了贝叶斯的遗作《An essay towards solving a problem in the doctrine of chances》(《论机会学说中一个问题的求解》),其中给出了贝叶斯定理。贝叶斯定理是一种统计学方法,其基本工具就是贝叶斯公式:
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
/
P
(
B
)
P(A|B)=P(A)P(B|A)/P(B)
P(A∣B)=P(A)P(B∣A)/P(B)其中,
P
(
A
)
P(A)
P(A)为事件
A
A
A的先验概率,
P
(
A
∣
B
)
P(A|B)
P(A∣B)为事件
B
B
B条件下,事件A的后验概率;
P
(
B
)
P(B)
P(B)为事件
B
B
B的先验概率,
P
(
B
∣
A
)
P(B|A)
P(B∣A) 为事件
A
A
A条件下,事件
B
B
B的后验概率。
贝叶斯定理广泛应用于各个领域的推断、决策中。以医疗诊断为例,假设肺癌发病率
P
(
A
)
=
0.001
P(A)=0.001
P(A)=0.001,吸烟人群占比
P
(
B
)
=
0.4
P(B)=0.4
P(B)=0.4,而肺癌病人中有
80
%
80\%
80%吸烟 ,即
P
(
B
∣
A
)
=
0.8
P(B|A)= 0.8
P(B∣A)=0.8,则若某患者吸烟,则该患者肺癌的概率:
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
/
P
(
B
)
=
0.001
∗
0.8
/
0.4
=
0.002
P(A|B)=P(A) P(B|A)/P(B)=0.001*0.8/0.4 =0.002
P(A∣B)=P(A)P(B∣A)/P(B)=0.001∗0.8/0.4=0.002该例中,贝叶斯公式将先验概率
P
(
A
)
P(A)
P(A)转化为了后验概率
P
(
A
∣
B
)
P(A|B)
P(A∣B),这个过程中主要利用了观察数据
P
(
B
∣
A
)
P(B|A)
P(B∣A) 。肺癌发病率只有
P
(
A
)
=
0.001
P(A)=0.001
P(A)=0.001,但是根据观察数据发现,肺癌病人的吸烟者比率
P
(
B
∣
A
)
=
0.8
P(B|A)= 0.8
P(B∣A)=0.8高于整体人群的吸烟者占比
P
(
B
)
=
0.4
P(B)=0.4
P(B)=0.4,因此增强了吸烟者中肺癌发病率的信念。
《贝叶斯的博弈》一书中引用了阿莫斯·特沃斯基和丹尼尔·卡内曼两位心理学研究者提出的“琳达问题”:琳达31岁,独身,为人诚恳且充满智慧。她学习过哲学。她在还是大学生的时候就很关心歧视与社会正义的问题,也曾参加反核游行。下面哪个陈述更有可能正确:A.琳达是银行办事员。B.琳达是银行办事员,并且活跃在女权运动中。在该问题的多次实验中,85%以上的测试者选择了错误答案B。实际上,B是A的特殊情况,即B是A的子集,从概率上来说
P
(
B
)
≤
(
A
)
P(B)≤(A)
P(B)≤(A),因此A是正确答案。特沃斯基和卡内曼认为,针对此类问题,人们更多是进行关联性的推理,而非数学推理,对于31岁、独身、接受过高等教育、参加过反歧视运动的女性的此类特征,选项B更令人信服。