主要讲了基本事件的辨析,概率空间的三要素。
一、样本空间
如果一个试验(可以看做一种对物质特性的观察)在一定的条件下可以重复进行,而且每次试验的结果事前不可预言,那么,就称它为随机试验,简称为试验,其具有以下特征
- 在相同的条件下可以重复进行
- 每次试验的结果不止一个,但能实现明确所有可能的试验结果范围
- 每次试验之前不能准确预言哪个试验结果会出现
基本事件是元素,事件是集合。
随机试验的结果称为事件,用的是大写字母表示,可以看到,与用大写字母表示集合不谋而合,同样,基本事件用小写字母表示,那么也与用小写字母表示元素相同。
数学上说的空间应该说是由一个集合和定义在这个集合上的一些运算性质组成的。
试验E的全部基本事件组成的集合,称为试验E的样本空间,记为S(sample)或者 $\Omega$ 。定义于其上的运算,大部分都来自集合论的运算,比如说和事件,就是两个事件对应的集合取并集;互斥事件就是两个事件对应的集合中没有相同的元素。
二、概率空间的三要素
概率的三要素是样本空间 $\Omega $ ,它是基本事件组成的集合,比如说它是 ${a,b}$ 。事件域 $F$,它规定了我们可以研究的事件的范围,它的本质是一个集组,沿袭对样本空间的定义,它可以是 ${\emptyset,{a,b},{a},{b}}$ 。 概率测度函数 $P$ ,它负责将事件域里的事件元素映射在一定规则下映射成一个0到1内的实数。也就是 $P: F\rightarrow R$ 。
可以看出,只有事件域这个概念给人感觉十分冗余,因为在我们的直觉里,只要从样本空间中取出基本事件组成集合,那么就可以计算出概率,所以事件域 $F$简直就是脱裤子放屁。
为了弄清楚这一点,我们首先考虑几何概型的产生的原因和代价,我们知道,古典概型的缺陷在于其样本空间是离散的(换句话说,其样本空间是有可数集或者是有限集),所以对于很多客观存在,其描述能力有限,比如连续的时间。所以我们引入了几何概型,这样我们就失去了单独的基本事件的概率,但是对于一个事件,我们用这个事件的长度(也就是点集的长度)与全集的长度求比,就可以求出概率。借此,我们对客观世界的描述又全面了很多。但是其实我们还付出了一个代价,就是几何对应的实数,是有不可测的可能性的,也就是说,不是所有的点集都是由可以测量的长度的,这个有点反直觉,但是这是事实,具体的悖论可以参考Vitali集合的构造。总之就是因为有些点集没法测量其长度的。
不可测集的存在,意味着对于一般的样本空间,并非其任意子集都可以赋予一个相应的概率而不导致悖论。为了避免悖论,只能将不可测集排除在外。这是我们构造F的初衷。可以看到F的构造与P的构造几乎一一对应,更从侧面解释了这个观点。
构造P的条件,反映了针对概率空间的公理
- 非负性:对任何随机事件,其概率在01之间
- 完全性:样本空间对应的事件概率为1
- 可列可加性:对于事件域中任何互不相容的时间,都有