在前面几章,我说关于随机变量,一个重要的是判断是分布类型,另一个是参数,现在可以将参数改为数字特征了。
之前我还像把分布作为一个更高层次抽象出来理解,但是现在看来随机变量可以完全支配其他概念,应该是我的理解不到位了,随机变量是一个更为宏大普世的概念。
在许多实际问题中,一般并不需要分布函数,只需要知道随机变量的某些特征就够了。如果这个角度来看,随机变量应该不是一个仅仅服务于概率论的概念,他应该是在统计学中也有应用。
之前我一直想的都是随机变量是建立在概率空间 $(\Omega, F, P)$ 上的一个分支或者应用,但是如果换一种角度思考,将随机变量看成一个完整的体系,然后在利用随机变量的映射本质沟通这两个体系,或许是一种好的理解方法。之前的理解过度关注随机变量的映射功能,而对其函数特性的讨论较为疏忽。
也就是说,将离散变量看成抽象的数据组,然后分析它的分布类型和数字特征,最后将某个试验的事件与它进行映射对应。
相关性(线性相关性)的本质是 $P(Y = aX + b) = 1$