<<返回学习交流 《概率论与数理统计》这门课啊,我说很好学,大家一定不会同意。我发现,许多甚至是专业的同学,都说概率不好学,统计更是摸不到边。以我看,是你没有掌握窍门。 我向来不喜欢讲“窍门”的,今天也要讲一点了。这门课,实际上一半是高等数学,一半是概率模型。这句话的意思是,高等数学学扎实了,概率统计就学好了一半。而概率模型呢?简单地说,就是将该概率的问题抽象出来,用高等数学建立概率的数学模型。 之所以学不好概率统计,大抵有两个原因:一是高等数学本身就学的不扎实,二是对数学模型的建立缺乏感受,理解困难:因为概率研究的对象是 “不确定”的事件的统计规律, 与我们以前所学的数学研究的确定的事件不同,方法也有异。 大家学高等数学啊,有一个明显的弊病:就是不求甚解。举一个例子, 比如用元素法(微元法)建立积分,这是积分的应用,也是它最有意思,最关键的部分。可是考试不要求啊,难度大啊,同学们就不重视了,分数至上嘛,这不知害死多少人。大家想想,元素法不正是积分的关键吗?定积分不定积分的那些方法,实际运用中大都是很机械的,用多了,谁都能掌握,我不是说它们不重要,但是,假如在应用中,你连积分式都列不出,还奢谈什么呢? 扯远了,回到概率。概率呢?实际上正是高数的一个典型应用!好家伙,到这个时候,大家又依赖套公式,将数学中最有意思的分析抛到脑后,这样学,一辈子也休想学好数学,只能越学越费劲。就好比搭积木,前面搭不平,勉强还可以搭几层,到后面就彻底垮了! 概率是怎么样和高数联系起来的呢?它先是根据实际情形建立一个公理化的概率的概念,大家要注意:针对实际应用的概念与纯理论的概念有所不同,它必须考虑到它和实际情形的吻合。从这个公理化概念,我们用集合中和元素给出样本空间,样本点等概念,然后用数学中的变量给出随机变量的概念,也就是将事件对应随机变量的一个取值范围,“随机变量”与以前数学的“变量”关键的不同在于,随机变量的取值是随机的,它每一个范围对应一个概率值。好,我们继而用函数给出随机变量的分布情况,就是给出随机变量对应的概率的整体的描述,我们只要得到了它,就可以求出随机变量在任意区间的概率值。大家说这是不是一个数学模型啊?针对离散型与连续型随机变量,我们给出不同的函数形式,离散型的函数我们称分布律或概率函数,针对连续型我们给出初等函数,总之都是函数的形式。 有了函数,求概率的事情就可以借助高数中函数的许多工具了。看,概率的分布函数F(x),是变量取值小于x的概率值,这样,是不是给出了概率和函数的对应?对函数概念理解深刻的人,可以欣赏到它的妙处:只要告诉我取值的区间,我就可以精确算出此区间的概率值。我们还可以将高数中的微积分引入概率:连续型的随机变量的概率密度反映了随机变量分布在个区间的密集程度,它和分布函数是这样的关系:分布函数的导数是概率密度,概率密度的定积分是分布函数!我们说导数是函数的变化率,用在这里就是分布函数的变化的快慢反映了随机变量在此处的分布的密集程度;我们说定积分的几何意义是函数对应的曲边梯形的面积,应用在这里就是将概率密度在某区间对应的曲边梯形的面积算出来就是再次区间的概率值!多么完美的微积分模型!这就是我说概率的一半是高数的原因。 有了这个模型,我们可以将高数的微积分的成果都搬过来。比如单调性、凹凸性、渐近线都可以用来描述概率密度函数;两个随机变量的分布情况我们可以借助多元函数的微积分;高数中的收敛可以在这里推广为依概率收敛;求随机变量函数的分布可以用变上限积分的求导…… 。高数中的许多概念再这里都赋予新的意义,大家要深刻领会,做概率题将不再难! 关于统计学部分。数理统计与概率论的关系是:概率是统计的基础,统计是概率的直接应用。为什么统计要用到概率呢?因为统计不仅仅是将数据记录下来,我们还要根据统计的数据分析事物的性质。而我们统计的数据,往往不可能穷举,因此只是整体事物的一部分。我们要根据一部分的统计数据窥见整体的风貌,这一部分的取值是随机的,这就和概率联系上了。概率和统计最关键的枢纽就是大数定律,我原来做学生的时候没有十分的理解其重要性,其实,没有大数定律,概率论的整个大厦就崩溃了!大数定律讲的是当样本量达到足够大时,其均值依概率收敛于一个定值,正是这个定值,保证了我们前面概率论中队事件赋以一个概率值的意义所在,不然这样的赋值无法求出,概率的实际意义也就消失了!在这里我们更好地理解了概率是一个统计规律。统计规律嘛,就是我们不能看一时一事,而是要考虑大量的随机事件反映出来的一种整体规律!正是因为这一点,我们站在不同的时间点上,概率会发生质的变化,因此有了“先验”和“后验”的区别,没有什么奇怪的。 接着统计学讲到总体、样本、样本值的概念,对于概念,同学们还是不屑于理解,依我看你吃亏很大。只要你理解了三大概念的本质,我看统计就变成概率了!因为我们是用概率解决统计问题的嘛!只要你知道,总体是抽象整体、样本是随机的局部、样本值时样本取的具体值(如同随机变量取的值一样),这里体现了一种辩证的关系:普遍性寓于特殊性之中。正因为这个辩证关系,我们每一个简单样本的个体可以看成独立同分布的随机变量,同什么分布呢?就是同总体的分步嘛!因为普遍性寓于特殊性之中!我们从特殊的样本作为多个独立同分布随机变量,可以构造不同的函数(统计量),其分布就是抽样分布了!就可以开始研究各种统计规律了。有了这样的提纲契领,统计是不是就学好了一半? 基于上面的总则,我们将统计分成两部分:一是参数估计,一是假设检验。(实际上统计学远不止这些,这只是基础的常用的知识)参数估计讲的是知道总体分布,但是不知道其中的某些参数,因此需要抽样估计它,我们讲要构造适当的统计量,这个统计量估计的好不好,不是一两次碰巧可以算数的,靠的是其抽样分布的分析!这是科学啊,分析靠什么呢?就是概率,我们通过概率,就不需要靠多少次实验检验取得经验了,而是靠概率算出来,这样的计算最终和实验是会契合的,因为它是科学嘛!也正因为是估计,难免有误差,所以我们要给出一个衡量的方法,于是有了:置信度和置信区间。假设检验呢?就是先对参数进行假设,有原假设与备择假设,它们是两个互逆的假设。我们有点像做数学的反证法,我们呢先假设原假设成立,当实验数据与原假设相差甚远时,我们就认为原假设不对,从而支持备择假设。只要“证据不足”我们认为“不显著”,因此还是支持原假设。哈,说起来不难呢!但是实际操作上你必须拿数据说话啊!还是要用统计量的分布来说明问题。具体我就不深谈了。 以上是我多年的学习教学的体会,对初学者一定会有帮助的!这些话可以作为一个总原则,当学的具体时,你拿来好好体会一下,知识就容易贯通,贯通了,解一般的题目不在话下。有的同学觉得好难理解哦!当然啦,我也是经过教书3-5年后才领会其精髓的啊!没关系,慢慢来,学习就是水滴石穿! 忠杰