考清华和中500万,哪个更难?

作者: admin 分类: 科学 发布时间: 2021-08-13 00:23

        买彩票你中奖的概率大,还是你考上清华的概率大呢?今天我们再讨论一下这个问题。那么我们首先呢先采用一个比较简单的概率模型。百讨论这个问题。买彩票中500万的概率有多大啊?500万如果我们玩双色球的话,这个概率我之前算过,这里不重新算了啊。呃,买彩票中头奖的概率1770十二万分之一,那这个概率太小了,对吧?非常小,很难重啊。

        那么考上清华呢,有人说考清华啊比登天还难,那还不一定是吧。咱们看一看考清华的概率多大啊,首先我们先从全国来看。从全国来看,每年清华呢它是招大概3000个人陪大家也差不多招3000人。考生有多少人呢?考生比如说去年吧942万啊,大概1000万左右。所以呢你按照这个来看,你的概率多大?942万招3000个人,那是不是就大概是一千万分之3000呢?万1000万分之3000 1000万分之3000,那么我们把这个签约掉啊签约掉,那最后结果大概是万分之三吧。一万分之三一万分之三,这个概率是1770十二万分之一,差多少没差了大概5000倍左右,对吧?所以这个概率是他的大约5000倍。啊,大约5000倍。

        大约5000倍。你考上清华呀,要远远比你中500万要容易,是吧?有人说不是这个全国高考,他分省录取,每个省不一样,是咱们每省不一样。咱们来说一说。考的比较难的少,比如说河南啊,河南省人多呀。对吧,河南省招多少人呢?河南省啊招100个人,招的人不多,考生多少人呢?考生83万。83万啊,咱们算算河南省这个门槛上清华的盖子的那就是100除以83万吗?100除以83万对吧?这个数是大概一万分之1.2。

        一万分之1.2什么意思啊?比刚才那个5000倍少了,但是他也小不了多少,对不对?他大概还是中500万的概率的2000倍。所以说呀与你与其做梦去中500万,你还不如好好努力考清华,这个概率要远远超过你中500万的概率。还有人说呢,你这个算的不对,为什么不对呢?你就算投3000个名额,全在我们手,我也考不上,因为我学习不好嘛。学习好还是学习不好,跟考试有一定的关系。但问题是呢,有的学习不好的同学,他也可能会超水平发挥。有的学习好多同学他有可能会发挥失误,对不对?这是存在一个统计的问题的。所以我们不如啊再从另外一个观点统计学来研究一下这个问题。这个模型就计划的多了啊,统计学里面最重要的一个模型叫正态分布。

        正态分布。什么是正态分布呢?我们首先呢从一个实践啊,这个叫高尔顿钉板实验来说明这个丁满实验说明什么呢?就说啊。他这上面有个口子,可以往下放球,然后这里有很多个钉子啊,这个钉子非常非常密集,很多个钉子球可以在这些个丁字的缝隙之间漏下来。但是这些钉子排列啊也比较随机。球诺一诺的时候吧,他也是随机的啊,底下呢有一大堆的曹。

        然后呢我们就会发现,如果一个球落下来的话,他落到什么地方,不一定他可能会落在这儿,也可能会都在这儿,也可能都在这儿。但是如果你大量的球一次一次的往下掉,或者一次钓到很多球,你就会发现呢。中间这个地方呢球特别多,两侧的桥比较的少,再往下就更少,再往下就更少,它会形成一个曲线。大概是这个样子啊,人们经过研究发现这个曲线呢非常接近于一种特定的形状,这个形状就叫正态分布。其实不仅仅是这个问题,是正态分布,人们发现呢。只要一个问题中涉及到很多个随机量,那么这个分布加起来就非常接近正态分布。

        什么东西接近随机量呢?举个例子,身高就是这样,我们想统计啊,比如一个国家啊某一个年龄段的人,他的身高有多大?发现有的高有的矮,但是最终的结果是大家都集中在某个范围内啊,有一个身高的人是最多的。那么高的和矮的都比较少,也就接近于正态分布,对不对?身高是比较接近的。但是也有一些不洁净状态分布。举个例子,收入啊,比如说香港地区,我们统计香港地区人均收入啊,这个是人数。这个是收入啊这个是收入,我们发现什么呢?是香港地区吧,低收入的人非常非常多,然后呢就开始降降到了一定程度之后,到了高收入人群又突然多了一下啊,可能没有这么高啊,画的有点儿。高了。

        也就是说在香港地区呢,贫穷的人特别多,他有钱的人也特别多,中间反而少。为什么会出现这种现象呢?就叫马太效应啊,以后我们会讲这个问题。也就是说有一些分布它是不符合正态分布的,但只要这个问题是随机的。很多时候都是符合正态分布的,那咱们就可以假设,假如你在考试过程中有很多的不不确定因素。比如说呢可能你的知识点有一些漏洞,但这些漏洞是随机分布的。那么有可能考到这个漏洞,你就考的不好,也有可能没考这些漏洞,你就考到好。所以我们可以假设你的成绩是正态分布的啊,你没考一次成绩的正态分布。

        如果按照这种办法,我们就可以知道你考上清华的概率是多大的。为了计算这个问题呢,我们首先需要知道正态分布的一些基本基本的数学内涵。纵坐标是概率,其实不是概率,叫概率密度啊,但是他基本上跟概率的意思差不多,概率密度啊横坐标呢是它的数值。数值啊一个正态分布函数。他最中间概率最大的这个位置叫期望,其实就是平均值啊,平均值。同时呢它还有一个量叫做这个方差和标准差。个方差和标准差呢表示了这个叫平均值。方差和标准差呢表示了你这个幅度宽不宽。比如说我们花了这么一个图啊,然后我们再画这么一个图。那么很显然这个图啊它比较集中,这就叫啊这就叫标准差小标准差。

        七个嘛比较小,而这个就叫西格马比较大啊,这叫西格马比较大。然后我们想计算呢,你最后我知道你这个概率情况了,我想计算你分布在某个区间的概率多大,怎么计算呢?在这里啊做一个县,比如说我就想计算一下啊,从你这个平均值到平均值加标准差之间啊,这个叫缪加西格马。叫平均值家标准差在这个范围内,你出现的概率有多大?那么就是底下的这个面积啊,就是这个地面积。而且我们会发现,因为你最后的考试成绩一定在这个里面啊,所以说呢整个这个图像下方的面积是一。对吧啊在这里面的概率啊,如果是50%的话,那我就告诉你,你出成绩出现在这个范围内的概率是50%。人们经过计算呢得出了一些基本的结论啊,比如说一个随机量。这个随机量的取值在啊平均值减一个西格马和平均值加一个西格马之间,平均值加标准差之间。他这个出现的概率是68.3%啊,在平均值减两个西格玛到平均值加两个西格马之间。他的概率是95.4%。95.4%啊等等等等,我们就不再往下写了。

        也就是说假如说你可以把你的考试成绩统计出来,你就可以利用高斯分布这种方法知道你最终的考试成绩。在一定范围内的概率了。那我们举个例子吧,比如说啊有一位同学叫小名,这个小明同学啊,他在参加模拟考试,或者是在高三的几次考试中。他的成绩如下分布啊,他第一次考了580分。啊,第二次考了600分,第三次考了680分,第四次考了620分。啊,假如说他有四次考试成绩是这样的,清华的分数线多少呢?清华啊690分。哎呀,他一看完了,我肯定考不上,为什么呢?你看你看我这得500吧,我这从来没考过清华分数线呢,对吧?清华分数线可能是690啊,基本都稳定了。那我现在这个分数不够,对不对?啊,我再怎么超水平发挥也没用,我最好的一次还差了十分。小明同学是不是一定考不上呢?不是的,他其实还是有希望的。我们要计算一下它的均值是多少。

        首先说均值。均值很简单,就是N分之一倍的西格马xi。就是你把所有的数值给我加起来,加起来就是除以他的数就行了,也就是580加600加680加620再除以4,这就可以了。那这个数得几呢?这个是我得620分,也就是他的期望是620,但他不是说一定会考620,他还有一个标准差,西格玛西格玛的算法就比较复杂了他。等于A分之一的每一个数据减去平均值的平方。再开根号你也不用管这啥意思,反正大概就是说吧,你用580减620,减完了就一平方,然后再加上600啊,我忘了。西格玛还要加个星嘛,再加上600减620啊,把它给平方,再加上680减620,再平方再加620减620再平方平方完了之后求和求完了合。再除以4就行了,你把这个时候算出来啊,计算器其实可以直接帮你算出来的啊,这个时候呢大概是37.4,37.4。好了,我们已经知道了你的平均值和你的标准差了。现在我就想问你跟清华的非。

        现差了几个标准差呢,清华是690,对不对?你呢是620,所以平均值是620。所以呢你差了一个数就是70分。那么这个70分相当于几个七个吗呢?啊,相当于1.87个标准差,C个码啊,也就是说啊我们要画出一个正态分布曲线来啊。这个正态分布我在这画了没有地方了。我在这儿画啊。这个是你的概率,这个是你的分数啊,画出一个正态分布曲线来。这个正态分布曲线呢它的均值就是620分啊。我希望你能够考到690分,中间这个差别我经过计算是1.87个标准差。那么我这回就可以查表了,表会告诉我这个地方你要考上清华,你必须得给这个分。高对吧?所以这个部分的面积就是你考上清华的概率,那我们可以算一下。

        那么这个计算呢是通过查表完成的,表会告诉你到底有多大这个数值。结论是大概1.5%,也就是说你还有1.5%的概率上清华。你说我就考400分,我每次都400分以下,我能不能上清华,你去算一下,你也会有一个概率,只不过可能是万分之几量级的。是吧也是有一定概率的啊,你可能会超水平发挥,对吧?但不管怎么样,他都比这个1770十二万分之一要大的多,对不对?所以希望大家每一个人呢都对自己有信心。因为从统计上讲呢。每一个人都有可能会超水平超水平发挥。只要你相信自己啊,一切记忆都有可能会发生。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!