查看: 96|回复: 0

高考大数据:京津沪鲁粤苏豫冀八省高考难度量化分析

[复制链接]

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2022-9-22 10:25:42 | 显示全部楼层 |阅读模式
又是一年高考季,对于莘莘学子来说,考一个好大学,自己的能力和努力固然重要,家长给孩子提供的学区房更加重要,成功的一半来自个人,一半来自父母创造的环境,目前看来后者的决定性越来越大,这也是为什么寒门再难出贵子。
除了学区房,另外一个决定性因素也被常常提起,那就是各省高考的难度,我们都知道北京,天津,上海是高考天堂,河南山东是高考地狱,但是没有一个直观的,量化的指标,网上很多数据也是不准确的,今天这篇文章,我们就来好好算算,到底各省的高考难度是怎么样的。
先选定分析目标:北京,天津,上海,河北,河南,江苏,广东,山东;三个天堂,五个地狱,相对比较有代表性。
首先我们选择分母,用哪个变量作为基数:人口数,还是高考报名人数 ?


直观来看,用高考报名人数做分母是最合适的,但是我们用总人口一校验,发现比例很不稳定,这里面有很多问题,包括各省人口年龄段分布,中考高考分流情况,高考复读情况,等等,尤其是河南的125W 高考报名人数,明显异常,很难解释。
如果不用高考人数,那就再往前反推,小学生数量是不是比较合适?


我们看一下上图,小学毕业生(6年级)和小学生总量(1-6年级)的比在0.14-0.17之间,是比较稳定的,说明数据是可信的(网上的很多数据都是有问题的,不要轻信);我们再看初中毕业生和小学毕业生的比例,这个值就差点意思了,但是仔细分析一下,还是可以解释的,北京上海户籍管理很严格,很多人可以在北京上海读小学,但是读初中就困难了,没法参加高考,只能回原户籍地;天津,江苏,广东户籍制度还好,但是外来人口多,也存在初中生回原户籍地的问题;河北,河南,山东属于自产自销型的,人口流动性不大,所以初中毕业生和小学毕业生比较接近。总体来说,这组数据可信度是比较高的,由于小学存在回户籍地的问题,有一些干扰,初中毕业生,基本就是高考人数的基数了,所以我们用初中毕业生作为分母。
有了分母,我们再找分子,一本录取分数线,录取人数,这些指标,感觉都不好比较高考难易程度;高考难易的本质是什么? 如果把各省的高考成绩排名归一化,例如都到1-10000名这个区间,同样的学校,需要多少名次?例如北京市500名,河北省1000名,这个就很直观。
排名归一化是很简单的,关键是选那些高校来做参照物?原则:
1) 不能是上面几个省的省内高校,省内名额分配会影响排位。
2) 要有一定的梯度,从重点大学,到211,到一般院校。
按照这个原则,我选了几个高校,并把它们在各省的排名列出来:


这个工作花了点时间,湖北湖南的高校多一点,主要是考虑距离全国各地都不远,不会有地域倾向性。
好了,见证奇迹的时刻到了,我们用各个高校的各省名次,除以各省初中毕业生,就是各省的高考难易程度。
原始数据:


图表化一下,看的更加清楚:


是不是很震撼? 没错,和你的直觉估计也是一致的;直观来看,上海北京第一梯队,天津稍微差了半个身位,但是天津的重点大学录取率和北京上海是持平的;江苏可以排到第四,教育强省不是浪得虚名,比后面几个有趋势上的明显优势;最后一个果然是河南,指标非常难看,心疼河南的小朋友,当然河北也好不到哪儿去,难兄难弟。
文章到这儿基本就可以结束了,大家应该看得很清楚了,如果非要准确的排个名次,也可以,我们把各个高校的排序改为排名,从1-8,然后平均一下:


最终的排名如下:
北京,上海,天津,江苏,山东,广东,河北,河南。
恭喜伟大的首都,喜提冠军,为了孩子,你是不是要考虑考虑换个城市?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表