高考志愿预测的数学模型研究

时间：2016-12-26

高考志愿预测的数学模型研究

　　中图分类号：TP311 文献标识码：A文章编号：1009-3044（2016）10-0094-02

　　高考是人生一个非常重要的转折点，说得夸张一点是“一着不慎满盘皆输”，而这个转折点的关键环节就是填报志愿。在这个信息化的时代，如何借助高科技手段及时准确地采集高考考生志愿，如何为考生提供一种可参考的高考志愿学校及专业选择指导，都是考生、家长、学校及招生管理部门都关心的问题，也是当前招生考试业务信息化研究的热点问题[1]。所以，我们想到建立这样一个系统，目的就是使考生充分了解自己的成绩排名、学校的招生情况、填报理想高校时自身的优势及劣势，并且在一定程度上提高预测精确度，确保准确的填报志愿。

　　1 目的背景

　　每年都有不少考生由于心系名牌、眼高手低；追捧热门、盲目从众；固执己见、独断专行；亦步亦趋、墨守成规；不加分析、草率行事等各种原因而没有顺利进入理想高校。真正能正确评估衡量自我，认真分子揣摩当年录取形式的少之又少[2]。而且，考生一般都是在网上查找资料，但是网上的信息虽然多但是杂乱，考生及其家长很难准确有效的找到所需的信息；并且网上的资料有很多已经过时，没有及时更新，缺乏真实性。随着科学技术的不断进步，也出现了一些针对高考志愿预测分析的系统，但很多都是利用心理学、问卷调查、计算数学分析诊断以及量表和工具等对历史高考录取的相关数据进行统计和分析[1]。就目前现有的预测模型算法中，有的基于关键字的Web数字信息挖掘方法，在该方法的基础上利用回归分析方法实现高考预测，但是数据缺乏权威性和准确性；有的采用神经网络和分类中的相关算法，对普通高考的录取数据进行分析，但神经网络算法参数选取比较单一；有的采用决策树和C4.5算法实现高考考生生源分析系统，返回挖掘的规则集；有的运用C4.5算法生成非平衡数据集下的二叉决策树，建立高考数据分析模型。但这些高考数据分析模型应用于高考录取预测中，使用数据挖掘算法时对数据集的属性选择和属性值选择不太合理，预测精度有待提高[3]。所以，我们设想了这样一种数学模型，以一种简洁有效的方式为考生提供全省乃至全国的分数排名情况、高校招生情况以及高校的录取分数线，把考生最想了解的信息以最醒目的方式展现出来，确保每位考生及其家长都能快速便捷地找到所需要的资料，使考生充分了解自己填报理想高校时自身的优势及劣势。

　　2数据采集

　　高考时间是每年6月的7、8号，而志愿填报则根据每个省的政策不同而时间不同，但一般都是高考后的半个月到20天左右。各省排名的五分段数据和批次线发布的时间比志愿填报的时间提前几天，我们采用的是人工采集的方式，由于是人工采集，为避免出现误差，会分批对数据进行检查修改，确保数据的准确性。一般来说，首次采集的难度较大，要录入往年的信息，但是以后就只要进行数据的维护即可。我们的数据来源于中华人民共和国教育部政府门户网站阳光高考平台，信息准确可靠。而每年各高校的最低录取分数线需要等到录取结束后大概半个月左右才能出来，那个时候再进行数据采集，为第二年预测招生录取做准备。

　　3数学建模

　　根据中华人民共和国教育部政府门户网站提供的数据，下面主要以2012-2013年数据为例。根据5分段数据，我们团队制成了分数与人数的散点图（图3所示，x轴为分数，y轴为人数），并且我们推导出了趋势图和二项式数学模型。

　　2012理科人数：

　　y = 5E-12x6 - 1E-08x5 + 8E-06x4 - 0.0027x3 + 0.4978x2 - 36.299x + 697.81

　　2012文科人数：

　　y = 2E-12x6 - 3E-09x5 + 2E-06x4 - 0.0006x3 + 0.1622x2 - 17.859x + 535.89

　　2013理科人数：

　　y = 1E-12x6 - 2E-09x5 + 7E-07x4 - 0.0002x3 + 0.0633x2 - 5.3345x + 70.191

　　2013文科人数：

　　y = -2E-12x6 + 4E-09x5 - 4E-06x4 + 0.0013x3 - 0.1476x2 + 4.7074x + 1.2302

　　根据趋势图我们发现2012年和2013年的趋势图是一致的，只是图形平移了，说明湖南省近两年高考的分数分布是一致的，高考录取与考生的分数高低无关，主要与考生考分排名有关。

　　因此我们根据已采集的五分段数据，推导出了2012-2013年的考分排名趋势图（ x轴为分数，y轴为排名）：

　　根据湖南生考生5分段数据进行进一步分析，推导出近两年考生分数排名，并以此建立数学模型：

　　2012理排名公式：

　　y = -2E-11x6 + 5E-08x5 - 3E-05x4 + 0.0085x3 - 1.4088x2 + 103.48x + 170621

　　2012文排名公式：

　　y = -2E-11x6 + 3E-08x5 - 2E-05x4 + 0.0003x3 + 0.5468x2 - 56.414x + 144422

　　2013理排名公式：

　　y = -4E-11x6 + 8E-08x5 - 5E-05x4 + 0.0121x3 - 1.7503x2 + 117.42x + 178471 　　2013文排名公式：

　　y = -1E-11x6 + 1E-08x5 + 6E-06x4 - 0.0092x3 + 2.1867x2 - 153.4x + 149577

　　4 模型检验

　　众所周知，高校录取分数受多种社会因素的影响。高校的综合实力是影响高校录取分

　　数线的根本因素。并且，根据每年招生就业的形式不同，各个高校的专业录取线会有所不同，热门专业的分数就会比往常高一些，而有了热门专业，肯定就有冷门专业，这些专业的录取线就会相应的有所起伏。但也不是绝对的，只是这些因素不可避免，当然模型检验的结果也会有一些误差，但误差也是维持在一定的范围，这个范围内预测的录取线还是有效的。

　　本预测系统中存放了近几年全国高校的录取信息，在这里仅选取2012-2013年部分院校在湖南的招生情况，来预测2014年全国部分高校的录取线。任意选取十所高校的实际录取线，根据模型得出了预测录取线和误差，下面两个图分别是这十所高校2014年文科模型验证表和2014年理科模型验证表：

　　在这里需要衡量抽样误差，判断抽样样本统计量是否对总体参数具有代表性及数学模型预测录取线的可靠度。因此，根据对这十所高校实际录取线和数学模型预测出的录取线的分析，计算了标准误。标准误的计算公式是：1）求得预测值的平均值；2）计算预测值与平均值之间差的平方和；3）求出第二步得出的结果与样本数减一的商并开平方；4）拿第三步求出的值除以样本数开平方的值，所得的值就是标准误。2014年文科录取线预测的标准误为21.9486522，2014年理科录取线预测的标准误为29.74080624。虽然表面看来标准误的值偏大，但对于选取样本数较小时，该标准差的值表示误差还是在有效范围内的。当样本统计量越大时，标准误越小，表明样本统计量与总体参数的值越接近，样本对总体越有代表性，用样本统计量腿短总体参数的可靠度越大。

　　该模型虽然能在一定程度上保证预测结果的准确性，但是很显然它也有不足的地方。高考志愿填报本身就存在多方面不确定的因素，我们只能根据近几年录入的数据进行分析，不能避免一些不确定因素造成的志愿预测误差，因此会存在个别高校录取线预测结果误差较大的情况；目前仅仅只采集了两年的高考数据，该数学模型还不是特别稳定。

　　针对研究的不足之处，后续会对模型做进一步的改善：多采集几年的数据，使分析得出的数学模型更加精确，误差更小；采取数据挖掘技术对采集到的数据进行分类，提炼处理，优化数学模型；对高考志愿填报的现状和未来可能出现的问题进行更深入的研究，尽量避免不确定因素对志愿填报带来的误差和影响。

　　5 结束语

　　综上所述，该模型算法的效果显著，能给考生及其家长还有学校带来便利，也能减少在高考志愿填报上的失误，降低风险，因此该预测数学模型是可行的。但是考生填报志愿也不能只依靠预测录取线，还是应该综合考虑多个方面的因素，比如兴趣爱好、未来的职业发展、是否服从专业调剂以及个人的身体条件是否符合高校或专业的要求等，并且要多注意志愿填报的时间、提前批和自主招生等信息，才能更准确的填报志愿，进入理想高校深造。

高考志愿预测的数学模型研究

上一篇：小学数学教学中渗透思想方法的策略研究
下一篇：新时期地方工科院校《数学分析》课程教学改革探究

论文搜索: 关键字：志愿模型数学高考研究

最新数学论文: 浅谈小学数学教学中培养学生综合能力策略; 试论小学数学教学中空间观念的培养策略; 数学应用意识与高职数学教育教学思考; 深度学习的高中数学教学设计分析; 小学三年级数学教学中如何培养学生的口算能; 浅谈高职院校高等数学教学的现状与对策; 小组合作学习在初中数学教学中的应用研究; 高职院校数学教学的现状与思考; 浅谈小学数学教学中数学思想的有效渗透途径; 小学数学课堂应用数形结合思想的教学方式探

热门数学论文: 培养学生的创新能力; “研究性学习”的教学研究; “能听懂课，不会解题”的原因调查与分析; 数学教学中培养学生创造思维能力; 数学学习方法及其指导; 谈复习中数学试卷的讲评; 变式教学中习题引申应注意的几个问题; 用构造法解题对学生思维能力的培养; 以研究性学习推进小学数学教育的创新; 极限思想的辩证思考与理解

高考志愿预测的数学模型研究论文

高考志愿预测的数学模型研究