大数据+人工智能，真能帮你填对高考志愿吗

2018-10-21 05:55

文萃报·周二版 2018年27期

曾有人将大数据比作信息富矿，通过有效的提取方式，相较传统规模的数据研究，可能获得新的宝藏。那么，当这一技术进入志愿填报分析领域，也能获得有价值的新信息吗？上海大学教授叶志明坦言，技术上是可行的，但今天大数据服务若真要进入市场，成为考生们填报志愿的参考依据，条件上仍有所欠缺。他认为，每年填报志愿前，有关考试管理部门及各高校，都会提供相当多的信息，其中涵盖往年各专业的录取分数线、招录计划数等，在充分“吃”透招录投档政策后，运用数据分析以及人工智能等方式，或许可以在知分情况下，得出学生被某高校、某专业录取的概率。

“但要注意一点，在新高考大背景下，过去多年数据基础上的分析结果，是没有参考价值的。”叶志明说。例如，去年上海高考才开始“文理不分科”，今年延续这一模式。换句话说，仅有一年的积累，对于以海量数据为基础的大数据分析显然不够。即便可以作为参考，失误率可能会非常高。何况，以往考试录取也有“大年小年”之说，短期数据表达的趋势难以给出准确预测。大数据要真正对填报志愿起到指导作用，“起码要积累三到五年以上”。

信息领域业内人士指出，大数据可靠的前提在于数据的完整性和准确性，即使解决了这一问题，以数据为砖，构建准确有效的数学模型并非易事。举例说，若在一个小村庄，两个人面貌相似，那么判断其两者具有血缘关系的准确性较高。但若在几千万人口的大城市，做出这一判断，可信度大大降低。在大数据分析中，由于信息海量且多元异构，影响结果的要素繁多，若不能精準验证，往往会误解两个参数之间具有相关性，影响整个结论。又比如，大数据涉及几万个、几百万个乃至数百亿个变量，这意味着如果每个变量都造成一点点误差，最后的预测会是很多误差的叠加。前者是“假相关”问题，后者是“误差叠加”问题，两者都是整个大数据研究学界面对的瓶颈，在高考填报志愿这个有“人心”变量参与的项目中，解决瓶颈问题或许要更长时间。

“个体决定行为，群体决定结果。”从填报到录取，高考招录是牵一发而动全身的事，各自花落谁家，是由所有考生的群体选择确定的。（摘自《解放日报》6.21）