大数据+人工智能,真能帮你填对高考志愿吗

2018-10-21 05:55
文萃报·周二版 2018年27期
关键词:海量瓶颈准确性

曾有人将大数据比作信息富矿,通过有效的提取方式,相较传统规模的数据研究,可能获得新的宝藏。那么,当这一技术进入志愿填报分析领域,也能获得有价值的新信息吗?上海大学教授叶志明坦言,技术上是可行的,但今天大数据服务若真要进入市场, 成为考生们填报志愿的参考依据,条件上仍有所欠缺。他认为,每年填报志愿前,有关考试管理部门及各高校,都会提供相当多的信息,其中涵盖往年各专业的录取分数线、招录计划数等,在充分“吃”透招录投档政策后,运用数据分析以及人工智能等方式,或许可以在知分情况下,得出学生被某高校、某专业录取的概率。

“但要注意一点,在新高考大背景下,过去多年数据基础上的分析结果,是没有参考价值的。”叶志明说。例如,去年上海高考才开始“文理不分科”,今年延续这一模式。换句话说,仅有一年的积累,对于以海量数据为基础的大数据分析显然不够。即便可以作为参考,失误率可能会非常高。何况,以往考试录取也有“大年小年”之说,短期数据表达的趋势难以给出准确预测。大数据要真正对填报志愿起到指导作用,“起码要积累三到五年以上”。

信息领域业内人士指出,大数据可靠的前提在于数据的完整性和准确性,即使解决了这一问题,以数据为砖,构建准确有效的数学模型并非易事。举例说,若在一个小村庄,两个人面貌相似,那么判断其两者具有血缘关系的准确性较高。但若在几千万人口的大城市,做出这一判断,可信度大大降低。在大数据分析中,由于信息海量且多元异构,影响结果的要素繁多,若不能精準验证,往往会误解两个参数之间具有相关性,影响整个结论。又比如,大数据涉及几万个、几百万个乃至数百亿个变量,这意味着如果每个变量都造成一点点误差,最后的预测会是很多误差的叠加。前者是“假相关”问题,后者是“误差叠加”问题,两者都是整个大数据研究学界面对的瓶颈,在高考填报志愿这个有“人心”变量参与的项目中,解决瓶颈问题或许要更长时间。

“个体决定行为,群体决定结果。”从填报到录取,高考招录是牵一发而动全身的事,各自花落谁家,是由所有考生的群体选择确定的。(摘自《解放日报》6.21)

猜你喜欢
海量瓶颈准确性
CT诊断中心型肺癌的准确性及MRI补充诊断的意义
突破乡镇地区幼小衔接的瓶颈
产前超声检查和磁共振成像对胎盘植入诊断的准确性评估
Task 1
在突破瓶颈中成长
点击图象问题突破图象瓶颈
一个图形所蕴含的“海量”巧题
从教材中突围,走课内海量阅读之路
Hadoop构建的银行海量数据存储系统研究
吃饭谁买单