显然,这些软件都是依据往年的数据进行预测的。在高考分数尚未公布的情况下,对以往的数据进行分析,未尝不可,但如果一味依靠这些软件去填报志愿,则不太科学。可以推测,对志愿填报情况的预测,必然会影响到参与者的选择,反过来参与者对预测的响应,必然会影响未来的结果,这种博弈结果有可能使预测偏差越来越大。
另外,招生计划和录取标准是会随着报考人数在政策允许范围内微调的,一所学校的招生专业也会根据报考人数有所调整,这不是计算能够预测的,需要考生和家长向学校招生部门咨询。
当然,报考志愿除了与分数有关,还有一定的技巧。依据经验和分析,以及考生的一些爱好、性格特点、知识能力,给出一些专业报考方面的建议和指导,这对于考生是有益的。但在各个媒体的报道中,许多高校的招生人员都提醒考生,不能以这些软件为依据来填报志愿。
今年高考以“大数据”为名的软件预测不仅在考后出现,在考前也有。比如百度预测高考作文,将作文分为六大类别,并预测每类概率,每类中再有一些关键词,每个关键词有相对应的作文题示例,考生点击这些示例关键词,就可搜索到相关范文和素材。
但是,对此类软件略加分析就会发现,预测高考作文题的几十个关键词,范围非常广,几乎涵盖了各个方面,其实际价值微乎其微。每年高考后,都会有培训学校说自己预测中了高考题,预测软件的功效其实和这类学校的宣传噱头异曲同工。
无论是高考作文还是报考软件,这些都是基于数据整合和分析,把过去的统计方法冠以“大数据”预测之名。当然,数据分析、挖掘、热词搜索,是“大数据”应用并向生活渗透的一种体现,而一些院校的报考趋势、冷热门专业的变化,具有一定的客观性,绝非数字统计那般简单。“大数据”之所以成为一些软件的招牌,不过是用这个时髦的科学词汇来包装,以便赢利。
“大数据”本身及其用途已经毋庸质疑,生物、医学、天文、环境、物理、工程、经济、互联网等诸多领域都开始出现基于数据的利用研究,尤其在交通管理、城市布局、市政设施等政府社会管理多个方面用途很大,数据思维也越来越被重视,但数据分析不是万能到任何地方都可以应用。很多学者指出,“大数据”的提法在学术界过热,明显有炒作的味道,不要说“大数据”的本质和理论方式,就是“大数据”的定义至今还没有统一的概念。而眼下,“大数据”过热过滥,被用于商业包装也就不足为奇。
通过对高考报名人数、分数分布、报考志向等进行整体分析,对高校专业设置的调整、高考科学出题甚至一些政策的调整会有所裨益,但如果以经济利益为目的,打着“大数据”的旗号,进行各种预测,则应该有所警惕。(李新玲)