截至目前,全国30省份高考分数线都已公布,伴随着志愿填报季开启,各式各样的AI填报志愿卡开始畅销于各大平台。
商家为这些志愿卡设定的营销话术,大多是“100%准确”、“值得信赖”、“报考神器”、“AI助力”……
相比于动辄近万元的1对1专家,只花费几百块的志愿卡更能被普通家庭接受。但伴随着用户群体的激增,投诉的频率也越来越高。多位专业人士表示,数据不够精准是这类卡的通病,很容易得出错误的结论误导学生。
当以技术手段填报志愿出现偏差,到底是AI失去了准星,还是另有隐情?
被投诉的智能推荐,是如何“坑”考生的?
在黑猫投诉平台上检索“高考志愿”,两百多条检索结果中,有大约1/4的投诉内容针对这类志愿推荐系统。具体的投诉细节主要分为两类:1、数据不全,2、推荐不准。
其中有一位用户表示,自己根据某商家在抖音平台售卖的志愿卡填报了六所大学,该系统计算显示六所大学的录取率都在70%以上,结果只有第六所“保底”大学录取了该投诉者,其高考分数高于录取分数线20分。
诚如许多招生领域的专业人士所言,在确保数据准确的情况下,借助大数据系统来填报志愿的确可以帮助学生和家长省时省力。“从原理上来看,无论是个人收集的数据还是第三方收集数据,只要能够保证数据的准确,AI推荐的结果就有一定的参考价值。”
但是,有参考价值的前提是数据的准确和推荐模型的合理搭建,这在信息爆炸时代并不容易做到。
北京某985高校的招办负责人李老师介绍说,各类AI填报志愿卡是基于何种算法、背后是何种系统家长们都不了解,也没时间细究,所以推荐出来的基础数据都有可能存在差别。
另外,直播平台上售卖的志愿卡质量鱼龙混杂,有些商家的数据库可能是没有经过处理就直接录入的数据,并未进行校对核实,“如果连这一环节的根基都没打好,就更不用说推荐的准不准确了。”
“失灵”的智能推荐神器,问题出在哪里?
某志愿填报领域的资深规划师透露,自己从业过程中也需要用到大数据系统作为辅助工具,但有很多可能性都会导致系统推荐不准确。
“如果考生不服从调剂,会产生退档,退档之后又产生了缺额,这就涉及到了征集志愿的录取方式。这个时候学生的分数与正常报考的学生的分数的差距会非常大。”
例如,一所学校的某专业的录取分数线为600分,两位征集志愿考生的分数为550分,如果没有把两位考生的数据摘除掉就进行统计,就会产生误差。因此,如果用单纯的录取分数数据匹配会误导学生。
再比如,像上文提到的那位因“分数超出录取线20分”而投诉某志愿卡的考生,最终在“保底”志愿才被录取,确实浪费了很多分数。而在实际报考情况下,比最低分数线高出二三十分被录取的考生并不罕见。
以2022年吉林高考为例,理科考生小A以606分被吉林大学的经济学类专业录取,而该专业总共录取35人,最低录取分数线为580分。小A以超出26分的成绩被录取,看起来也是一个“比自己高考分数低了二十多分的志愿”,这种到底算不算“浪费分数”?或者换个说法,如果吉林大学经济学类专业,也是系统推荐给小A的一个参考志愿,那么这一智能推荐算不算失误?
这里首先明确一个概念,每个大学或者专业的最低录取分数线,也叫这个大学/专业的投档线。大学投档线,是某大学按照招生比例进档的最后一个学生的分数,是按照国家统筹的录取比例,根据所有学生的成绩和想招录的人数算出来的最低分数线。同理,专业分数线,是高校根据报考该专业的人的多少和考试分数高低排列,完成专业招生计划最后一个人的分数。
专业录取的规则是什么?十二个字:分数优先、遵循志愿、一轮投档。先从最高分考生开始,依次检索和投档,当轮到检索某一考生时,遵循该考生所填报的志愿顺序检索,当符合投档条件且院校有计划余额时,即被投档。
举一个直观的例子,某高校招收物理和数学等3个专业,各招收1人,一共投档3人,假设投档考生成绩及报考专业如下:
按照分数优先录取规则的办法,录取顺序如下:
第一步在不看考生报考专业的情况下,为所有考生按高考成绩排一个队,确定录取顺序,只能是:甲第一,乙第二,丙第三。
第二步为成绩第一的考生甲安排专业:甲第一专业报考物理,尚空缺中,甲录取到物理专业。
第三步为成绩第二的考生乙安排专业:乙第一专业物理已经完成计划,乙无法录取到物理,再看乙的第二专业数学,尚空缺中,乙录取到数学专业。
最后一步学校的2个计划已经完成,考生丙如果服从调剂,则安排其他专业,不服从则退档处理,录取工作结束。
因此,分数优先对进档考生的最大好处是可以最大限度地保护高分考生,只要分数排名靠前,就可以按顺序录取到自己报考的专业中。而对于一些热门专业,比如上面例子里小A报考的经济学,由于报考人数众多,录取人数有限,很容易水涨船高,出现最低录取分和最高录取分相差三四十分的局面。
“热门专业”的录取分数,为啥差这么多?
最能体现学科录取分数差异的是综合性大学。比如:北京大学和清华大学招生的本科专业有100个左右。这两所大学里,大家猜猜录取分数线最高的是哪类专业?
清华大学录取分数线平均分数最高的是经济管理学院,北京大学在四川连续三年录取分最高的专业是工商管理类。由此我们可以得出一个粗浅的结论:全中国高分段的考生,热衷报考经管类专业。
GMAT考试的官方承办机构GMAC曾在2016年-2019年接连发布调研报告,显示过半的中国留学生在美国读的是商科专业。这种现象其实并非中国独有,全世界大学的商科都是热门。
经管类专业,国际上一般叫商科,以金融、会计、管理、经济学四大专业为代表,有很多专业类别。目前在国内综合性大学里,商科依然是录取分数最高的专业之一,也正因其热门性和考生实际填报的多样性,导致商科类专业容易出现“两极分化”的录取分数。
这一点我们用2022年的录取数据就可以佐证。比如,山东财经大学的经济统计学专业(理科),去年在四川录取5人,最高录取分和最低录取分就相差了45分;上海应用技术大学(理科)工商管理类去年在四川录取2人,录取分数就相差了33分。
更极端的例子发生在陕西,河北工业大学2022年在会计学专业也是仅录取了两人,但这两人的分数相差了73分!
出现这种局面的原因很有可能是:两人虽然高考成绩差了73分,但都将这一志愿排在了志愿表较靠前的位置,按照“分数优先,遵循志愿”的原则被录取。而两人中间分数段的考生,在志愿表专业排序上将该志愿排在更靠后的位置,故而被其他志愿录取。
通过以上例子不难发现,在平行志愿“分数优先,遵循志愿”的原则下,志愿表内志愿的先后顺序尤为重要。这也是为什么许多填报专家和填报系统,在给考生推荐志愿时,选择以“冲稳保”来划分结构。
就像网易传媒自研的“网易高考智愿”报考产品,在今年推出的2.0版本里,针对不同省份的志愿表结构和填写数量,灵活匹配了“冲稳保”各个档位的志愿比例,并按照推荐模型测算的录取概率,为每一档位设计了区间划分。VIP用户在做出了个性化筛选后,直接可以进入志愿表,查看已进行过智能排序的志愿。此时的排序,不仅按照“冲稳保”进行了区隔,还在每一档里根据考生的个性化偏好进行了权重排序。
通过网易高考智愿的系统智能排序,考生得以将个人实力和个人诉求结合起来,确保在报考安全的基础上,尽可能“不浪费分数填志愿”、“用好高考每一分”。
据业内人士透露,网易高考智愿也是唯一公布了预测分数线与实际录取线差额验证结果的报考类产品团队。以2022年浙江、吉林、陕西、上海、四川等5省的专业录取数据作为参考,该产品模型预测出的专业录取分与实际最低录取分的平均差值仅为+4.2分,且无一人落榜。
但是说到底,志愿填报本身是一个无法证伪的过程。任何一种被赋予技术手段的大数据系统,也只能作为辅助工具;再智能的AI推荐、一键生成,也只是模拟填报,仅供参考。正如许多知名大学的招办老师都曾对家长再三解释的那样——
“即使选择了AI填报志愿卡来辅助,也应该在报志愿之前按照省招办手册去验证系统的数据是否真实,最好是与学校招生办打电话再次核实。”