以 2024 高考数学 新课标1卷为例,我们来测测 GPT4o 的多模态推理能力。
这个题非常考验学生利用图形来推理出概率的大概范围,注重对思维逻辑的考察,而不是计算过程。GPT4o 无法自己画图来进行推理,因此也只能猜一个答案,如下图所示。
我们发现他在查表,然而并没有表供他可查,产生了幻觉。
无法作图,欠缺复杂图形推理能力仍是GPT4o的缺陷。
正确答案如下:
再来看一道函数图推理,如下图。
GPT4o仍然是无法作图来进行推理分析的。
我们看他的解题过程。
不难看出,GPT4o前三个步骤的分析都是没有问题的,但是第四步验证选项都是通过带入一些选项来进行分析,不仅慢,正确率也不能保证,我们看下根据图分析的正确求解过程。
画完函数图像后,可以直接过渡到第四步,既快又准哈。
这个回答仍是有问题的,第五步的分析是通过代入x=0去求解,虽然答案是对的,但过程是错的,正确解题过程如下图所示绿字的推理,我们从导数的角度分析,斜率不等于0,未取到极值点,因此纵坐标的最大值不是1。
第六步的分析也存在问题,把 y0 单独提出来是正确的,但后面出现了幻觉,产生了无法推出结论的过程。
正确的分析过程位于下图右下角。
从这几个案例可以看出,我们的高考的重心从 计算 移向了 图形综合推理,对思维能力的要求非常高,弱化了计算,而这恰好是大模型的弱点,短期内无法补齐。
因此教育行业要重点发力在对学生的思维能力的培养,提升他们思维能力、探究和解决问题能力。
因篇幅问题不能全部显示,请点此查看更多更全内容