许多人依靠 LLM来执行数学运算。这种方法行不通。
问题其实很简单:大型语言模型(LLM)并不真正懂得乘法。它们有时能算出正确的结果,就像我可能对圆周率的值了如指掌一样。但这并不意味着我是数学家,也不意味着 LLM 真的懂得数学。
实例
例如:49858 *59949 = 298896167242 这个结果总是一样的,没有中间值。要么对,要么错。

即使经过大量的数学训练,最好的模型也只能正确解决部分运算。另一方面,一个简单的袖珍计算器却能得到 100% 的正确结果。而且数字越大,LLM 的性能就越差。

有可能解决这个问题吗?
基本问题在于,这些模型是通过相似性而不是通过理解来学习的。这些模型在处理与训练过的问题相似的问题时效果最佳,但却无法真正理解问题的含义。
如果您想了解更多信息,我建议您阅读这篇文章 "法律硕士是如何工作的?法学硕士是如何工作的".
而计算器则使用编程好的精确算法来执行数学运算。
这就是为什么我们绝不能完全依赖 LLM 进行数学计算:即使在最好的条件下,有大量特定的训练数据,它们也无法保证最基本运算的可靠性。混合方法或许可行,但仅靠 LLM 是不够的。也许,在解决所谓的 "草莓问题 "时,我们也会采用这种方法。
法学硕士在数学研究中的应用
在教育方面,LLM 可以充当个性化辅导员,能够根据学生的理解水平调整讲解内容。例如,当学生面临微积分问题时,LLM 可以将推理分解成更简单的步骤,并为求解过程的每一步提供详细解释。这种方法有助于建立对基本概念的牢固理解。
一个特别有趣的方面是,法律硕士能够提出相关的各种例子。如果学生正在尝试理解极限的概念,法律硕士可以呈现不同的数学情景,从简单的情况开始,逐步过渡到更复杂的情况,从而让学生逐步理解这一概念。
一个很有前景的应用是使用 LLM 将复杂的数学概念翻译成更容易理解的自然语言。这有利于向更广泛的受众传播数学知识,并有助于克服学习这门学科的传统障碍。
LLM 还可以协助编写教材,生成不同难度的练习,并就学生提出的解决方案提供详细反馈。这样,教师就能更好地定制学生的学习路径。
真正的优势
从更广泛的意义上讲,即使是最不 "有能力 "的学生,在帮助他们学习时也需要极大的 "耐心"。尽管如此,即使是 AI 有时也会 "失去耐心"。请看这个 "有趣的 例子.
