近日,苹果的人工智能研究团队在arXiv上发表了一项新研究,揭示了大型语言模型在推理能力方面存在的重大弱点。这项研究对一系列领先的语言模型进行了评估,包括来自OpenAI、Meta和其他知名开发商的模型,旨在探究这些模型在处理数学推理任务时...