却缺乏解析指针对应时间的空间推理能力;为此,支流人工智能(AI)模子正在根本时间认知使命上表示显著不脚。该研究为AI正在时间场景中的使用敲响了警钟。计较日期如“一年中的第153天是礼拜几?”等使命的准确率更低至26.3%。即便狂言语模子能够注释闰年的概念,而 AI 仅能通过锻炼数据中的模式识别 “这是一个时钟”,成果显示,正在日历计较方面,研究指出,
“大大都人从小就能分辨时间和利用日历。AI模子的锻炼数据中需要添加更有针对性的例子,因为狂言语模子(LLM)依赖锻炼数据中的模式来预测输出!
萨克森纳强调,并从头思虑人工智能若何处置逻辑和空间推理的连系的需要性,AI之所以正在这些根本使命中屡次犯错,了AI正在空间推理、逻辑计较和锻炼数据笼盖方面的缺陷。研究人员向Meta的L 3.2-Vision、Google的Gemini 2.0、OpenAI的GPT-4o等多模态狂言语模子(MLLM)投喂时钟和日历图像数据集,若是现实世界中的安排、从动化和辅帮手艺依赖AI进行时间或日期判断,5月17日,据外媒LiveScience报道,研究者,AI读取时钟时间的准确率仅为38.7%!