国产精品永久免费高清在线观看,国产美女在线播放,国产中文精品字幕自在自线

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-02 21:31:13 瀏覽：54次

導(dǎo)讀：IT之家 11 月 2 日消息，《洛杉磯時(shí)報(bào)》昨日（11 月 1 日）發(fā)布博文，報(bào)道稱蘋果研究團(tuán)隊(duì)測試了 20 個(gè)最先進(jìn)的 AI 模型，發(fā)現(xiàn)在有干擾項(xiàng)存在的情況下，它們處理簡單的算術(shù)問題時(shí)表現(xiàn)不佳，甚至不如小學(xué)生。蘋果公司用以下這道簡單的算術(shù)題測試 20多個(gè)最先進(jìn)的 AI 模型，IT之家附上題目如下：Oliver 在星期五采摘了 44 個(gè)獼猴桃、然后他在星期六采摘了 58 個(gè)獼猴桃，星期日采摘 ......

IT之家 11 月 2 日消息，《洛杉磯時(shí)報(bào)》昨日（11 月 1 日）發(fā)布博文，報(bào)道稱蘋果研究團(tuán)隊(duì)測試了 20 個(gè)最先進(jìn)的 AI 模型，發(fā)現(xiàn)在有干擾項(xiàng)存在的情況下，它們處理簡單的算術(shù)問題時(shí)表現(xiàn)不佳，甚至不如小學(xué)生。

蘋果公司用以下這道簡單的算術(shù)題測試 20多個(gè)最先進(jìn)的 AI 模型，IT之家附上題目如下：

Oliver 在星期五采摘了 44 個(gè)獼猴桃、然后他在星期六采摘了 58 個(gè)獼猴桃，星期日采摘的數(shù)量是星期五的兩倍，不過其中有 5 個(gè)獼猴桃的塊頭要比平均值要小，請問 Oliver 這三天共摘了多少個(gè)獼猴桃？

正確答案是 190 個(gè)，計(jì)算公式為 44（星期五）+58（星期六）+88（44*2，星期日）。

不過測試的 20 多個(gè)最先進(jìn) AI 模型無法排除干擾項(xiàng)，通常不理解獼猴桃的大小和數(shù)量無關(guān)，大部分的結(jié)果是 185 個(gè)。

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型

蘋果團(tuán)隊(duì)發(fā)現(xiàn)，當(dāng)問題包含看似相關(guān)但實(shí)際上無關(guān)的信息時(shí)，AI 模型的表現(xiàn)急劇下降。對此研究認(rèn)為，AI 模型主要依賴于訓(xùn)練數(shù)據(jù)中的語言模式，而非真正理解數(shù)學(xué)概念。

蘋果的研究表明，目前的 AI 模型“無法進(jìn)行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們，盡管 AI 在某些任務(wù)上表現(xiàn)出色，但其智能并不如表面看起來那樣可靠。

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型

蘋果團(tuán)隊(duì)指出，簡單地?cái)U(kuò)展數(shù)據(jù)或計(jì)算能力并不能根本解決這個(gè)問題，蘋果的論文并非旨在削弱對 AI 能力的熱情，而是提供一種理性的認(rèn)知。

相關(guān)熱詞： ai模型蘋果獼猴桃算法

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-02 21:31:13 瀏覽：54次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-02 21:31:13 瀏覽：54次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

蘋果 AI 研究：簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)主流模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-11-02 21:31:13 瀏覽：54次