亚洲人成网亚洲欧洲无码久久|色88久久久久高潮综合影院|精品无码AV一区二区三区|久久精品国产在热久久2019|无码AV天天AV天天爽|国产三级精品三级

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

研究顯示:AI 解 6x6 數獨都費勁,解釋決策時(shí)還答非所問(wèn)

發(fā)布時(shí)間:2025-08-07 11:07:16來(lái)源:IT之家

  IT之家 8 月 7 日消息,科羅拉多大學(xué)博爾德分校的研究人員在《計算語(yǔ)言學(xué)協(xié)會(huì )研究發(fā)現》上發(fā)表了一篇論文,揭示了大型語(yǔ)言模型(LLM)在解決數獨問(wèn)題時(shí)的局限性,尤其是其在解釋決策過(guò)程中的不足。

  

 

  研究人員發(fā)現,即使是相對簡(jiǎn)單的 6×6 數獨,大多數大型語(yǔ)言模型在沒(méi)有外部輔助工具的情況下也難以解決。這一現象反映出 LLM 在邏輯推理方面的短板。數獨的本質(zhì)并非數學(xué)運算,而是一種符號邏輯游戲,需要從整體出發(fā),找到符合邏輯的解題順序,而 LLM 往往會(huì )按照訓練數據中類(lèi)似情況的模式,逐個(gè)填充空缺,這種逐個(gè)推理的方式難以應對數獨的復雜邏輯。

  而且,當研究人員要求這些模型展示解題過(guò)程時(shí),結果令人失望。大多數情況下,模型無(wú)法準確、透明地解釋其決策過(guò)程。有時(shí)它們會(huì )給出看似合理的解釋?zhuān)@些解釋并不符合實(shí)際的解題步驟;有時(shí)甚至會(huì )給出與問(wèn)題完全無(wú)關(guān)的回答,例如在一次測試中,OpenAI 的 o4 推理模型在被問(wèn)及數獨問(wèn)題時(shí),突然開(kāi)始談?wù)摰し鸬奶鞖忸A報。

  科羅拉多大學(xué)計算機科學(xué)教授阿舒托什?特里維迪(Ashutosh Trivedi)指出,如果生成式 AI 工具不能準確、透明地解釋其決策過(guò)程,那么隨著(zhù)我們越來(lái)越多地將生活和決策權交給這些工具,就必須保持謹慎。他強調:“我們希望這些解釋能夠透明地反映 AI 做出決策的原因,而不是 AI 為了迎合人類(lèi)而提供人類(lèi)可能喜歡的解釋。”

  IT之家注意到,這種解釋能力的缺失并非僅在數獨問(wèn)題上體現。研究人員還發(fā)現,LLM 在其他邏輯游戲(如國際象棋和漢諾塔問(wèn)題)中也存在類(lèi)似問(wèn)題。以國際象棋為例,LLM 雖然能夠找到合理的下一步棋,但往往無(wú)法像人類(lèi)高手那樣提前規劃多步棋局,甚至有時(shí)會(huì )違反規則移動(dòng)棋子,導致局面陷入混亂。

  此外,研究人員還指出,解釋能力對于 AI 的應用至關(guān)重要。隨著(zhù) AI 在駕駛、稅務(wù)處理、商業(yè)決策和重要文件翻譯等領(lǐng)域的應用逐漸增加,其解釋能力將成為衡量其可靠性的關(guān)鍵因素。特里維迪教授警告說(shuō):“如果 AI 的解釋是為了錯誤的原因而進(jìn)行的,那么這種解釋就非常接近于操縱。我們必須非常謹慎地對待這些解釋的透明度。”

最新資訊
? 2018 河北碼上網(wǎng)絡(luò )科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
亚洲人成网亚洲欧洲无码久久|色88久久久久高潮综合影院|精品无码AV一区二区三区|久久精品国产在热久久2019|无码AV天天AV天天爽|国产三级精品三级 固阳县| 关岭| 车险| 江安县| 六枝特区| 思南县| 肥东县| 库尔勒市| 山东省| 巍山| 峡江县| 凯里市| 洪洞县| 吴川市| 长白| 鄂尔多斯市| 朝阳市| 鄱阳县| 梅州市| 景洪市| 石河子市| 兴和县| 洪洞县| 兴和县| 沁水县| 六安市| 青岛市| 昌邑市| 平乐县| 天等县| 苍山县| 信丰县| 吉安县| 海城市| 莎车县| 温宿县| 蓬安县| 惠水县| 威海市| 神池县| 彭山县| http://444 http://444 http://444 http://444 http://444 http://444