百度AI學會了舉一反三 離強人工智能又近了一步
你一定知道,AI 在下圍棋上已經(jīng)比人類厲害了。不過,絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實際上只是面向單一任務(wù)進行訓練出來的而已,如果一個 AI 的任務(wù)是
2017-03-31 12:10:33
來源:新浪科技??

  你一定知道,AI 在下圍棋上已經(jīng)比人類厲害了。不過,絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實際上只是面向單一任務(wù)進行訓練出來的而已,如果一個 AI 的任務(wù)是下棋,它就只會一步一步下棋,你要是突然問他“怎么下才能贏?”它根本不知道,八成會宕機。

  這就是你暫時不需要擔心 AI 終結(jié)人類的原因:它不會舉一反三,沒法解決一些在認知上跨度比較大的任務(wù)。舉個例子,在《坦克大戰(zhàn)》里,勝利的方式是盡量保存更多的磚塊,吃掉增益,擊毀所有的敵方坦克,一個正常的人類玩家可能玩上一兩盤就明白了,而 AI 可能會把所有的磚塊全都打掉,輸?shù)舫汕先f盤游戲才能迎來第一盤勝利。

  人很容易理解“保存磚塊只打坦克”這句話,但 AI 理解不了,它只會玩游戲,不會聽話。

  想要實現(xiàn)強人工智能,甚至通用人工智能,這個問題遲早有一天要解決。PingWest品玩發(fā)現(xiàn),近日百度發(fā)布的一篇論文顯示,該公司搭建了一個 AI 系統(tǒng),組合了計算機視覺和自然語言處理兩種技術(shù),讓 AI 學會了“舉一反三”:在一個專門架設(shè)的游戲環(huán)境中,AI 控制的角色可以理解并執(zhí)行過去從未發(fā)出,也從未定義過的指令,且成功率達到了 90%。

  研究團隊由深度學習研究院杰出科學家徐偉帶領(lǐng),采用的是監(jiān)督學習和強化學習所組合的深度學習技術(shù)。研究人員設(shè)計了很簡單的游戲場景 XWORLD,在一個 8 x 8 的游戲空間,AI 控制一個主角,一些磚塊和可以“吃”的水果,位置均隨機。他們采用的訓練房室很簡單,1)直接給出一句自然語言指令,比如“請前往蘋果的位置”,然后根據(jù) AI 的行為獎罰;2)用自然語言向 AI 發(fā)問,比如“在北邊的水果是什么?”根據(jù)答案正確與否獎罰。

  至于地圖什么情況、哪些是磚塊哪些是水果、北是什么方向、蘋果長啥樣,AI 則是采用計算機視覺來進行判斷的。很快研究人員就發(fā)現(xiàn),AI 不需要以往那么多的訓練次數(shù),就可以實現(xiàn)舉一反三,準確地執(zhí)行一些從未聽過的新指令,比如“請去到無花果的西邊”、“你可以去蘋果和香蕉的中間嗎?”、“請移動到紅色/綠色的蘋果”,以及回答非指令問題,比如“靠南的水果是什么”(西瓜)。

  如果你已經(jīng)學會了怎樣用水果刀削蘋果,那你幾乎不需要指導也能用水果刀削梨和火龍果。其實這就是舉一反三,因為通過將感官獲得的資訊進行認知整合(特別是語言方面),從而實現(xiàn)知識和經(jīng)驗的遷移,對于人類而言是一件特別容易的事情。但在過去計算機一直無法實現(xiàn),除非人類對“反三”中每一種可能出現(xiàn)的狀況都預(yù)先編程。

  在徐偉團隊論文描述的實驗中,AI 系統(tǒng)能夠從訓練指令中學習語法,處理和回答新的指令、問題,意味著計算機終于首次在某種特定的環(huán)境下獲得了舉一反三的能力。機器學習中,這種能力的術(shù)語叫做“零樣本學習”(zero-shot learning ability)。

  對于這項技術(shù),接下來百度還有新的打算。除了讓 AI 在 XWORLD 環(huán)境里增加新的功能,理解更多、更復雜的指令之外,徐偉團隊還打算將它遷移到虛擬的三維空間中進行訓練,最終極目標則是在實際環(huán)境中,讓人類教師用自然語言來訓練機器人。

  不管終極目標能否實現(xiàn),至少今天,在像人類一樣學習的道路上,機器又往前邁了一步。

最新文章
1
IFA、RE+雙展亮劍全球:華寶新能重構(gòu)“從戶外到戶用”綠電生態(tài)
2
快手發(fā)布多模態(tài)大模型Keye-VL-1.5 8B性能領(lǐng)先、視頻理解能力更強
3
快手“我的哇賽時刻”公益影像展覽舉行,科技向善為鄉(xiāng)村學生架起夢想橋梁
4
2025年中德可持續(xù)發(fā)展論壇舉行,快手推動女性在經(jīng)濟轉(zhuǎn)型中穩(wěn)步發(fā)展
5
智媒融合 賦能未來 ——CCNS & ISBT 2025在烏魯木齊隆重召開
6
萬和電氣上半年業(yè)務(wù)結(jié)構(gòu)生變:廚電扛大旗,生活熱水承壓前行
7
支持雙eSIM!蘋果iPhone 17 Air首發(fā)eSIM版本
8
壁掛爐市場大盤趨穩(wěn),“家電化”引領(lǐng)下行業(yè)如何升級?
9
“三句話”說說新能源汽車產(chǎn)業(yè)發(fā)展成效
10
追覓正式官宣入局電視賽道,能否帶來差異化價值是關(guān)鍵
11
從“功能升級”到“形態(tài)革命” 分區(qū)洗護引領(lǐng)結(jié)構(gòu)性增長
12
2025冰箱能效新國標:響應(yīng)國家綠色轉(zhuǎn)型戰(zhàn)略的優(yōu)化升級
13
華為三折疊Mate XTs非凡大師明天開售:17999元起步 iPhone頂配同價
14
2025Q2中國手機出貨量排名:華為、vivo前二!小米第四
15
廠商不堆多攝了!Omdia:智能手機攝像頭數(shù)量持續(xù)下降
16
亞馬遜云科技在中國區(qū)域推出Amazon Graviton4實例 以自研芯片驅(qū)動企業(yè)算力升級
17
燃動南上海!2025“科創(chuàng)新芽”大賽啟幕,科創(chuàng)力量等你來!
18
vivo Arm聯(lián)合實驗室最新成果亮相 攜手在旗艦手機率先落地SME2創(chuàng)新技術(shù),打造更高效的端側(cè)AI異構(gòu)計算
19
讓學習回歸紙張,AI為紙張賦予智慧:愛普生x京東AI學習打印機全球首發(fā)!
20
“佳直播”攜手愛奇藝打造明星感4K超高清直播間,助力內(nèi)容電商激活商業(yè)價值
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512