快手Kwai Agents系統(tǒng)、模型、數(shù)據(jù)全部開源
7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測(cè)發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場(chǎng)地,連當(dāng)天的天氣都幫你考慮周到了。 大語言模型(LLM)通過對(duì)語言的建模而掌握了大量知識(shí),并具備一定認(rèn)知和推理能力。但由于無法跟世界保持實(shí)時(shí)的交互,在單獨(dú)使用的情況下,常會(huì)出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個(gè)問題的道路之一,它通過激發(fā)大模型任
2024-01-04 19:15:36
來源:丁科技網(wǎng)??

7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測(cè)發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場(chǎng)地,連當(dāng)天的天氣都幫你考慮周到了。

大語言模型(LLM)通過對(duì)語言的建模而掌握了大量知識(shí),并具備一定認(rèn)知和推理能力。但由于無法跟世界保持實(shí)時(shí)的交互,在單獨(dú)使用的情況下,常會(huì)出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個(gè)問題的道路之一,它通過激發(fā)大模型任務(wù)規(guī)劃、反思、調(diào)用工具等能力,使大模型能夠借助現(xiàn)實(shí)世界工具提升生成內(nèi)容的準(zhǔn)確性,甚至有能力解決復(fù)雜問題。

據(jù)了解,KwaiAgents是一個(gè)先進(jìn)的AI智能體系統(tǒng),由快手聯(lián)合哈爾濱工業(yè)大學(xué)研發(fā),通過使用大型語言模型來模仿人類認(rèn)知技能,可應(yīng)用于自然語言處理、語音識(shí)別等領(lǐng)域。Kwai Agents可以使7B/13B的“小”大模型也能達(dá)到超越GPT-3.5的效果,目前該項(xiàng)目已將系統(tǒng)、模型、數(shù)據(jù)、評(píng)測(cè)全部開源,使得更多的研究人員可以參與其中。

技術(shù)報(bào)告:https://arxiv.org/abs/2312.04889

項(xiàng)目主頁:https://github.com/KwaiKEG/KwaiAgents

從「KwaiAgents」的Github主頁中可以看到,本次開源內(nèi)容包含:

1.系統(tǒng)(KAgentSys-Lite):輕量級(jí)AI Agents系統(tǒng),并配備事實(shí)、時(shí)效性工具集;

2.模型(KAgentLMs):Meta-Agent Tuning后,具有Agents通用能力的系列大模型及其訓(xùn)練數(shù)據(jù);

3.評(píng)測(cè)(KAgentBench):開箱即用的Agent能力自動(dòng)化評(píng)測(cè)Benchmark與人工評(píng)測(cè)結(jié)果。

KAgentBench通過人工精細(xì)化標(biāo)注的上千條數(shù)據(jù),做到了開箱即用,讓大家能夠用一行命令評(píng)測(cè)一個(gè)大模型在不同模板下,各方面的Agents能力。下表顯示了經(jīng)過快手團(tuán)隊(duì)調(diào)優(yōu)后,7B-13B模型各項(xiàng)能力的提升,且超越了GPT-3.5的效果:

同時(shí),作者們還請(qǐng)人類標(biāo)注者在200個(gè)事實(shí)性和時(shí)效性的問題(如“劉德華今年幾歲了”),對(duì)不同的大模型和Agent系統(tǒng)進(jìn)行了交叉評(píng)估,可以看到KAgentSys系統(tǒng)和MAT之后模型提升顯著(百分號(hào)前為正確率,括號(hào)內(nèi)為5分制均分)。

通常僅依賴網(wǎng)頁搜索對(duì)一些長尾問題和熱門問題返回結(jié)果不佳。比如問到“安東內(nèi)拉比梅西大多少天?”這類長尾問題,往往搜索結(jié)果返回的都是一些兩者的八卦新聞,而返回不了一些關(guān)鍵信息。而KAgentSys 通過調(diào)用百科搜索工具獲取精準(zhǔn)的出生日期,再調(diào)用time_delta時(shí)間差工具算出年齡差,就能精準(zhǔn)回答這個(gè)問題了。

快手技術(shù)人員表示,AI Agents是一條非常有潛力的道路,未來一方面會(huì)在這個(gè)方向持之以恒地沉淀核心技術(shù),并為整個(gè)社區(qū)不斷地注入新的活力;另一方面,也會(huì)積極探索Agents技術(shù)與快手業(yè)務(wù)的結(jié)合,嘗試更多有趣、有價(jià)值的創(chuàng)新應(yīng)用落地。

原創(chuàng)文章
最新文章
1
20多家主流券商集體“看多”背后:海信電視“長期價(jià)值”浮現(xiàn)
2
家電巨頭步入全球化深水區(qū) 美的海爾格力上半年海外收入如何?
3
2025半年報(bào)揭曉:白電三巨頭競(jìng)爭(zhēng)格局分化加劇
4
iPhone 17系列爆料匯總:Air極致輕薄、Pro獨(dú)占A19 Pro芯片與灰色回歸
5
iOS26系統(tǒng)前瞻:液態(tài)玻璃設(shè)計(jì)革新,AI與CarPlay成重頭戲
6
最新安卓旗艦性能榜出爐:紅魔最強(qiáng)游戲手機(jī)第一
7
全球首款闊折疊手機(jī) 華為Pura X出貨量超70萬臺(tái)
8
老板電器上半年?duì)I收利潤下滑,廚電業(yè)怎么了?
9
家電三巨頭半年業(yè)績分化,這三點(diǎn)決定增長質(zhì)量和未來潛力
10
vivo Y500發(fā)布:vivo史上最強(qiáng)藍(lán)海電池,續(xù)航耐用雙滅霸
11
追覓凈水構(gòu)建智慧水健康生態(tài)系統(tǒng),全系頂配新品9月4日亮相
12
海信視像獲社保基金增持 20多家主流券商機(jī)構(gòu)給予“看好”評(píng)級(jí)
13
為全球制造業(yè)高質(zhì)量發(fā)展注入新動(dòng)能:工業(yè)AI超級(jí)大腦TPT 2有望重塑生產(chǎn)范式
14
可靈AI“靈感工坊”沙龍登陸成都,重磅升級(jí)創(chuàng)作者計(jì)劃
15
以火鍋為媒促消費(fèi) 快手成都熱辣火鍋節(jié)激活城市文旅新活力
16
技術(shù)全面碾壓!三筒發(fā)明者Leader又發(fā)升級(jí)款狙擊同行跟進(jìn)
17
創(chuàng)維集團(tuán)發(fā)布2025中期業(yè)績:總營收穩(wěn)增逾兩成,新能源與全球化雙引擎動(dòng)力十足
18
新石器無人車亮相百度云智大會(huì),生態(tài)合作加速技術(shù)升級(jí)
19
科技賦能行業(yè)革新!長虹空調(diào)榮膺“數(shù)字生態(tài)大會(huì)”雙項(xiàng)標(biāo)桿榮譽(yù)
20
國內(nèi)首個(gè)混合碳化硅產(chǎn)品實(shí)現(xiàn)量產(chǎn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512