-->
微軟的新圖像字幕算法,準(zhǔn)確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡(luò)、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應(yīng)用程序使用圖像標(biāo)題作為替代文本的方式”。

微軟表示,新算法效果是當(dāng)前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應(yīng)用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機(jī)視覺為視障人士描述通過智能手機(jī)攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準(zhǔn)測試上取得了有史以來最高的分?jǐn)?shù)。nocaps基準(zhǔn)測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

最新文章
1
破解“能凍不能解”世紀(jì)難題!美菱M鮮生Ultra501S冰箱重塑家庭保鮮新標(biāo)準(zhǔn)
2
快手快聘年度紀(jì)實片:藍(lán)領(lǐng)工作《職得》被看見
3
突破行業(yè)困局 “超激鼓”技術(shù)為激光打印機(jī)行業(yè)良性發(fā)展提供新方案
4
蘋果首款智能眼鏡或2026年發(fā)布 依賴iPhone聯(lián)動
5
預(yù)計2025年家用投影市場出貨量為521.9萬臺,同比下滑16.1%
6
26年新規(guī)上線,冰箱、熱水器行業(yè)將迎來“大換血”
7
受蘋果首款折疊屏iPhone影響 預(yù)計2026年折疊屏手機(jī)出貨量暴漲近30%
8
全球2025Q3真無線耳機(jī)TOP5出爐:蘋果第一、小米第二
9
小米、格力、美的等家電廠商簽署自律公約:推進(jìn)空調(diào)“鋁代銅”
10
蘋果iOS 26.2正式版下周發(fā)布:動效絲滑流暢!8大新功能
11
每個設(shè)備都智能,為何生活更麻煩?
12
從滾筒活水洗地機(jī)市場“碾壓式領(lǐng)先”,看科沃斯的“開辟式創(chuàng)新”
13
聚焦“AI向?qū)崱保?025 TCL全球技術(shù)創(chuàng)新大會舉辦
14
5萬頁硒鼓+1200dpi!漢印“超激鼓”激光打印機(jī)上手體驗
15
徠芬也做洗地機(jī),“攪局者”還是“長跑者”?
16
多維“引擎”拉動,我國航天新質(zhì)生產(chǎn)力加速形成
17
Pro Max不再獨屬蘋果:安卓多家廠商將齊上陣
18
潛望長焦終回歸!真我16 Pro+影像配置補(bǔ)全
19
激增141%,預(yù)計2025年全球Mini LED電視出貨將突破1300萬臺
20
跨界算力遇阻?億田智能出售相關(guān)資產(chǎn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512