平安金融壹賬通獲機器閱讀理解頂級賽事(SQuAD)世界第一
平安金融壹賬通又有重大突破!繼在人類情緒理解競賽多次登頂之后, 平安金融壹賬通Gamma Lab又在另一項國際頂級賽事上斬獲第一。近日,在由斯坦福大學(xué)發(fā)起的機器閱讀理解競賽(Stanford Question Answering Dataset,SQuAD)中,平安金融壹賬通以領(lǐng)先的技術(shù)脫穎而出,位列榜單第一位。
SQuAD被譽為自然語言處理領(lǐng)域金字塔尖的比賽,旨在促進智能搜索引擎的發(fā)展。該賽事吸引了來自谷歌、微軟亞研院、阿里達摩院、科大訊飛、IBM以及復(fù)旦大學(xué)等最頂尖的企業(yè)及學(xué)校的激烈角逐。平安金融壹賬通Gamma Lab以集成模型EM=83.435%、F1=85.992%和單模型EM=81.347%、F1:84.560%分別位列集成模型和單模型世界第一。
SQuAD機器閱讀理解競賽,是讓機器閱讀一篇文章,然后回答關(guān)于這篇文章的任何問題,旨在推動智能搜索的發(fā)展。2016年,斯坦福大學(xué)從維基百科上隨機選取了500多篇文章,并進一步細分成兩萬多個段落。隨后采用眾包的方式,由人類閱讀這些文章后,為每個段落提出五個問題,并對段落內(nèi)的答案進行人工標注,搭建了該項競賽的數(shù)據(jù)集1.1。今年6月3日,斯坦福NLP團隊對外宣稱, 機器閱讀理解數(shù)據(jù)集1.1完成一波更新,已搭建完成SQuAD 2.0。相較于SQuAD 1.1中的10萬問答,SQuAD 2.0又新增了5萬個人類撰寫的問題,而且問題不一定有對應(yīng)答案。參考下圖:
在SQuAD1.1數(shù)據(jù)集當(dāng)中,閱讀理解的主要難點是上下文的語義理解。所提問題的答案并不能靠簡單的近鄰或相似度對答案進行匹配,而是需要通過NLP的語義分析,在考慮前后文信息后從全文中尋找到最合適的答案位置。想要做好這一點,需要算法能力達到人類閱讀理解的思考水平。在此基礎(chǔ)上,SQuAD2.0中新增的無答案的混淆問題進一步提升了該任務(wù)的難度。一個問題所對應(yīng)的段落中有一定概率不存在正確結(jié)果,即要算法判斷是否能夠回答,并在此基礎(chǔ)上準確回答問題?梢哉fSQuAD數(shù)據(jù)集2.0的任務(wù)在不斷逼近人類閱讀理解的思考方式,同時也大幅提高了競賽的難度。金融壹賬通Gamma Lab在本次競賽中所獲得的成績,已經(jīng)非常接近人類水平,體現(xiàn)了世界最高水平的智能搜索能力。
早在今年年初,平安金融壹賬通就已經(jīng)謀劃布局基于機器閱讀理解技術(shù)的商業(yè)落地其,自主研發(fā)的AskBob智能搜索框架,使用了最先進的機器閱讀理解技術(shù),覆蓋了醫(yī)療、銀行、保險、投資等各大金融垂直領(lǐng)域,為知識密集型行業(yè)提供更高效更智能的搜索解決方案,極大提高了從業(yè)人員的工作效率。不僅如此, Gamma Lab還推出了一款智能音箱——Gamma智能銷售助手,也搭載了最新的機器閱讀理解技術(shù), 無需任何人工干預(yù),上傳一篇保險文檔,即可進行任何問題的語音交互問答。閱讀理解模塊只需秒級即可完成文檔的理解,問答準確率為91.35%,平均業(yè)務(wù)時間可縮短30%。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 大模型的盡頭是開源
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 華為公布昇騰芯片三年計劃,自研HBM曝光
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 7 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 8 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 9 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 10 華為已殺入!AI領(lǐng)域最熱黃金賽道,大廠的數(shù)字人美女讓我一夜沒睡著覺