123,123,123

平安金融壹賬通獲機器閱讀理解頂級賽事(SQuAD)世界第一

2018-12-04 09:58

平安金融壹賬通又有重大突破！繼在人類情緒理解競賽多次登頂之后，平安金融壹賬通Gamma Lab又在另一項國際頂級賽事上斬獲第一。近日，在由斯坦福大學發(fā)起的機器閱讀理解競賽（Stanford Question Answering Dataset，SQuAD）中，平安金融壹賬通以領先的技術脫穎而出，位列榜單第一位。

SQuAD被譽為自然語言處理領域金字塔尖的比賽，旨在促進智能搜索引擎的發(fā)展。該賽事吸引了來自谷歌、微軟亞研院、阿里達摩院、科大訊飛、IBM以及復旦大學等最頂尖的企業(yè)及學校的激烈角逐。平安金融壹賬通Gamma Lab以集成模型EM＝83．435％、F1＝85．992％和單模型EM＝81．347％、F1：84．560％分別位列集成模型和單模型世界第一。

平安金融壹賬通獲機器閱讀理解頂級賽事(SQuAD)世界第一

SQuAD機器閱讀理解競賽，是讓機器閱讀一篇文章，然后回答關于這篇文章的任何問題，旨在推動智能搜索的發(fā)展。2016年，斯坦福大學從維基百科上隨機選取了500多篇文章，并進一步細分成兩萬多個段落。隨后采用眾包的方式，由人類閱讀這些文章后，為每個段落提出五個問題，并對段落內的答案進行人工標注，搭建了該項競賽的數(shù)據(jù)集1．1。今年6月3日，斯坦福NLP團隊對外宣稱，機器閱讀理解數(shù)據(jù)集1．1完成一波更新，已搭建完成SQuAD 2．0。相較于SQuAD 1．1中的10萬問答，SQuAD 2．0又新增了5萬個人類撰寫的問題，而且問題不一定有對應答案。參考下圖：

平安金融壹賬通獲機器閱讀理解頂級賽事(SQuAD)世界第一

在SQuAD1．1數(shù)據(jù)集當中，閱讀理解的主要難點是上下文的語義理解。所提問題的答案并不能靠簡單的近鄰或相似度對答案進行匹配，而是需要通過NLP的語義分析，在考慮前后文信息后從全文中尋找到最合適的答案位置。想要做好這一點，需要算法能力達到人類閱讀理解的思考水平。在此基礎上，SQuAD2．0中新增的無答案的混淆問題進一步提升了該任務的難度。一個問題所對應的段落中有一定概率不存在正確結果，即要算法判斷是否能夠回答，并在此基礎上準確回答問題�？梢哉fSQuAD數(shù)據(jù)集2．0的任務在不斷逼近人類閱讀理解的思考方式，同時也大幅提高了競賽的難度。金融壹賬通Gamma Lab在本次競賽中所獲得的成績，已經非常接近人類水平，體現(xiàn)了世界最高水平的智能搜索能力。

早在今年年初，平安金融壹賬通就已經謀劃布局基于機器閱讀理解技術的商業(yè)落地其，自主研發(fā)的AskBob智能搜索框架，使用了最先進的機器閱讀理解技術，覆蓋了醫(yī)療、銀行、保險、投資等各大金融垂直領域，為知識密集型行業(yè)提供更高效更智能的搜索解決方案，極大提高了從業(yè)人員的工作效率。不僅如此， Gamma Lab還推出了一款智能音箱——Gamma智能銷售助手，也搭載了最新的機器閱讀理解技術，無需任何人工干預，上傳一篇保險文檔，即可進行任何問題的語音交互問答。閱讀理解模塊只需秒級即可完成文檔的理解，問答準確率為91．35％，平均業(yè)務時間可縮短30％。