技術解讀思必馳DUI標注訓練一體化平臺,語音識別全場景覆蓋
坊間總會流傳些他們的段子
格子衫、雙肩包、沉默且不茍言笑
當然,還有岌岌可危的發(fā)量(沒有,不是我說的)
那只能說,這些都是表象
堪稱新時代的中流砥柱
每天家住回龍觀,征戰(zhàn)新中關
渾身散發(fā)出高級又內斂的氣質
究竟是什么塑造的?
(一切為了工作 掙錢)
小馳捕捉到一位思必馳程序員小哥哥
今天去看看
他日常的那些“封神級”操作!
Q:一句話形容你正在做的事情?
A:人類之光…在宇宙中心呼喚AI…反正很Cool就對了
Q:最近有什么新成果嗎?
A:你光顧著關注我們發(fā)際線,不關注我們的精神成果,扣雞腿…
最近發(fā)布了DUI標注訓練一體化平臺,具體干啥的,來補課!↓↓↓
DUI標注訓練一體化平臺全場景應用,識別體驗持續(xù)提升!
思必馳DUI標注訓練一體化平臺,讓服務賦能走向能力賦能:
Q:如果我中英文摻著說,語音識別TA能聽懂嗎?
A:不同場景、環(huán)境下的語音識別效果多少會受噪聲、專業(yè)術語、多語言混合影響。契合場景來提升語音識別率,自然就能準確許多。
Q:讓場景識別率能持續(xù)提升,你們有什么“神技”傍身?
A:我們融進了最新的「端到端識別技術」來提升識別準確率,通過大規(guī)模預訓練模型技術提升語音識別后處理效果。結合「增量學習」、「主動學習」、「聯(lián)邦學習」和「小樣本遷移」等技術手段,提升用戶體驗。同時開放「端點檢測模型自訓練」、「標點斷句自訓練」等功能,讓用戶自己擁有自主權,來解決實際問題。
Q:呃…
A:好,說點你能聽懂的
高能,劃重點!
第一,關于端到端識別技術。
過往嚴格意義上的端到端識別技術,如基于LAS的端到端系統(tǒng),雖然可以較明顯地提升通用語音識別的準確率,但受限于計算復雜、自定制語言模型技術不成熟等原因,不能大規(guī)模的商用。思必馳去年推出新一代端到端語音識別建模技術,在實現(xiàn)通用識別準確率相對提升10%-15% 的同時,也提升了模型計算速度,更可以滿足快速有效的語言模型自定制。
第二,關于大規(guī)模預訓練模型技術。
要知道,語音識別系統(tǒng)中除了核心的語音識別(ASR)模型部分,語音識別的后處理模型也是十分重要的,它直接影響到識別結果的可讀性。思必馳語音識別系統(tǒng)支持「智能糾錯」、「智能標點斷句」、「智能口語順滑」、「智能語義分段」、「智能語義糾錯」等語音識別后處理技術,能進一步提升語音識別的效果與可懂度。模型采用大規(guī)模預訓練模型,結合多任務學習(Multi-Task Learning)和知識蒸餾(Knowledge Distillation)方法。在降低70%以上模型規(guī)模的條件下,提升了模型效果,運算效率大幅提升同時降低了內存開銷。
例如在智能會議場景中,通常轉寫結果是篇章段落,且多含有口語化的表達,通過我們的識別后處理功能,可以將會議轉寫結果整理成格式化,易讀易懂的會議記錄。
第三,增量學習。
受限于深度神經網絡技術中的災難性遺忘問題,采用深度學習方法的ASR建模在權衡“既要保障模型原有識別效果,又要提升新的目標場景識別效果”時,通常采用基于新舊數(shù)據(jù)混合訓練的方法。弊端是,該方法增長了模型優(yōu)化的周期,又會帶來數(shù)據(jù)安全隱患。基于思必馳自研的KDF-IL增量學習方法,在語音識別優(yōu)化時,可以僅用新增數(shù)據(jù)進行模型訓練,縮短開發(fā)周期同時,也有效保障數(shù)據(jù)安全。 第四,小樣本學習。
自研的小樣本遷移學習技術,使用少量數(shù)據(jù)就可快速實現(xiàn)場景體驗優(yōu)化。例如使用少量帶標注的文本數(shù)據(jù),即可對標點斷句模型進行優(yōu)化,相對傳統(tǒng)模式調優(yōu),節(jié)省了83%的數(shù)據(jù)量。例如,在真實的航空質檢場景中,通用的標點斷句模型面對特殊的專業(yè)術語和斷句方式,一定會水土不服。得益于小樣本遷移學習技術,在使用少量的標注文本情況下,即可實現(xiàn)F值40%左右的絕對值提升,完成體驗效果從不可用到可用的轉變。 最后,咳咳….(這個氛圍是不是該升華了)在功能層面,我們深知不同用戶的使用場景復雜多樣,單靠賦能用戶自主訓練ASR模型不能滿足需求。
我們!(升華來了)秉承以解決用戶實際問題為核心的產品理念,開放端點檢測模型自訓練、標點斷句自訓練等功能,使得用戶可以通過我們的產品,完成識別系統(tǒng)中幾乎所有模塊功能的自訓練,最大程度優(yōu)化用戶體驗。
Q:啊,真不愧是“人類之光”。求問,沒經驗可以用嗎?
A:平臺建立的出發(fā)點就是降低 AI 使用門檻,只要企業(yè)有數(shù)智化轉型的需求,我們就能匹配提供高可用定制的模型。平臺的私有化部署能力,也能將自主權交給企業(yè)自己,非AI專家都能使用,”零“學習成本。
Q:怎么合作呢?
A:平臺同時滿足「模塊化輸出」+「支持 UI可視化界面 /API輸出」這兩點,可以根據(jù)業(yè)務需求靈活配置,選擇使用一體化平臺的全部功能,或者只使用其中幾個模塊的功能。
Q:可以拓展使用嗎?
A:當然可以,「全場景覆蓋」是平臺的一大優(yōu)點。適用于各類行業(yè)場景,如會議辦公、航空通訊、智慧醫(yī)療、城市交通、數(shù)字化門店、智慧園區(qū)、線下質檢、政務、庭審等等,可以快速從當前項目復用到新項目中,形成規(guī);a定制,滿足多樣化的業(yè)務需求。
Q:怎么聯(lián)系你們呢?
如有合作意向,請發(fā)郵件
Q: 好,不愧是氣質不凡的你們!今天收獲頗豐!
A:總結下,就是我們在一個科技開放和包容的時代,和一群特別Cool的人,做了些特別Cool的產品和事情。如果你想更了解我們,歡迎隨時交流。

最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網大佬正集體殺回
- 7 L3自動駕駛延期,逼出車企技術自我淘汰
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!