谷歌正在研究能夠讓計算機(jī)合成語音更加自然的技術(shù)
3月28日,據(jù)國外媒體報道,谷歌研究院正在探索讓機(jī)器合成語音更加自然的方法。谷歌大腦和機(jī)器感知團(tuán)隊的成員本周二在博客中公布了一些能讓語音更具有表現(xiàn)力的方法示例。
同時,谷歌發(fā)布了“云端文本轉(zhuǎn)語音”服務(wù)的測試版,提供了與谷歌助手同樣的語音合成服務(wù)。該服務(wù)采用了DeepMind的WaveNet技術(shù),這個技術(shù)可以被用于生成非常自然的聲音。
有報道顯示,谷歌研究員近期發(fā)表了兩篇論文,提出了新的發(fā)音方法,介紹了如何模仿語音中的重音或語調(diào)。這兩篇論文的技術(shù)都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系統(tǒng),使用神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模仿人類語音。
Tacotron在大部分情況下都可以模擬真人聲音,但是卻無法模仿說話中的重音和自然語調(diào)。Tacotron的聯(lián)合發(fā)明人Wang Yuxuan參與了其中一篇論文研究。研究通過將人類語音片段嵌入計算機(jī)語音風(fēng)格,使合成語音中實(shí)現(xiàn)了重音等效果。另一篇論文的研究則使用無監(jiān)督訓(xùn)練和識別語音模式,并模仿某些語音風(fēng)格。
在語音技術(shù)研發(fā)上,去年蘋果Siri被眾多消費(fèi)者認(rèn)為是更加具有表現(xiàn)力的聲音。同時去年四月,亞馬遜Alexa面向語音應(yīng)用開發(fā)者提供了SSML標(biāo)簽,在語音助手中增加了更豐富的表達(dá),例如停頓、輕語,以及一些感嘆詞等。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術(shù)峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
即日-11.25立即下載>>> 費(fèi)斯托白皮書《柔性:汽車生產(chǎn)未來的關(guān)鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
-
10 每日AI全球觀察
- 1 特斯拉工人被故障機(jī)器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 硬剛英偉達(dá)!華為發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群
- 5 拐點(diǎn)已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達(dá)海爾賦能扭虧為盈
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進(jìn)軍好萊塢
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機(jī)還是轉(zhuǎn)機(jī)?
- 9 機(jī)器人9月大事件|3家國產(chǎn)機(jī)器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 生產(chǎn)部總監(jiān) 廣東省/廣州市
- 資深管理人員 廣東省/江門市
- Regional Sales Manager 廣東省/深圳市
- 銷售總監(jiān) 廣東省/深圳市
- 結(jié)構(gòu)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 自動化高級工程師 廣東省/深圳市
- 技術(shù)專家 廣東省/江門市
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 封裝工程師 北京市/海淀區(qū)