“你不溫柔,我不主動”,人機關系究竟要怎么改變呢?
但實踐下來發(fā)現(xiàn),這種模式問題還是不少:
比如語言控制不如屏幕控制那么精準,很多時候會誤判指令和錯誤喚醒,比較語言充滿了不確定性;
再比如,語音交互的物聯(lián)網(wǎng)設備還是缺乏主動服務的能力,只是換了操作方式而已,用戶體驗沒有本質(zhì)提升。
僅僅是“能聽”,并且還經(jīng)常聽錯的物聯(lián)網(wǎng)設備,就像是兩個人談戀愛,其中一方從來不看你,不會知冷知熱、噓寒問暖,還經(jīng)常搞錯對方的意思,那另一方當然表示我懶得理你……
目前來看,把按鈕換成了語音命令平臺,隱藏的不確定性太多,而實際價值太少,很難成為物聯(lián)網(wǎng)爆發(fā)的真正依托。
這種“你不溫柔我不主動”的人機關系究竟怎么改變呢?
答案也許是讓機器能夠聽和說之外,還要能看,能感覺,甚至能將五感聯(lián)系到一起進行思考。
感知到交互:機器的五感俱全
所謂“模態(tài)modality”,是德國生理學家赫爾姆霍茨提出一種生物學概念。即生物憑借感知器官與經(jīng)驗來接受信息的通道,比如人類有視覺模態(tài)、聽覺模態(tài)等等。
后來這個概念引申到人文科學領域,成為哲學和文學上的一種話語批評方式;而來到機器人和計算機科學領域,就成了機器與物理世界聯(lián)系的通道。
假如我們把“模態(tài)”通俗地理解為感官,那么智能音箱就是只具備聽覺模態(tài)的物聯(lián)網(wǎng)設備,而加載AI分析能力的攝像頭可以視為視覺模態(tài)的物聯(lián)網(wǎng)設備。把聽覺、視覺甚至更多模態(tài)組合到一起,多模態(tài)物聯(lián)網(wǎng)也就誕生了。
事實上,在AI研究當中多模態(tài)轉換是非常普遍的課題。比如一個很出名的AI研究方向是讓智能體根據(jù)看到的某張圖片來生成文字(也有看到文字生成圖片和視頻的),這就是讓AI模型完成在視覺和語義之間的模態(tài)轉換。
運用到物聯(lián)網(wǎng)設備當中,今天主要的AI感知模態(tài)有三種:
1.語音交互,包括語音指令控制、語義理解、多輪對話、NLP、語音精準識別等領域;
2. 機器視覺,包括自然物體識別、人臉識別、肢體動作識別等;
3. 傳感器智能,包括AI對熱量、紅外捕捉信號、空間信號的閱讀與理解。
把這三種東西融合在一起,物聯(lián)網(wǎng)設備就可以在單純的能聽會說之外,同時還用攝像頭觀察、用傳感器判斷。而比較前沿的多模態(tài)感知研究當中,還包括機器嗅覺,機器觸覺和情緒理解等內(nèi)容。
我們在等待的下一代物聯(lián)網(wǎng)設備,很可能訣竅就是把這些模態(tài)給揉在一起,完成從多模態(tài)感知到多模態(tài)交互的體驗。用一句我們十分熟悉的話說,就是要讓機器身上的五感“生態(tài)化反”……
今天讓人樂觀的多模態(tài)交互型IoT
又能聽,又能看,又有傳感器的設備,聽上去似乎有點過分樂觀了。但好在綜合了較多采訪與觀察之后,我們發(fā)現(xiàn)今年確實是值得為多模態(tài)物聯(lián)網(wǎng)設備樂觀一下的時候。
可以看到,很多雙模態(tài)交互,甚至多模態(tài)混合交互的解決方案都在從實驗室里走出來,甚至已經(jīng)可以在我們生活中看到。這些解決方案更重要價值是作為案例,可以讓更多企業(yè)、開發(fā)者和垂直行業(yè)看到多模態(tài)物聯(lián)網(wǎng)的可復制價值。
舉例來說,離我們最近的多模態(tài)AI交互技術投射在物聯(lián)網(wǎng)設備上,大概就是用機器視覺技術進行嘴唇識別,來分離語音交互指令。我們可以看到很多實驗室和科技公司,都在嘗試用機器視覺來讀取說話人的唇語和動作,從而判斷每個聲音指令的來源。
這種技術已經(jīng)在國內(nèi)被運用到地鐵售票解決方案中,通過機器視覺來識別買票人,從而在地鐵站的嘈雜環(huán)境中完成語音售票。
另一個我們能看到的例子是空調(diào)。在一些新的智能空調(diào)解決方案中,空調(diào)會在語音交互的基礎上通過機器視覺來判斷用戶的位置,提供智能送冷,并且會結合傳感器判斷屋內(nèi)溫度和濕度,提供更精準的環(huán)境方案。
同樣是在家電上,今年電視背后的AI平臺戰(zhàn)打得風生水起,把機器視覺技術引入電視成為了新的趨勢。通過機器視覺來讓電視觀察屋內(nèi)照明情況、用戶與電視的距離,電視可以主動調(diào)節(jié)屏幕光線強度,輸出比較護眼的模式。還有的AI應用是讓電視在觀察到兒童看電視后主動開啟童鎖。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產(chǎn)未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 L3自動駕駛延期,逼出車企技術自我淘汰
- 7 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市