多模數(shù)據庫驅動下,助力AI逼近“人類智能”
面對新基建驅動而即將造成的數(shù)據量井噴現(xiàn)象,當下的數(shù)據庫模式將不能夠足以支撐,尤其考慮到AI正逐步落地的情況。
--全球每天生產的數(shù)據有多少?
--非常多。
依據Raconteur統(tǒng)計的數(shù)據,到2025年,全球每天預計有463 EB數(shù)據產生,相當于每天產出約2.1億張DVD碟;IDC發(fā)布的《數(shù)據時代2025》報告中也預測,全球每年產生的數(shù)據從2018年的33 ZB增長到175 ZB(1 ZB=1024 EB),以25 MB/秒的網速進行下載,需要的時間為18億年。
隨著數(shù)據量的暴增,問題逐漸暴露。
數(shù)據規(guī)模大、類型多,一站式服務需求激增
截至目前,針對海量數(shù)據的處理,業(yè)內既有的數(shù)據產品多只能解決某一類問題,譬如Hive應用于結構化數(shù)據、面向數(shù)據存儲的文檔數(shù)據庫MongDB、專注于復雜搜索需求的ElasticSearch以及圖數(shù)據庫Neo4J等等。與此同時,圍繞多種數(shù)據類型的存儲與處理需求,業(yè)內也搭建了一種混搭架構,涉及多種不同的數(shù)據庫技術,以解決不同的數(shù)據問題。
只不過,我們也可以注意到,各個數(shù)據庫可以說是各自為政的,這也使得客戶在需要使用多種數(shù)據庫產品時,需要自己重新架設一層,以解決需求被滿足時所產生的附加問題,包括數(shù)據如何在不同數(shù)據庫之間導進導出、數(shù)據在不同庫中的一致性保持、整體運維等等。
僅從文字的描述來看,就可以知道,數(shù)據庫的單一獨立使用和混合使用各有優(yōu)劣,前者操作簡單但供給不足以滿足實際應用場景的多樣化需求,后者雖然能夠滿足客戶圍繞數(shù)據產生的多樣化需求,但是操作不便、運維復雜等問題也是不可忽視的。
就當下而言,混合架構或許尚能夠應對來自產業(yè)內的多樣化數(shù)據需求,但是長久以往下去并不是一個辦法,尤其是隨著新基建的到來,于國內數(shù)據庫的發(fā)展也帶來了極大的挑戰(zhàn)。針對這個問題,騰訊云數(shù)據庫副總經理王義成指出了三點:
1、數(shù)據量出現(xiàn)全面井噴,如何滿足相應運算與分析的實時進行?
2、業(yè)務融合多樣化發(fā)出挑戰(zhàn),數(shù)據庫是否能夠接受在不同的業(yè)務中心、數(shù)據中心、基礎設施之間去做相應的部署和融合?
3、老齡化逐步演進,數(shù)據庫人才缺口可能更大,數(shù)據庫供應商如何為用戶提供多種自動化服務,以及能否為用戶的多種服務需求提供自動運維服務,實現(xiàn)整個數(shù)據的自動化治理?
從這些挑戰(zhàn)來看,鑒于數(shù)據庫與數(shù)據庫之間的不兼容,為了避免復雜操作性、實現(xiàn)成本有效降低等目的,一個面向數(shù)據層面的一站式服務平臺顯然成為一個剛需。簡單來講,在這個一站式數(shù)據服務平臺或數(shù)據庫中,用戶希望能夠以簡單的操作方式調用多數(shù)據庫的資源,并處理多種數(shù)據模型等等。
數(shù)據庫未來趨勢?提名“多模數(shù)據庫”
在提及數(shù)據庫在新基建背景下將面臨的挑戰(zhàn)時,他也指出了這一產品的兩點趨勢,一點關乎數(shù)據庫分配模式,“在數(shù)據量再擴幾倍的情況下,還能保持TP與AP的整體穩(wěn)定性和性能,這是一個大趨勢,大家也會在這個點上繼續(xù)去深耕。”
第二點上,王義成則表示隨著5G的到來,可能會有更多模式的數(shù)據庫會出來,包括圖數(shù)據庫或是更為稀奇的數(shù)據模式。
“數(shù)據庫的下一個模式會向多模方向發(fā)展。數(shù)據庫的存儲模式是不同的,但真正對于應用訪問來說,或者對于應用處理來說,需要一個更加經典化、更加統(tǒng)一的標準接口讓上層應用能夠去訪問!蓖趿x成表示,“我認為,應對5G帶來的應用爆發(fā)、數(shù)據爆發(fā),多?赡苁且粋大的趨勢點!
多模數(shù)據庫究竟是怎樣的?與現(xiàn)有的混合架構模式而言,它的優(yōu)勢體現(xiàn)在哪里?
簡單來講,多模數(shù)據庫最終體現(xiàn)的是一種數(shù)據模式的統(tǒng)一,主要形式有兩種:
一種是數(shù)據存儲為統(tǒng)一模式,可以在這一層面暴露多種協(xié)議接口類型,比如一套數(shù)據存儲,可以暴露Mongo的訪問模式,暴露MySQL的訪問模式;
另一種則是集中存儲,將不同類型的數(shù)據庫存儲道一個整體通用的數(shù)據平臺,再用一個up層,或者用一個接口層去兼容多種協(xié)議,讓所有的應用都能夠更為方便的集中于自身的數(shù)據處理跟統(tǒng)一。
相較于混合架構而言,多模數(shù)據庫在進行統(tǒng)一整合、將操作極簡化的同時,也降低了數(shù)據在不同庫之間來回遷移的成本和風險等!岸嗄(shù)據庫有可能是未來中長期相對比較的趨勢!蓖趿x成說到。
多模數(shù)據庫驅動下,助力AI逼近“人類智能”
從前面行業(yè)內人士的講解來看,在數(shù)據庫賽道中,利好多多的多模數(shù)據庫已然成為被看好的下一個趨勢。當前,在多模數(shù)據庫賽道中,包括騰訊在內,華為、阿里等大型云服務商也已經推出或即將推出有關產品。
在一些行業(yè)賽道中,尤其是那些傳統(tǒng)行業(yè),他們的數(shù)據多是分散在各個業(yè)務系統(tǒng)中,這也為他們的數(shù)據化、智能化變革道路中增添了難度。如果一個產品能夠幫助他們更快地整合數(shù)據,并能夠提供抽象化的應用接口,這必然是利好的。
用王義成的話來說,使用多模數(shù)據庫的目的之一,是解決用戶不同調用的使用習慣,助力用戶使用。而當談及落地,“多模數(shù)據庫”于AI的智能提升而言可謂一大助力。
眾所周知,AI與人類智能差距之一就是“多模態(tài)信息的智能化理解”,這其中包括視覺、聲音、符號語言、嗅覺和觸覺等信息。如果能夠像人類利用多模態(tài)數(shù)據學習知識一樣,讓AI也擁有多模態(tài)數(shù)據的學習能力,AI的智能程度必然將大大獲得提升。
然而,就目前而言,多模態(tài)AI還存在不少技術難點,其中就涉及到多模態(tài)數(shù)據的融合。具體來看,一個軟件或算法模型的進步是較為容易的,但當多個算法疊加在一起,難度的升級將會是成倍的,尤其在面對圖像、語音、觸感等非文本數(shù)據時。
就這一點來看,多模數(shù)據庫與AI可以看作是相輔相成的:利用AI算法,數(shù)據庫將能夠在現(xiàn)有基礎上獲得進一步的優(yōu)化;反過來,正是因為能夠調用多個數(shù)據庫,以及兼具的統(tǒng)一性,多模數(shù)據庫將能夠為AI算法模型提供訓練平臺,以及融合數(shù)據處理平臺,讓AI系統(tǒng)的決策更為全面和智能。
作者:韓璐

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網大佬正集體殺回
- 7 L3自動駕駛延期,逼出車企技術自我淘汰
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市