百度ai系列研究之自研圖數(shù)據(jù)庫BGraph
每周一篇原創(chuàng),關(guān)注5G、物聯(lián)網(wǎng)、人工智能,跟著我堅持利用碎片時間學(xué)習(xí)
簡介
今天我們進入知識圖譜的學(xué)習(xí),知識圖譜是人工智能的一個重要分支,當(dāng)前場景應(yīng)用正在不斷豐富。其中最核心的是圖數(shù)據(jù)庫,百度自研商業(yè)圖數(shù)據(jù)庫 BGraph 支持業(yè)界流行 Property Graph 模型和Gremlin語言(并進行擴展),在檢索和實時深度連接分析上具有極高的性能。BGraph 具有高可用性,提供復(fù)制和分片技術(shù)進行分布式擴展,支持批量加載和實時更新,從而使您能夠輕松構(gòu)建基于圖數(shù)據(jù)庫的企業(yè)級應(yīng)用,實時分析關(guān)聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)價值。
圖來自百度官網(wǎng)
應(yīng)用場景
欺詐檢測:通過深度關(guān)聯(lián)分析實時的檢測欺詐模式,從而構(gòu)建反欺詐應(yīng)用。例如分析購買和轉(zhuǎn)賬關(guān)系是否有環(huán),判斷是否刷單作弊或惡意套現(xiàn)
企業(yè)圖譜:企業(yè)圖譜應(yīng)用將企業(yè)的董監(jiān)高等信息以及企業(yè)之間關(guān)系存儲在圖數(shù)據(jù)庫中,然后使用圖查詢?nèi)娴姆治錾虡I(yè)機會和商業(yè)風(fēng)險
公共安全:構(gòu)建公共安全領(lǐng)域知識圖譜,挖掘人物、事件、地點及其關(guān)聯(lián)數(shù)據(jù),利用專家經(jīng)驗和機器學(xué)習(xí)技術(shù),支撐公安機關(guān)開展嫌犯追蹤、案件分析和重大事件預(yù)警等工作
智能運維:智能運維平臺將網(wǎng)絡(luò)設(shè)備和服務(wù)關(guān)聯(lián)等信息存儲在圖數(shù)據(jù)庫中,可以通過圖查詢和圖計算來規(guī)劃路由、診斷故障和收斂報警等
技術(shù)特點
高性能:自研的圖存儲和計算引擎,針對檢索和深度連接分析做優(yōu)化,并用C++ 實現(xiàn),具有毫秒級查詢響應(yīng),并能支持數(shù)萬的QPS
高擴展:能支持數(shù)億級頂點的圖數(shù)據(jù),能通過分片和副本分布式可擴展,滿足業(yè)務(wù)的快速增長
高可用:BGraph 支持多實例副本,具有實時容錯能力,單實例的故障不會影響查詢服務(wù),旨在提供超過 99.99% 的可用性
開放性:支持業(yè)界流行的 Property Graph 數(shù)據(jù)模型和 Gremlin查詢語言,并對Gremlin進行擴展,支持特色的高性能圖算法
常見圖數(shù)據(jù)庫
Neo4j是一個流行的圖形數(shù)據(jù)庫,它是開源的。最近,Neo4j的社區(qū)版已經(jīng)由遵循AGPL許可協(xié)議轉(zhuǎn)向了遵循GPL許可協(xié)議。盡管如此,Neo4j的企業(yè)版依然使用AGPL許可。Neo4j基于Java實現(xiàn),兼容ACID特性,也支持其他編程語言,如Ruby和Python。
FlockDB是Twitter為進行關(guān)系數(shù)據(jù)分析而構(gòu)建的。FlockDB迄今為止還沒有穩(wěn)定的版本,對于它是否是一個真正的圖形數(shù)據(jù)庫,尚有爭議。FlockDB和其它圖形數(shù)據(jù)庫(如Neo4j、OrientDB)的區(qū)別在于圖的遍歷,Twitter的數(shù)據(jù)模型不需要遍歷社交圖譜。盡管如此,由于FlockDB應(yīng)用于Twitter這樣的大型站點,以及它相比其它圖形數(shù)據(jù)庫的簡潔性,仍然值得我們值得關(guān)注。
AllegroGrap是一個基于W3c標準的為資源描述框架構(gòu)建的圖形數(shù)據(jù)庫。它為處理鏈接數(shù)據(jù)和Web語義而設(shè)計,支持SPARQL、RDFS++和Prolog。
GraphDB是德國sones公司在.NET基礎(chǔ)上構(gòu)建的。Sones公司于2007年成立,近年來陸續(xù)進行了幾輪融資。GraphDB社區(qū)版遵循AGPL v3許可協(xié)議,企業(yè)版是商業(yè)化的。GraphDB托管在Windows Azure平臺上。
InfiniteGraph基于Java實現(xiàn),它的目標是構(gòu)建“分布式的圖形數(shù)據(jù)庫”,已被美國國防部和美國中央情報局所采用。除此之外,還有其他一些圖形數(shù)據(jù)庫,如OrientDB、InfoGrid和HypergraphDB。Ravel構(gòu)建在開源的Pregel實現(xiàn)之上,微軟研究院的Trinity項目也是一個圖形數(shù)據(jù)庫項目。
百度開源的分布式圖數(shù)據(jù)庫。支持標準的Apache Tinkerpop Gremlin圖查詢語言,支持屬性圖,可支持千億級規(guī)模關(guān)系數(shù)據(jù);支持多種后端存儲(Cassandra,HBase,RocksDB,MySQL,PostgreSQL,ScyllaDB);支持各類索引(二級索引、范圍索引、全文索引、聯(lián)合索引,均無需依賴第三方索引庫);提供可視化的Web界面,可用于圖建模、數(shù)據(jù)導(dǎo)入、圖分析;提供導(dǎo)入工具支持從多種數(shù)據(jù)源中導(dǎo)入數(shù)據(jù)到圖中,支持的數(shù)據(jù)源包括:CSV、HDFS、關(guān)系型數(shù)據(jù)庫(MySQL、Oracle、SQL Server、PostgreSQL);支持REST接口,并提供10+種通用的圖算法;支持與Hadoop、Spark GraphX等大數(shù)據(jù)系統(tǒng)集成。
免責(zé)聲明:
本公眾號為個人研究專題學(xué)習(xí)分享,非商業(yè)公眾號無任何商業(yè)目的,如果文章內(nèi)容有侵權(quán)或者非法信息,請立即與本號聯(lián)系刪除謝謝

最新活動更多
推薦專題
-
9 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 9 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 生產(chǎn)部總監(jiān) 廣東省/廣州市
- 資深管理人員 廣東省/江門市
- Regional Sales Manager 廣東省/深圳市
- 銷售總監(jiān) 廣東省/深圳市
- 結(jié)構(gòu)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 自動化高級工程師 廣東省/深圳市
- 技術(shù)專家 廣東省/江門市
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 封裝工程師 北京市/海淀區(qū)