在安全領(lǐng)域,一個具有代表性的案例是Palantir,因通過大規(guī)模知識圖譜協(xié)助抓住了本·拉登而聲名大噪。據(jù)報道,Palantir在實戰(zhàn)中對各個區(qū)域的各類事件(武裝襲擊、爆炸、綁架等)進行大規(guī)模關(guān)聯(lián)分析,通過數(shù)據(jù)可視化鉆取和查詢,對關(guān)系挖掘與分析,找出了事件之間的因果關(guān)系鏈。
這是知識圖譜的經(jīng)典應(yīng)用案例之一,實際上,知識圖譜并不是一個全新的概念。2012年便由Google公司首先提出,知識圖譜是為了準(zhǔn)確地闡述人、事、物、地、組織等之間的關(guān)系,一般情況下,我們可以使用關(guān)系圖來表示知識圖譜,它是信息與智慧之間的一座橋梁。
近年來,隨著人工智能技術(shù)的發(fā)展,算法精度和算力不斷提升,數(shù)據(jù)來源愈發(fā)廣泛,大規(guī)模自動化的知識獲取和全新的知識表達成為可能,知識圖譜開始應(yīng)用于更多的應(yīng)用場景,成為認知智能領(lǐng)域的核心技術(shù)之一。
從看見,到讀懂,需要的是NLP技術(shù)
新一代人工智能正逐步從感知智能向認知智能發(fā)展,對于機器識別來講,不僅是會看,更要看懂并做出決策。當(dāng)人們能使用機器識別更多事物,自然而然地引發(fā)了對事物的理解分析和決策等深層次的自動化知識服務(wù)的需求。然而需要外部知識、邏輯推理或者領(lǐng)域遷移的認知智能領(lǐng)域還處于初級階段,由于知識圖譜富含實體、屬性和關(guān)系等信息,使機器理解與解釋現(xiàn)實世界成為可能。早期的知識圖譜又被稱為“知識域可視化”或“知識映射地圖”,兩者都可以利用已經(jīng)結(jié)構(gòu)化好的數(shù)據(jù)迅速搭建起來。但接下來,隨著知識圖譜構(gòu)建和應(yīng)用到了深水區(qū),從單純的知識服務(wù),逐步向決策和預(yù)測服務(wù)過渡。
從NLP的角度來看,構(gòu)建知識圖譜需要了解如何從非結(jié)構(gòu)化的文本中抽取語義和結(jié)構(gòu)化數(shù)據(jù)。目前從結(jié)構(gòu)化和半結(jié)構(gòu)化中抽取知識并構(gòu)建知識圖譜的技術(shù)已經(jīng)相對成熟,但超過80%的信息儲存于非結(jié)構(gòu)化的文本中,這就需要設(shè)計一套可靠的信息抽取技術(shù),而信息的有效抽取也是當(dāng)前NLP技術(shù)的一個痛點和難點。
智慧眼打造的云譜系列產(chǎn)品,其基礎(chǔ)底座是玄武大數(shù)據(jù)平臺,嫁接的是行業(yè)知識圖譜,同時還包括一系列的布局算法、聚類算法、最短路徑查找算法和圖計算算法。
云譜的“探索分析能力”最核心的優(yōu)勢是:無論是結(jié)構(gòu)化數(shù)據(jù),還是非結(jié)構(gòu)化數(shù)據(jù),這些信息都以知識圖譜的方式關(guān)聯(lián)起來,行業(yè)要素圖譜化,幫助“數(shù)據(jù)”到“知識”轉(zhuǎn)化,最后形成“智慧”存儲沉淀下來,為各垂直行業(yè)分析研判賦能。
從技術(shù),到應(yīng)用,云譜解析行業(yè)數(shù)字智慧化
云譜是智慧眼打造的“風(fēng)險知識一個池”中的重要部分,為事件的深度挖掘和理解提供了清楚的脈絡(luò)解析,隨著云譜平臺和應(yīng)用的不斷完善與深入,智慧眼助力智能社會、醫(yī)療健康、民生、金融等眾多領(lǐng)域應(yīng)用場景,例如圖譜研判、語音助手、聊天機器人、智能問答等。
智慧眼基于醫(yī)療知識圖譜開發(fā)出多個智能服務(wù)的應(yīng)用場景。比如,基于醫(yī)療知識圖譜的智能問答,云譜可以提升問答機器人的智能化程度。
它首先構(gòu)建疾病癥狀、藥物、病理、病因、診斷方法等相關(guān)的領(lǐng)域知識之間的關(guān)系;構(gòu)造適用于醫(yī)療圖譜信息抽取詞向量模型,通過自然語言交互的方式,滿足用戶知識獲取、業(yè)務(wù)咨詢、操作執(zhí)行等需求。在這種全新的人機交互形式下,云譜扮演著“大腦”的角色,基于知識圖譜的問答系統(tǒng),可以更好的理解問題,通過關(guān)系推理,得到更精準(zhǔn)的答案。
在安全領(lǐng)域,智慧眼云譜重點解決數(shù)據(jù)關(guān)聯(lián)性和數(shù)據(jù)價值挖掘問題,賦能線索情報分析與案件預(yù)警,輔助相關(guān)決策。
隨著跨部門、警種、業(yè)務(wù)的協(xié)同和融合作戰(zhàn)大趨勢的到來,知識圖譜能通過數(shù)據(jù)治理、數(shù)據(jù)分析、文本語義理解等技術(shù)手段,抽取出人、號、企、物、地、組織、身份標(biāo)簽等實體,并根據(jù)其中的屬性、時空、語義、特征、位置聯(lián)系等建立相互關(guān)聯(lián),構(gòu)建一張多維多層的實體與實體、實體與事件的關(guān)系網(wǎng)絡(luò)。它能實現(xiàn)重點人員場所關(guān)聯(lián)分析、物品關(guān)聯(lián)分析、團伙關(guān)系分析、異常事件挖掘、相似案件推理等功能,提升公共安全信息化的智能化水平,促進情報研判的演進,高效服務(wù)打防管控工作,甚至可達到精準(zhǔn)的犯罪預(yù)測預(yù)警。
無知識圖譜,不AI,知識圖譜是人工智能應(yīng)用鏈條的底層支撐技術(shù)和關(guān)鍵應(yīng)用。未來,智慧眼將持續(xù)在技術(shù)領(lǐng)域探究創(chuàng)新,將知識圖譜、深度學(xué)習(xí)、NLP等技術(shù)融合,推動人工智能產(chǎn)品的升級,助力智能社會建設(shè)。