知識圖譜技術作為一門新興的技術,是人工智能技術的重要組成部分,其建立的具有語義處理能力與開放互聯(lián)能力的知識庫,可在智能搜索、智能問答、個性化推薦等智能信息服務中產(chǎn)生應用價值。就覆蓋范圍而言,知識圖譜也可分為通用知識圖譜和行業(yè)知識圖譜。通用知識圖譜注重廣度,強調融合更多的實體,較行業(yè)知識圖譜而言,其準確度不夠高,并且受概念范圍的影響,很難借助本體 庫對公理、規(guī)則以及約束條件的支持能力規(guī)范其實體、屬性、實體間的關系等。通用知識圖譜主要應用于智能搜索等領域。行業(yè)知識圖譜通常需要依靠特定行業(yè)的數(shù)據(jù)來構建,具有特定的行業(yè)意義。行業(yè)知識圖譜中,實體的屬性與數(shù)據(jù)模式往往比較豐富,需要考慮到不同的業(yè)務場景與使用人員。我國對于中文知識圖譜的研究已經(jīng)起步,并取 得了許多有價值的研究成果。
知識圖譜在于對各對象實體關系、屬性的鏈接,在互聯(lián)網(wǎng)時代,幾乎任何實體都能通過一系列的關系屬性去連接到一起,那么我們就能通過知識圖譜的搭建,去尋找之間的關系,進行一系列的推理,去預測某些知識。因此,在現(xiàn)代社會中, 知識圖譜在許多領域都能很好地發(fā)揮作用,近年來吸引了大量的研究。例如北京理工大學大數(shù)據(jù)實驗室張華平教授研發(fā)的KGB知識圖譜引擎,采用語義智能分析技術從結構化和半結構化的數(shù)據(jù)中抽取各類知識,并實現(xiàn)知識關聯(lián),推理并實現(xiàn)核查檢驗。
教育領域
在教育行業(yè)中,知識圖譜可以通過實體間的關系,來對學習路徑做一個很好的規(guī)劃。我們經(jīng)常談論個性化教育、因材施教的理念。其核心在于理解學生當前的知識體系,而且這種知識體系依賴于我們所獲取到的數(shù)據(jù)比如交互數(shù)據(jù)、評測數(shù)據(jù)、互動數(shù)據(jù)等等。為了分析學習路徑以及知識結構,我們則需要針對于一個領域的概念知識圖譜,簡單來講就是概念拓撲結構。比如為了學習邏輯回歸則需要先理解線性回歸;為了學習CNN,得對神經(jīng)網(wǎng)絡有所理解等等。所有對學生的評測、互動分析都離不開概念圖譜這個底層的數(shù)據(jù)。
證券領域
在證券領域,我們經(jīng)常會關心比如“一個事件發(fā)生了,對哪些公司產(chǎn)生什么樣的影響?” 比如有一個負面消息是關于公司1的高管,而且我們知道公司1和公司2有種很密切的合作關系,公司2有個主營產(chǎn)品是由公司3提供的原料基礎上做出來的。其實有了這樣的一個知識圖譜,我們很容易回答哪些公司有可能會被這次的負面事件所影響。當然,僅僅是“有可能”,具體會不會有強相關性必須由數(shù)據(jù)來驗證。所以在這里,知識圖譜的好處就是把我們所需要關注的范圍很快給我們圈定。接下來的問題會更復雜一些,比如既然我們知道公司3有可能被這次事件所影響,那具體影響程度有多大? 對于這個問題,光靠知識圖譜是很難回答的,必須要有一個影響模型、以及需要一些歷史數(shù)據(jù)才能在知識圖譜中做進一步推理以及計算。
領域知識圖譜目前在很多行業(yè)中已經(jīng)發(fā)揮越來越重要的作用,技術上的挑戰(zhàn)也有不斷的進展,未來還會有更多的領域知識圖譜落地,幫助推動行業(yè)應用的智能化。
更多內容可以搜索靈玖軟件-KGB知識圖譜引擎
KGB知識圖譜引擎(Knowledge Graph Builder)是基于自然語言理解、漢語詞法分析,采用KGB語法從結構化數(shù)據(jù)與非結構化文檔中抽取各類知識,大數(shù)據(jù)語義智能分析與知識推理,深度挖掘知識關聯(lián),實時高效構建知識圖譜。
KGB知識圖譜引擎核心技術與特色包括KGB知識抽取、語義智能分析、語義精準搜索等技術,基于漢語詞法分析的基礎上,采用KGB語法實現(xiàn)了實時高效的知識生成,可以從非結構化文本中抽取各類知識,并實現(xiàn)了從表格中抽取指定的內容等。