楊孟翰 王方民 劉康甯 陳林
(重慶市地理信息和遙感應用中心,重慶 401147)
本文介紹了一種用于表示地理實體和社會實體的知識圖譜的本體設計和相關應用場景。傳統地理信息系統(GIS)在城市規劃、環境監測和災害管理等多個領域都扮演著重要角色。然而,當今社會的高速發展和行業融合帶來了跨領域合作的必然趨勢,也給GIS系統帶來諸多挑戰。例如,處理日益復雜的空間數據(包括衛星影像、地圖和基于位置的服務等不同類型的數據);
在整合其他領域各類數據時,遭遇越來越多的困難。通常在使用GIS 的同時,還需借助其他領域的專家進行輔助,才能實現較為復雜和跨領域的分析[1]。綜上所述,GIS 的實用性和應用范 圍受到了巨大限制。
為應對這些挑戰,研究人員開始把目光投向知識圖譜。知識圖譜是一種靈活且可擴展的數據建模和應用方式,對于多源異構數據的整合、查詢和應用分析、知識服務等方向都有非常強大的能力。知識圖譜源自人工智能領域,并由谷歌和微軟等搜索引擎推廣[2]。在知識圖譜中,信息不再以一組組不相關的數據點的形式呈現,而是以更結構化、互聯的方式來表示,同時,數據以節點及其關系和屬性的形式進行表達,從而創造出圖形結構,實現更有效的數據處理和分析。知識圖譜已經在各個領域展現了其價值,例如自然語言處理、數據集成和知識管理等[3]。
本文主要研究地理實體和社會實體知識圖譜的本體設計和應用方向。本體設計包括本體的構建方法、概念和關系的層級設計、本體設計的表達及本體的評估方法。同時本文還分析了地理實體和社會實體知識圖譜的應用方向。在研究多源異質數據融合、空間查詢、城市規劃、災害評估管理等相關應用場景后,確認了地理實體和社會實體知識圖譜的意義和發展方向。
本體是對一定范圍內的概念和關系進行知識表示的一種形式,是構建知識圖譜的關鍵。在知識圖譜中,本體主要用于定義和組織圖譜中所代表的實體和關系,以提供對不同領域的用戶和場景中實體和關系含義的共同理解,從而實現數據融合的功能[4]。本體的構建還可以確保圖譜中數據的一致性、準確性和完整性,并為有效的推理、推斷和決策提供支持[4]。所謂的 “本體庫”是指包含無數概念和概念關系的庫,本體是數據集成、共享和發現的主要工具,本體本身也可以被重復利用[5]。因此,本體設計需要相關領域的專業知識和專業的表達方式。
構建知識圖譜的本體設計目前包括自頂向下、自底向上和中間開展的方法[6]。自頂向下的方法首先需要從領域的高層次概念入手,然后逐漸建立具體和詳細的概念和關系。當領域已經被明確定義,且對需要表示的概念和關系有清晰認識時,自頂向下的方法非常有效。自底向上的方法則是從具體的實例和關系入手,然后將其歸納為更抽象的概念和關系。這種方法通??梢园l現新的概念和關系。當領域復雜而不確定時,自底向上方法的效果通常更為理想。中間開展的方法,也被稱為混合方法,結合了自頂向下和自底向上方法的特點,從提供領域一般框架的中層概念開始,隨著發現新的概念和關系的增加,添加新的概念和關系[7]。本體設計不僅需要領域專業知識,還需要專業的知識表示技能,其目的是為了定義和組織知識圖譜中所代表的實體和關系,提供對不同領域的用戶和場景中實體和關系含義的共同理解,并確保知識圖譜中數據的一致性、準確性和完整性,為有效地推理、推斷和決策提供支持[4]。本體本身可以被重復利用,構建本體庫可以促進數據集成、共享和發現[5]。
對于地理實體和社會實體知識圖譜而言,中間開展的方法是最好的選擇。這種方法適用于建立地理實體和社會實體的一般框架,同時又能夠根據發現的新概念和關系,靈活地添加新的概念和關系。地理實體和社會實體知識圖譜包含一些定義明確的概念和關系(如空間關系),也可能包含一些更復雜、不太明確的概念和關系(如社會關系)。中間開展的方法可以在本體中平衡這些不同類型的概念和關系,同時充分考慮領域的復雜性和不確定性,提高本體的準確性和完整性。因此,中間開展的方法在地理實體和社會實體知識圖譜的本體設計中具有很大的優勢。
本研究的本體設計主要包含三個方面:實體對象的層級分類設計、關系的類別設計以及屬性的設計。
本研究使用了分類法來設計實體對象的層級分類。分類法是一種基于實體共享特征或屬性進行分類和分組的方法[8]。在地理實體和社會實體知識圖譜中,對象通過分類法分為地理實體和社會實體,這兩個分類提供了對地理和社會現象的詳細描述。在地理實體的分類中,實體分為地物實體和地理單元,并對這兩個大類進一步細分,構建了詳細明確的層級結構。而在社會實體中,則根據所屬領域進行分類,如教育和法人領域等,并在每個領域進一步搭建該領域的層級和分類。這些分類和層級的設計為知識圖譜的查詢、分析和演算提供了強有力的支持,也是知識圖譜能夠被任何知識背景的用戶所使用的重要原因之一。
在本體設計中,關系類別的設計非常關鍵,它提供了實體對象間不同類型關系的框架和層級。在地理實體和社會實體知識圖譜的本體設計中,關系類別被設計為三個主要類別,即空間關系、社會關系和承載關系,每個類別又包含不同的子類別。例如,空間關系類別進一步細分為拓撲、連接、方向和距離關系,且每個子類別又包含多種具體關系,如拓撲關系包括包含、相鄰和相交等關系。這些子類別的設計讓空間關系的表示更加精準。社會關系被分為上下級關系、行業管理關系和權屬關系等,每個關系類別下都有具體的關系名稱,如上下級關系包括“上級單位”和“主管部門”等關系。地理實體和社會實體知識圖譜的關系設計還包含承載關系,該關系對于將社會實體連接到地理實體方面起著至關重要的作用。承載關系主要展示了社會實體與所處地理實體之間的關系,是空間數據和其他社會、經濟、人文等領域數據進行融合的重要途徑,可在數據中完成對真實世界的映射。這些關系類別和層級設計有助于用戶準確理解地理實體和社會實體之間的關系,并為知識圖譜的應用查詢和分析演算提供強有力的支持。部分關系設計如表1 所示。
表1 關系設計表(部分)
在地理實體和社會實體知識圖譜的本體設計中,屬性是最后一個關鍵。它提供了實體和關系的附加信息,可以是定量或定性信息,也可以是結構化或非結構化的屬性。例如,地理實體的屬性可以包括面積、長度和高程等結構化屬性,同時也可關聯非結構化屬性,如圖片、視頻和網頁等。而社會實體的屬性則可依據實體對象所屬的領域,掛接各類屬性,包括經濟屬性、法人屬性和職能職責等。需要注意,關系也可以具有屬性,這些屬性也可以包括定量或定性信息。例如,距離關系可具有“遠”“近”等定性屬性,同時也可表示兩個實體間具體的距離數值等定量屬性。部分地理實體和社會實體知識圖譜本體設計如圖1所示。
圖1 地理實體和社會實體知識圖譜本體設計(部分)
在本體的構建過程中,選擇適當的語言和軟件是確保本體準確性、一致性和可重復使用性的關鍵。目前主流的本體開發語言包括RDF、RDFS 和OWL 等[9]。其中,RDF 是一種用于表示元數據的簡單語言,而RDFS 通過詞匯表定義類和屬性擴展了RDF。而OWL 則是一種更具表現力的語言,允許定義復雜的關系和推理,因此對于復雜的概念層級和分類而言,OWL 是相對于RDF 和RDFS 更佳的選擇[10]。此外,Protégé 是一種本體編輯器和知識管理系統,支持多種本體語言,包括RDF、RDFS 和OWL。
本研究選擇OWL 和Protégé 作為地理實體和社會實體知識圖譜的本體研究和設計工具。選擇OWL 的復雜關系和推理支持能力,可以更好地表示空間數據和社會知識領域的復雜關系。而Protégé 簡單清爽的界面、廣泛的相關文檔以及對多種語言的支持,則使其成為管理和編輯地理和社會知識圖譜本體的理想選擇。
在初步的本體設計完成后,對本體進行評估和完善非常重要,確保能準確表示知識層級類別和關系,并滿足用戶和應用的需求。評估本體設計的方法有幾種,包括用戶反饋、真實數據測試以及將本體論與同一或相關領域的現有本體論進行比較[11]。
常見的一種本體設計評估方法是用戶反饋,通過收集領域專家、利益相關者和最終用戶的意見,以評估本體的清晰度、客觀性、一致性、可擴展性等[12]。通過調查訪談收集用戶反饋,可以確定需要改進或擴展的領域。另一種評估方法是使用真實數據進行測試,該方法涉及將本體論應用于實際數據集,以識別本體論中的任何不一致、錯誤或缺陷。此方法可以確保本體設計在實際應用中的實用性。
除了上述方法,將所設計的本體與同一或相關領域的現有本體進行比較,對于地理實體和社會實體知識圖譜的本體設計評估最為有效:地理相關領域已經有無數學者提供了非常優秀和詳盡的設計,許多相關的社會領域也同樣如此,為了保證能與各行各業進行跨域融合,地理實體和社會實體知識圖譜的本體設計必須要參考大量的現有本體設計。對比學習現有本體設計的方法不僅可以確定本體可能缺少的部分,而且可以使用其他本體設計中的概念或關系對所設計的本體進行補充,可以有效促進數據共享和集成[13]。
在地理相關領域,許多學者已經通過研究地理要素與地理過程的空間格局、演化過程的相互作用,從而完成相關的本體設計。此外,在地理信息行業,已經存在相當成熟的層級設計,例如開放地理空間信息聯盟(OGC)制定的《地理標記語言》(GML)標準,此標準提供了一種表示空間數據和關系的標準方法,可以作為重要的學習參考資源。在地理實體和社會實體知識圖譜本體設計中,對于地理實體的分類層級和關系設計也應與這些標準兼容,以確保其專業性,同時也可以促進與GIS 相關行業的數據共享[14]。
在各個社會領域,也有許多本體設計可供對比和借鑒。例如,Dan Brickley 和Libby Miller 發明的FOAF 詞匯表(Friend-of-a-Friend)作為本體設計的權威模板,提供了一種表示人際社交關系和連接的本體設計方法。此外,各行各業的官方文檔和研究,例如政府針對某個行業的專業指導文件,也是重要的對比和借鑒對象。通過對比學習,可以評估設計的本體的專業性和實用性[15]。通過參考、融合這些相關設計的概念和關系,地理和社會知識圖譜本體設計可以在實用性和專業性方面獲得保證,并提供與各行各業進行知識融合的強大功能。隨著地理實體和社會實體知識圖譜的不斷完善和發展,會不斷融合更多其他領域和實體知識,而本體設計作為知識圖譜的核心,決定了其質量,需要不斷迭代和完善[16]。
地理實體和社會實體知識圖譜有廣泛的應用前景,可解決多種復雜問題,如整合多源異質數據、空間查詢、城市規劃、災害評估與管理等。在這些應用中,整合多源異質數據和空間查詢是其他應用的基礎和支撐。
在傳統的地理信息系統(GIS)中,同一個實體可能在不同比例尺、圖層或產品中存在多種表示方式。這種多維數據結構使計算機難以理解這些不同圖層中的圖形其實表示同一個實體,只能通過專業人士的肉眼和大腦進行分析理解。尤其對于非常專業的查詢和分析,傳統技術手段需要非常熟悉數據存儲的專業人員來操作,極大地提高了數據應用的門檻。而當空間數據需要與其他領域的數據進行并行分析時,傳統技術手段則需要將其他領域的數據進行調整后形成新的圖層,才能與專業的空間數據一起分析比較。這些都對數據的應用和分析造成了相當多的困難。
相反,地理實體和社會實體知識圖譜將所有數據壓縮到一個平面維度,并將所有圖形、位置信息、影像和模型等與實體節點關聯。當觀察某個實體節點時,可直接通過屬性或關系探索分析。此外,承載關系將來自其他領域表示相同實體的數據集成到知識圖譜中,將空間和社會信息綁定一起,使計算機能更有效地理解或推斷數據之間的關系,并以簡潔易懂的方式呈現。
作為一種克服傳統GIS 行業瓶頸的新方法,地理和社會知識圖譜不僅具備傳統GIS 技術強大的空間查詢和運算能力,而且在基于豐富的空間關系的情境下,執行許多空間查詢和復雜分析更為簡單和有效。例如,在查詢兩個地物之間的最短通達路徑時,地理實體和社會實體知識圖譜可以像人類一樣進行思考和規劃:通過考慮起點和終點之間的相鄰關系,以及道路之間的連通關系和長度屬性,規劃出一條距離最短的路徑。而假設需要進行更加復雜的空間運算,例如“希望走一條經過較多綠化的路線”,在傳統GIS 中進行這樣的分析運算是相當復雜的。但在地理和社會知識圖譜中,僅需要在進行空間查詢時,將道路與商鋪之間的相鄰關系作為一個變量,加入分析查詢即可。
地理和社會知識圖譜具有為城市規劃提供全面和詳細視角的巨大潛力。由于具備強大的數據整合能力,它能夠將多個領域的數據通過屬性或者關系掛接到圖譜中的實體上。城市規劃設計者可以通過一個節點,訪問和分析相關的多種數據,如土地利用、交通、人口統計、社會和經濟因素、環境因素等。通過整合這些數據,城市規劃設計者可以做出科學決策。
以公共交通為例,用戶可以將表示公共交通站點的節點添加到圖譜中,并創建與直接相鄰地理實體的空間關系,讓該節點正確融入圖中,然后就可以計算該公交站點的服務范圍和覆蓋人口,從而顯著降低方案模擬的成本,并提供直觀的結果。同理,對于其他公共服務設施的選址,或現有城市設施的影響力測算等,地理和社會知識圖譜也具有強大的支撐能力。
由于整合了地理空間數據和社會各領域的相關數據,地理實體和社會實體知識圖譜在災害評估和管理中,可以提供受災區域的全局視角和細節分析。例如,在地震發生時,地理和社會知識圖譜除了能夠迅速查詢受災區域建筑、設施和道路的具體信息,還能快速統計受災區域的人口分布和密度,以及應急機構、賑災資源和應急場所等信息,然后快速計算出最佳救援方案,如救援工作的任務分工、考慮到破損設施的最佳救援路線,以及受災人群的安置方案等。
綜上所述,地理實體和社會實體知識圖譜在地理和社會數據的表示和分析方面有巨大潛力,為多元異質數據整合、空間查詢、城市規劃和災害評估管理提供了強大工具。除了上述應用場景,地理實體和社會實體知識圖譜在理論上可為任何與地理位置相關的應用提供服務,如生物事件、治安管理等。通過發揮地理實體和社會實體知識圖譜的力量,決策者可設計出更宜居、更安全的城市環境,更有效地應對各類情況。
知識圖譜是地理信息行業所面臨挑戰的潛在解決方案,它提供了一種更靈活和可擴展的方式來建模和整合不同的源數據。本文探討了一種地理實體和社會實體知識圖譜本體設計實現方案和應用方向,詳細介紹了地理實體和社會實體知識圖譜本體設計,重點關注了實體對象類型、關系類型和屬性選擇,還討論了知識圖譜在解決傳統地理信息行業所面臨的挑戰以及未來研究方向的潛力??偟膩碚f,利用知識圖譜來關聯、展示和分析地理實體和社會實體是一個具有許多潛在應用和未來發展方向的研究領域。
猜你喜歡本體圖譜實體繪一張成長圖譜少先隊活動(2020年12期)2021-01-14前海自貿區:金融服務實體中國外匯(2019年18期)2019-11-25實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式哲學評論(2017年1期)2017-07-31補腎強身片UPLC指紋圖譜中成藥(2017年3期)2017-05-17兩會進行時:緊扣實體經濟“釘釘子”領導決策信息(2017年9期)2017-05-04振興實體經濟地方如何“釘釘子”領導決策信息(2017年9期)2017-05-04基于本體的機械產品工藝知識表示制造業自動化(2017年2期)2017-03-20主動對接你思維的知識圖譜領導科學論壇(2016年9期)2016-06-05《我應該感到自豪才對》的本體性教學內容及啟示文學教育(2016年27期)2016-02-28專題圖書與情報(2013年1期)2013-11-16