公務(wù)員期刊網(wǎng) 論文中心 正文

審計(jì)知識(shí)圖譜構(gòu)建分析

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了審計(jì)知識(shí)圖譜構(gòu)建分析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

審計(jì)知識(shí)圖譜構(gòu)建分析

摘要:隨著審計(jì)業(yè)務(wù)復(fù)雜性和數(shù)據(jù)體量的范圍呈指數(shù)級(jí)別的增長(zhǎng),傳統(tǒng)審計(jì)逐漸難以滿足信息化查詢和審計(jì)可視化的現(xiàn)實(shí)需求。知識(shí)圖譜融合大數(shù)據(jù)和人工智能的前沿技術(shù),為組織、管理和理解互聯(lián)網(wǎng)海量信息等提供了強(qiáng)大的功能。本文基于Neo4j圖數(shù)據(jù)庫(kù)進(jìn)行審計(jì)知識(shí)數(shù)據(jù)的清洗、知識(shí)三元組的構(gòu)建、存儲(chǔ),并完成審計(jì)領(lǐng)域的知識(shí)圖譜,有助于企業(yè)和相關(guān)部門運(yùn)用審計(jì)知識(shí)圖譜,將傳統(tǒng)的業(yè)務(wù)推動(dòng)數(shù)據(jù)模式轉(zhuǎn)化為數(shù)據(jù)推動(dòng)業(yè)務(wù)模式,提高審計(jì)效率,挖掘不易發(fā)現(xiàn)的數(shù)據(jù)式審計(jì)證據(jù),為審計(jì)需求相關(guān)方的決策提供參考價(jià)值。

關(guān)鍵詞:知識(shí)圖譜;三元組;注冊(cè)會(huì)計(jì)師;圖關(guān)系數(shù)據(jù)庫(kù);Neo4j

知識(shí)圖譜(KnowledgeGraph)是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,又被稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。隨著大數(shù)據(jù)技術(shù)的發(fā)展以及海量數(shù)據(jù)轉(zhuǎn)化為知識(shí)時(shí)代的到來(lái),知識(shí)圖譜技術(shù)能夠從海量非結(jié)構(gòu)化數(shù)據(jù)(如文本和圖像)和結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行知識(shí)獲取、知識(shí)共享,并在大數(shù)據(jù)時(shí)代進(jìn)行知識(shí)創(chuàng)新。知識(shí)圖譜可以高效、直觀地描繪出目標(biāo)對(duì)象(如企業(yè),事件等)之間的相關(guān)網(wǎng)絡(luò),并在多維視角實(shí)現(xiàn)對(duì)象的真實(shí)情況和錯(cuò)綜復(fù)雜的關(guān)系。在企業(yè)的實(shí)際業(yè)務(wù)中,面對(duì)海量繁多的財(cái)務(wù)會(huì)計(jì)憑證、賬簿、報(bào)表及電子數(shù)據(jù)等信息,審計(jì)人員常常通過(guò)抽查來(lái)發(fā)現(xiàn)問(wèn)題。知識(shí)圖譜技術(shù)的出現(xiàn),提供了更高效的審計(jì),提高審計(jì)工作效率,可以作為經(jīng)典審計(jì)方法的補(bǔ)充,在理想情況下甚至可以做到全面排查總體,這樣不僅能避免審計(jì)抽樣的風(fēng)險(xiǎn),同時(shí)也降低了審計(jì)工作的復(fù)雜性和總體風(fēng)險(xiǎn)。本文基于百度問(wèn)答的數(shù)據(jù),對(duì)審計(jì)領(lǐng)域的一些常見(jiàn)知識(shí)進(jìn)行了收集,基于多源異構(gòu)審計(jì)數(shù)據(jù),構(gòu)建了結(jié)構(gòu)化審計(jì)數(shù)據(jù)庫(kù),并通過(guò)可視化工具,進(jìn)行初步的可視化分析產(chǎn)生可視化圖表,對(duì)審計(jì)信息進(jìn)行分析和使用,有助于審計(jì)信息使用者快速了解特定領(lǐng)域的審計(jì)知識(shí),為審計(jì)需求相關(guān)方的決策提供參考價(jià)值。

一、研究回顧

知識(shí)圖譜的應(yīng)用大概分為通用知識(shí)領(lǐng)域和行業(yè)知識(shí)領(lǐng)域。通用知識(shí)領(lǐng)域的應(yīng)用主要包括智能問(wèn)答系統(tǒng),如Google。Google知識(shí)圖譜是在Freebase的基礎(chǔ)上研發(fā)的,F(xiàn)reebase是由KurtBollacker,RobertCook,PatrickTufts(2007)提出的通用人類知識(shí)數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)具有實(shí)用、可擴(kuò)展、圖形化、結(jié)構(gòu)化的特點(diǎn),其靈感來(lái)自于語(yǔ)義Web研究和協(xié)作數(shù)據(jù)通信,如Wikipedia。Freebase允許通過(guò)HTTP的圖形查詢API進(jìn)行公共讀寫(xiě)訪問(wèn),用于研究、創(chuàng)建和維護(hù)結(jié)構(gòu)化數(shù)據(jù)以及應(yīng)用程序構(gòu)建。近年來(lái),國(guó)內(nèi)學(xué)者還開(kāi)發(fā)出一款類似Google的大規(guī)模開(kāi)放知識(shí)圖譜---Zhishi.me。Zhishi.me是從互動(dòng)百科、百度百科和中文維基百科中提取實(shí)體信息,并協(xié)調(diào)來(lái)自各個(gè)來(lái)源的知識(shí)以獲得規(guī)范的數(shù)據(jù)集,該圖譜的規(guī)模雖不及Google研發(fā)的知識(shí)圖譜,但是卻也包含大約1000萬(wàn)個(gè)實(shí)體(周盛威,2018)。知識(shí)圖譜行業(yè)知識(shí)領(lǐng)域的應(yīng)用主要有醫(yī)學(xué)領(lǐng)域、金融領(lǐng)域等。醫(yī)學(xué)領(lǐng)域方面,張崇宇(2019)提出面向臨床醫(yī)療知識(shí)圖譜的自動(dòng)問(wèn)答方法,主要依托于構(gòu)建的臨床醫(yī)療知識(shí)圖譜的實(shí)體、關(guān)系及屬性,通過(guò)數(shù)據(jù)冷啟動(dòng)機(jī)制生成語(yǔ)料,然后基于一種網(wǎng)格Bi-LSTM-CRF算法的醫(yī)療實(shí)體識(shí)別和基于字-詞編碼CNN模型的關(guān)系/屬性映射方法來(lái)完成問(wèn)題的語(yǔ)義解析任務(wù)。然后通過(guò)業(yè)務(wù)分流和查詢邏輯轉(zhuǎn)換為Neo4j圖數(shù)據(jù)庫(kù),最終實(shí)現(xiàn)醫(yī)療應(yīng)用場(chǎng)景的知識(shí)圖譜自動(dòng)問(wèn)答系統(tǒng)。在金融領(lǐng)域方面,張蕓蕓、方勇、黃誠(chéng)(2018)提出基于Neo4j圖譜檢測(cè)信用卡欺詐的方法,通過(guò)圖數(shù)據(jù)庫(kù)直觀顯示數(shù)據(jù)集的特征,并通過(guò)FICO評(píng)分標(biāo)準(zhǔn)建立FICO模型,研究表明,該方法可以顯著提高信用卡欺詐的識(shí)別率。信息可視化在可視化技術(shù)中占有重要地位,通過(guò)將抽象數(shù)據(jù)進(jìn)行可視化展示,從而加強(qiáng)人們對(duì)數(shù)據(jù)的認(rèn)知及數(shù)據(jù)獲取效率。Bernal于1938年繪制學(xué)科圖譜,但知識(shí)圖譜在我國(guó)于2005年開(kāi)始流行,相比于國(guó)外興起較晚。目前,國(guó)內(nèi)外關(guān)于知識(shí)圖譜的可視化工具層出不窮。國(guó)外最為經(jīng)典的知識(shí)圖譜可視化分析軟件是CiteSpace,它是一款針對(duì)科學(xué)文獻(xiàn)的可視化分析工具,用于計(jì)量特定領(lǐng)域的文獻(xiàn),從而探尋該學(xué)科的發(fā)展方式和知識(shí)變遷。該軟件適合復(fù)雜的網(wǎng)絡(luò)關(guān)系可視化分析,但是CiteSpace被運(yùn)行在java平臺(tái),適合專業(yè)基礎(chǔ)較高的人,使用門檻高。在國(guó)內(nèi),Plantdata是一款較為成熟的知識(shí)圖譜可視化平臺(tái)。與傳統(tǒng)知識(shí)圖譜的可視化平臺(tái)不同的是,Plantdata加入了時(shí)間屬性,支持儀表盤(pán)功能,并加入交互操作。其最為出色的一點(diǎn)是支持快速搭建高效精準(zhǔn)智能深度搜索系統(tǒng),并以不同的形態(tài)展現(xiàn)給用戶,通過(guò)對(duì)多個(gè)維度進(jìn)行分析,幫助用戶做出決策(楊卓,2019)。經(jīng)過(guò)以上對(duì)國(guó)內(nèi)外研究的分析和比較,可以看出知識(shí)圖譜及其可視化服務(wù)正在迅猛發(fā)展,并開(kāi)始逐步應(yīng)用至各行各業(yè)。知識(shí)可視化的實(shí)質(zhì)是將內(nèi)容用圖形的方式表示,更符合人們對(duì)信息的感知與理解,從而進(jìn)行知識(shí)傳播(劉琦,2018)。在企業(yè)審計(jì)領(lǐng)域中,由于審計(jì)知識(shí)領(lǐng)域涉及范圍較廣,審計(jì)知識(shí)之間的關(guān)系紛繁復(fù)雜,存儲(chǔ)、組織和表達(dá)方式較為松散,缺乏有效的管理。另外,審計(jì)知識(shí)檢索的效率不高,無(wú)法進(jìn)行關(guān)聯(lián)知識(shí)的深度檢索。由此可見(jiàn),將知識(shí)圖譜與可視化技術(shù)運(yùn)用至企業(yè)審計(jì)領(lǐng)域中,與檢索者產(chǎn)生交互,顯示地表達(dá)知識(shí)的整體性與關(guān)聯(lián)性,將對(duì)知識(shí)的傳播起到推動(dòng)作用。同時(shí),企業(yè)也可通過(guò)運(yùn)用審計(jì)知識(shí)圖譜,將傳統(tǒng)的業(yè)務(wù)推動(dòng)數(shù)據(jù)模式轉(zhuǎn)化為數(shù)據(jù)推動(dòng)業(yè)務(wù)模式,提高審計(jì)的效率,挖掘不易發(fā)現(xiàn)的審計(jì)數(shù)據(jù),為企業(yè)決策提供參考價(jià)值(樊世昊,2018)。國(guó)內(nèi)外對(duì)于實(shí)現(xiàn)信息化審計(jì)的研究仍處于起步階段,由于審計(jì)領(lǐng)域涉及范圍較廣,實(shí)現(xiàn)全面的大數(shù)據(jù)審計(jì)仍有難度。目前,雖有一些學(xué)者將知識(shí)圖譜應(yīng)用在審計(jì)領(lǐng)域中,但尚無(wú)較為成熟的應(yīng)用。

二、基于Neo4j圖數(shù)據(jù)庫(kù)的審計(jì)知識(shí)圖譜的構(gòu)建

在審計(jì)領(lǐng)域中,由于審計(jì)知識(shí)領(lǐng)域涉及范圍較廣,審計(jì)知識(shí)之間的關(guān)系紛繁復(fù)雜,存儲(chǔ)、組織和表達(dá)方式較為松散,缺乏有效的管理(劉琦,2018)。另外,審計(jì)知識(shí)檢索的效率不高,無(wú)法進(jìn)行關(guān)聯(lián)知識(shí)的深度檢索。對(duì)此,Neo4j圖數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)與領(lǐng)域知識(shí)存儲(chǔ)與查詢功能,不僅能良好地支持知識(shí)庫(kù)中實(shí)體關(guān)系的管理,還能對(duì)知識(shí)進(jìn)行快速查詢和清晰展示(葉帥,2019)。為了實(shí)現(xiàn)審計(jì)數(shù)據(jù)的信息化,知識(shí)圖譜中的語(yǔ)義關(guān)聯(lián)可以有效地整合多元異構(gòu)審計(jì)數(shù)據(jù)。知識(shí)圖譜的數(shù)據(jù)通常以三元組(S,P,D)的形式來(lái)表示實(shí)體、關(guān)系、屬性之間的關(guān)系,因此,本文用Neo4j圖數(shù)據(jù)庫(kù)實(shí)現(xiàn)實(shí)體及實(shí)體關(guān)系的存儲(chǔ),構(gòu)建審計(jì)知識(shí)圖譜。Neo4j是一種圖形數(shù)據(jù)庫(kù),是目前圖形數(shù)據(jù)庫(kù)中使用率最高的庫(kù),Neo4j具備本地存儲(chǔ)和數(shù)據(jù)處理的功能,與一般的數(shù)據(jù)庫(kù)有顯著的區(qū)別,它能夠保證數(shù)據(jù)的完整性和高讀寫(xiě)性。審計(jì)知識(shí)圖譜構(gòu)建的目的是將經(jīng)典的審計(jì)方法與知識(shí)圖譜可視化方法相結(jié)合,從大量的企業(yè)結(jié)構(gòu)化和非結(jié)構(gòu)化文本中自動(dòng)提取三元組,構(gòu)建審計(jì)的知識(shí)圖譜,方便審計(jì)信息使用者快速抓取信息,有助于審計(jì)決策的制定和實(shí)施。因此,本文從以下幾個(gè)方面入手,具體探討審計(jì)知識(shí)圖譜的構(gòu)建過(guò)程。

(一)審計(jì)數(shù)據(jù)的獲取經(jīng)過(guò)對(duì)不同行業(yè)和領(lǐng)域?qū)徲?jì)需求的調(diào)研,發(fā)現(xiàn)存在兩類數(shù)據(jù),第一類是審計(jì)領(lǐng)域內(nèi)的直接數(shù)據(jù),第二類是與審計(jì)相關(guān)聯(lián)的通識(shí)數(shù)據(jù)。對(duì)于直接數(shù)據(jù),先從結(jié)構(gòu)化數(shù)據(jù)源的相應(yīng)本體模型出發(fā),定義概念之間的分層關(guān)系,然后從多個(gè)數(shù)據(jù)源所定義的概念出發(fā)添加實(shí)體和屬性。通過(guò)定義知識(shí)圖譜的本體模式,以確保知識(shí)層次結(jié)構(gòu)的正確性,然后再針對(duì)定義好的本體模式,對(duì)領(lǐng)域數(shù)據(jù)中的相關(guān)知識(shí)進(jìn)行抽取,通過(guò)知識(shí)融合、質(zhì)量評(píng)估等階段,篩選出滿足準(zhǔn)確率要求的三元組進(jìn)行企業(yè)審計(jì)知識(shí)圖譜的構(gòu)建,并將其存儲(chǔ)于MySQL數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)。另外,由于非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)是可信度相對(duì)低,抽取的精度也是有限的,這使得它難以滿足可用性標(biāo)準(zhǔn)。因此,具有高可信度的半結(jié)構(gòu)化的通識(shí)知識(shí)數(shù)據(jù)將被用作構(gòu)建企業(yè)審計(jì)知識(shí)圖譜,作為構(gòu)建審計(jì)知識(shí)圖譜的另一個(gè)層次的數(shù)據(jù)源,與審計(jì)數(shù)據(jù)互補(bǔ)。對(duì)于通識(shí)知識(shí)數(shù)據(jù),將抽取百科頁(yè)面中的半結(jié)構(gòu)化數(shù)據(jù),作為關(guān)鍵性的知識(shí),轉(zhuǎn)換成三元組,然而,對(duì)于關(guān)鍵知識(shí)中部分冗余的信息仍然存在,例如,存在實(shí)體名稱不一樣,但實(shí)際對(duì)應(yīng)現(xiàn)實(shí)世界中的同一實(shí)體,需要對(duì)這些冗余的知識(shí)進(jìn)行知識(shí)融合,保證所構(gòu)建知識(shí)圖譜的準(zhǔn)確性。由于企業(yè)審計(jì)知識(shí)圖譜對(duì)準(zhǔn)確性的要求較高,關(guān)系到企業(yè)的利益,因此將采用已有的算法,對(duì)這些冗余的知識(shí)進(jìn)行篩選,然后再使用人工進(jìn)行評(píng)估。這些冗余的知識(shí),在百科數(shù)據(jù)中只是部分存在,而且比例很低,使用這種思路不會(huì)造成較高的人工成本,準(zhǔn)確度和效率都是可接受的。

(二)審計(jì)數(shù)據(jù)處理經(jīng)過(guò)知識(shí)清洗與數(shù)據(jù)預(yù)處理,得到了關(guān)于審計(jì)領(lǐng)域的知識(shí)三元組數(shù)據(jù),儲(chǔ)存在txt文檔中,以逗號(hào)分隔,然后將數(shù)據(jù)txt文檔格式轉(zhuǎn)為CSV文件格式。CSV是使用文本文檔形式存儲(chǔ)的數(shù)據(jù),文件內(nèi)每一行代表一條數(shù)據(jù),每條記錄包含了由逗號(hào)分隔的一個(gè)屬性值,其中A列中的數(shù)據(jù)代表Source節(jié)點(diǎn)類型,C列中的數(shù)據(jù)代表Target節(jié)點(diǎn)類型,B列中的數(shù)據(jù)代表關(guān)系(relation)。其數(shù)據(jù)格式如圖1所示。將上述數(shù)據(jù)導(dǎo)入Neo4j,其邏輯為:(1)node相關(guān):CSV文件首列為Source節(jié)點(diǎn),第三列為Target節(jié)點(diǎn),第二列為relation(關(guān)系)。消除完重復(fù)數(shù)據(jù)后,為每個(gè)節(jié)點(diǎn)生成唯一的id和name字段,方便查看節(jié)點(diǎn)的屬性。(2)relation相關(guān):每種關(guān)系單獨(dú)生成一個(gè)關(guān)系類型,這樣在進(jìn)行后續(xù)的查詢操作時(shí)可以針對(duì)某個(gè)關(guān)系或節(jié)點(diǎn)直接進(jìn)行查詢。關(guān)系兩端的node用生成的id進(jìn)行標(biāo)示。(3)數(shù)據(jù)導(dǎo)入生成知識(shí)圖譜:清空Neo4j現(xiàn)有的graph并重啟Neo4j程序。若啟動(dòng)Neo4j程序需要在cmd中輸入如指令,指令輸入完成后打開(kāi)Neo4j,利用Neo4j的Cypher語(yǔ)句進(jìn)行查詢。

(三)審計(jì)數(shù)據(jù)的導(dǎo)入本文采用Python與Neo4j圖數(shù)據(jù)庫(kù)連接的方式,進(jìn)行數(shù)據(jù)導(dǎo)入工作。首先需要將已有的CSV格式的數(shù)據(jù)導(dǎo)入py2neo庫(kù),需在Python中輸入如下代碼:frompy2neoimportGraph,Node,Relationship,Subgraph。隨后建立時(shí)間模塊與導(dǎo)入操作數(shù)據(jù)需要使用的模塊。下一步需要在Neo4j中運(yùn)用Cypher語(yǔ)句建立索引、提高查詢速度,輸入CREATE語(yǔ)句:CREATEINDEXFOR(n:Entity)ON(n.name)。之后需在Python中設(shè)置自己本地的url與Neo4j庫(kù)的用戶名與密碼,即可實(shí)現(xiàn)審計(jì)數(shù)據(jù)導(dǎo)入Neo4j,從而完成基于Neo4j圖數(shù)據(jù)庫(kù)的審計(jì)知識(shí)圖譜的構(gòu)建。

三、審計(jì)知識(shí)圖譜的實(shí)現(xiàn)

審計(jì)知識(shí)圖譜的實(shí)現(xiàn)主要是通過(guò)信息抽取、知識(shí)融合、圖譜的構(gòu)建與儲(chǔ)存等核心技術(shù)從大量的異構(gòu)數(shù)據(jù)源出發(fā),抽取其中的實(shí)體、屬性等關(guān)鍵知識(shí)及其相互關(guān)系,再完成實(shí)體對(duì)齊與實(shí)體消歧等數(shù)據(jù)融合工作,然后采用符合質(zhì)量要求的知識(shí)構(gòu)建圖譜,并利用MYSQL數(shù)據(jù)庫(kù)對(duì)構(gòu)建好的知識(shí)圖譜進(jìn)行儲(chǔ)存。在上一節(jié)中進(jìn)行了數(shù)據(jù)導(dǎo)入工作并在Neo4j圖數(shù)據(jù)庫(kù)中構(gòu)建了企業(yè)審計(jì)領(lǐng)域知識(shí)圖譜。Neo4j圖數(shù)據(jù)庫(kù)中,共設(shè)有兩種節(jié)點(diǎn)類型,分別是Source節(jié)點(diǎn)類型與Target節(jié)點(diǎn)類型。用戶可以根據(jù)自己的需求進(jìn)行查詢,進(jìn)而清晰明了地了解節(jié)點(diǎn)以及節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系。比如,用戶需要在Neo4j中查詢某一個(gè)節(jié)點(diǎn)(node)并且節(jié)點(diǎn)類型屬于Source類型時(shí),以查詢“中國(guó)投資服務(wù)網(wǎng)”為例,用戶需輸入如下查詢語(yǔ)句:MATCH(n:Source{name:‘中國(guó)投資服務(wù)網(wǎng)’})returnn,點(diǎn)擊運(yùn)行后會(huì)顯示出節(jié)點(diǎn)‘中國(guó)投資服務(wù)網(wǎng)’。若用戶需要查詢節(jié)點(diǎn)類型為Target的節(jié)點(diǎn),只需把查詢語(yǔ)句中的Source改為Target即可進(jìn)行查詢。如圖2所示。再比如,當(dāng)用戶需要在Neo4j中查詢關(guān)系(relation)時(shí),需要使用Match語(yǔ)言進(jìn)行查詢,以查詢“審計(jì)”關(guān)系為例,若想查詢圖數(shù)據(jù)庫(kù)中所有關(guān)于“審計(jì)”關(guān)系的節(jié)點(diǎn),查詢語(yǔ)句如下:MATCH(n:Source)-[:‘審計(jì)’]-(m:Target)returnn,mlimit20。這時(shí)圖數(shù)據(jù)庫(kù)會(huì)加載出所有以“審計(jì)”關(guān)系連接的節(jié)點(diǎn),(其中l(wèi)imit為控制節(jié)點(diǎn)顯示數(shù)量的參數(shù),可修改為任意數(shù)量),查詢結(jié)果如圖3所示。對(duì)審計(jì)領(lǐng)域的知識(shí)獲得全局認(rèn)識(shí),亦可以借助知識(shí)圖譜的手段。審計(jì)知識(shí)圖譜的構(gòu)建,有助于人們通過(guò)節(jié)點(diǎn)-關(guān)系-節(jié)點(diǎn)的方式,方便快捷、清晰明了地獲取審計(jì)領(lǐng)域的相關(guān)知識(shí),完成審計(jì)知識(shí)的查詢和獲取。比如對(duì)于初次接觸審計(jì)領(lǐng)域知識(shí)的用戶而言,可以通過(guò)知識(shí)圖譜的方式查詢“審計(jì)”相關(guān)領(lǐng)域,例如查詢對(duì)于“審計(jì)(獨(dú)立性的經(jīng)濟(jì)監(jiān)督活動(dòng))”相應(yīng)知識(shí),查詢結(jié)果如圖4所示,即可通過(guò)圖譜的方式獲得相應(yīng)審計(jì)知識(shí)的展示,方便用戶快速、系統(tǒng)、較為全面地獲得審計(jì)領(lǐng)域知識(shí)。另外,知識(shí)圖譜也提供了強(qiáng)大的模糊查詢的功能。當(dāng)用戶在搜索框內(nèi)輸入想要查詢的詞語(yǔ),隨后會(huì)出現(xiàn)下拉框,用戶可通過(guò)點(diǎn)擊某一詞語(yǔ)或句子,這時(shí)會(huì)出現(xiàn)用戶搜索的詞語(yǔ)的網(wǎng)絡(luò)關(guān)系圖。以搜索“cpa”為例,如圖5所示,頁(yè)面的搜索框下會(huì)出現(xiàn)所有包含cpa字段的詞語(yǔ)或語(yǔ)句,可通過(guò)點(diǎn)擊自己想要查詢的范圍來(lái)進(jìn)行查詢。例如,以選擇以“cpa[注冊(cè)會(huì)計(jì)師]”為例,用戶點(diǎn)擊此詞語(yǔ),頁(yè)面會(huì)展示關(guān)于此詞語(yǔ)的知識(shí)圖譜,如圖6所示。除此之外,若用戶需要在Neo4j中創(chuàng)建新的節(jié)點(diǎn)(node)類型、創(chuàng)建的節(jié)點(diǎn)類型與已有的節(jié)點(diǎn)建立新的關(guān)系(relation),以及刪除圖數(shù)據(jù)庫(kù)中的任意節(jié)點(diǎn)等,都可以進(jìn)行相應(yīng)語(yǔ)句的編寫(xiě)與操作。這種通過(guò)圖譜的形式展示出來(lái)的、區(qū)別于傳統(tǒng)的百度搜索查找審計(jì)領(lǐng)域知識(shí)的方式,是大數(shù)據(jù)審計(jì)、信息化審計(jì)和智能化審計(jì)發(fā)展到一定階段的產(chǎn)物,有助于用戶對(duì)審計(jì)知識(shí)的查詢、獲取和使用,提高了用戶的決策相關(guān)性。通過(guò)審計(jì)知識(shí)圖譜的構(gòu)建,相關(guān)人員可以快速準(zhǔn)確地了解到當(dāng)前環(huán)境下審計(jì)知識(shí)的現(xiàn)狀,精準(zhǔn)抓取審計(jì)行業(yè)面臨的問(wèn)題等等。對(duì)于審計(jì)從業(yè)人員而言,需要不斷加強(qiáng)大數(shù)據(jù)審計(jì)和智能化審計(jì)手段,提升審計(jì)信息化手段,不斷提高審計(jì)效率以及準(zhǔn)確性。對(duì)于被審計(jì)單位而言,審計(jì)知識(shí)圖譜的構(gòu)建有助于企業(yè)從內(nèi)部審計(jì)出發(fā),快速精準(zhǔn)地挖掘企業(yè)面臨的審計(jì)難題,提升公司內(nèi)部的管理水平,防患于未然,以降低不必要的損失;并結(jié)合注冊(cè)會(huì)計(jì)師(CPA)審計(jì)的相關(guān)知識(shí),加強(qiáng)合作,確保審計(jì)意見(jiàn)的正確出具,并不斷提升自我在行業(yè)中的核心競(jìng)爭(zhēng)力。對(duì)于監(jiān)管部門而言,通過(guò)對(duì)審計(jì)領(lǐng)域違規(guī)問(wèn)題的查詢,可以系統(tǒng)地通過(guò)知識(shí)譜圖的方式展示審計(jì)異常的企業(yè)以及事務(wù)所的情況,實(shí)現(xiàn)審計(jì)違規(guī)的精準(zhǔn)查處和精準(zhǔn)治理。

參考文獻(xiàn)

1.樊世昊.基于知識(shí)圖譜的審計(jì)方法研究.南京審計(jì)大學(xué).2018

2.鄒偉軍.探討大數(shù)據(jù)對(duì)審計(jì)的影響.經(jīng)濟(jì)師.2019(06)

3.韓戈白,楊紹雄,王博,陳迪.知識(shí)圖譜在裝備大數(shù)據(jù)上的典型應(yīng)用.網(wǎng)絡(luò)安全技術(shù)與應(yīng)用.2019(08)

4.劉琦.基于Neo4j的學(xué)科知識(shí)可視化檢索系統(tǒng)的實(shí)現(xiàn).河南大學(xué).2018

5.李濤,王次臣,李華康.知識(shí)圖譜的發(fā)展與構(gòu)建.南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版).2017(01)

6.周盛威.審計(jì)互動(dòng)百科及知識(shí)問(wèn)答系統(tǒng)研究.哈爾濱工程大學(xué).2018

7.張蕓蕓,方勇,黃誠(chéng).基于Neo4j圖譜的信用卡欺詐檢測(cè).信息與電腦(理論版).2018(21)

8.楊卓.垂直知識(shí)圖譜可視化服務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).北京郵電大學(xué).2019

9.林莉,云紅艷,賀英,于小洋.基于企業(yè)知識(shí)圖譜構(gòu)建的可視化研究.青島大學(xué)學(xué)報(bào)(自然科學(xué)版).2019(01)

10.鄭戟明,董云朝,肖宇,錢之琳.MySQL數(shù)據(jù)庫(kù)課程的設(shè)計(jì).電腦知識(shí)與技術(shù).2020(03)

11.馮俐.基于Neo4j圖數(shù)據(jù)庫(kù)構(gòu)建中學(xué)語(yǔ)文詩(shī)詞知識(shí)圖譜.陜西師范大學(xué).2019

12.王建,羅政,張希,張夢(mèng)琪,張科,馬文成.Web項(xiàng)目前后端分離的設(shè)計(jì)與實(shí)現(xiàn).軟件工程.2020(04)

13.伍角星.基于Angular的文化產(chǎn)業(yè)項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).中南民族大學(xué).2018

作者:王瑞萍 劉峰 楊媛琦 邢春玉 單位:國(guó)網(wǎng)冀北有限責(zé)任公司審計(jì)部