前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)的審計技術探究范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:審計作為我國以及我黨監(jiān)督管理的關鍵組成之一,在保障國家經(jīng)濟秩序、提升財政資金使用效率、推動政府廉政建設、維護經(jīng)濟社會健康發(fā)展等方面,都具有重要作用。大數(shù)據(jù)時代的到來也推動著審計創(chuàng)新,運用大數(shù)據(jù)分析科技是實現(xiàn)審計事業(yè)全面覆蓋目標的需要,而大數(shù)據(jù)分析審計工程則是影響中國審計事業(yè)未來發(fā)展方向的核心。
關鍵詞:大數(shù)據(jù);審計技術;技術分析
審計制度作為保證我國開展民主治國的根本制度,是我國依法使用權力約束的重要體系。審計制度的本質(zhì)是我國管理體系內(nèi)存在的一種內(nèi)生制度,其具有防范、預防、抵御的免疫管理體系,其核心任務為健全民主制度,完善審計管理,推動我國社會經(jīng)濟健康運行與科學發(fā)展,進而更好地維護廣大民眾的切身利益,更是國管理的重要組成部分,故需完善大數(shù)據(jù)時代下的審計工作。
一、大數(shù)據(jù)分析審計方法和電子數(shù)據(jù)審核方式對比
電子數(shù)據(jù)審計的數(shù)據(jù)挖掘技術,主要依靠統(tǒng)計分析模塊進行審計疑點發(fā)現(xiàn)和審計線索發(fā)現(xiàn)。通常,統(tǒng)計分析流程主要分為信息收集、清理、匯總、挖掘和可視化。傳統(tǒng)環(huán)境下,常用方式包括賬表分類、大數(shù)據(jù)搜索、數(shù)據(jù)分析、審計抽樣和數(shù)值分析等。而在該類統(tǒng)計分析方式中,如Excel、Oracle、AO、ACL、IDEA等,作為主要的審計軟件而被普遍采用。在大數(shù)據(jù)分析時代的會計活動往往包括國民經(jīng)濟運行中的所有大數(shù)據(jù)分析,而這種大數(shù)據(jù)分析常跨行業(yè)、跨領域,即具備了大量、多樣、高價值、低密度等的大數(shù)據(jù)特點。根據(jù)資料類型對其進行分析,不難發(fā)現(xiàn)包含數(shù)據(jù)以及半結構化數(shù)據(jù),其中涵蓋照片、視頻、文檔等非數(shù)據(jù)內(nèi)容。根據(jù)各個數(shù)據(jù)的實際來源對其進行分析后,可以發(fā)現(xiàn)單位內(nèi)進行審計的相關數(shù)據(jù)信息以及資料,這些資料包括企業(yè)公開的信息。從目標入手,能夠發(fā)現(xiàn)會計目標逐漸成為發(fā)現(xiàn)線索、評價風險、關注績效的內(nèi)容。審計工作不僅關系到企業(yè)違法違規(guī)的情況,還要求一旦發(fā)現(xiàn)企業(yè)制度存在的問題,需及時評估企業(yè)的內(nèi)部控制風險,借助社會經(jīng)濟以及大數(shù)據(jù)技術,收集更多的信息內(nèi)容,并對其展開分析,充分了解企業(yè)的發(fā)展情況,隨后分析企業(yè)發(fā)展的趨勢以及規(guī)律。此時,能夠為企業(yè)以及國家提供更多的數(shù)據(jù),隨后制定合理的干預措施,便于企業(yè)做出決策。因此,大數(shù)據(jù)下的企業(yè)審計工作,具有收集、保存、管理、分析等多個功能,且在可視化的特點下,需明確其與傳統(tǒng)方法的顯著不同。所以,企業(yè)需明確大數(shù)據(jù)時代下,傳統(tǒng)審計與電子審計方式之間的主要區(qū)別。
二、大數(shù)據(jù)審計采集技術
企業(yè)使用電子技術收集數(shù)據(jù),直接關系到企業(yè)內(nèi)審計工作的準確性,企業(yè)是否可以獲得精準的數(shù)據(jù)內(nèi)容,是決定企業(yè)能否開展下一步數(shù)據(jù)分析的關鍵。所以,企業(yè)在收集各個模型以及理論的基礎上,可以發(fā)現(xiàn)采用大數(shù)據(jù)審計的關鍵如下:首先,電子數(shù)據(jù)的收集以及轉(zhuǎn)換相關技術。其次,已經(jīng)收集數(shù)據(jù)的完整性以及有效性。企業(yè)在收集數(shù)據(jù)的過程中,需明確研究重點為根據(jù)特定的領域、來源數(shù)據(jù),制定具有針對性的收集以及處理形式。數(shù)據(jù)完整度以及有效性的檢驗,主要是根據(jù)當前審計的目標,并根據(jù)詳細的審計標準以及規(guī)范,通過分析審計數(shù)據(jù)與準則的符合性,可以有效評價遠程數(shù)據(jù)和本地數(shù)據(jù)的完整性與有效性。
三、大數(shù)據(jù)審計存儲技術
處于大數(shù)據(jù)環(huán)境背景下的審計工作,保存數(shù)據(jù)的體系主要包含傳統(tǒng)、新型以及分布式操作。由于審計工作的展開內(nèi)容,多為一些敏感的數(shù)據(jù)信息,故對電子數(shù)據(jù)進行審計的過程中,不僅需要保證數(shù)據(jù)存儲的有效性,還需保證數(shù)據(jù)的完整性,避免其被非法手段獲取。而云存儲信息技術是指運用分布式操作系統(tǒng)、數(shù)據(jù)庫集群等現(xiàn)代信息技術,將互聯(lián)網(wǎng)內(nèi)的多個不同種類的數(shù)據(jù)進行協(xié)調(diào),隨后為大數(shù)據(jù)提供更多的技術,便于其訪問各個內(nèi)容以及業(yè)務。這一技術具有較高的可用性、低成本以及高性能的特點,故其是大部分數(shù)據(jù)存儲的首選,再加上多副本以及數(shù)據(jù)完整性檢驗,均是大數(shù)據(jù)存儲的關鍵技術。
(一)多副本技術
多副本技術可以減少大數(shù)據(jù)技術由于磁盤故障產(chǎn)生的損失,其是大數(shù)據(jù)存儲過程中需處理的首要問題。多副本技術作為提高數(shù)據(jù)可用性的技術,存在一個主節(jié)點,以此保障副本內(nèi)的收據(jù)一致性、數(shù)據(jù)可用性管理。整體數(shù)據(jù)均儲存在工作節(jié)點內(nèi),且主要以多個副本的方式存儲。主節(jié)點與工作節(jié)點主要采用心跳包通訊的方式,且當主節(jié)點出現(xiàn)故障之后,需自動開展病程分布工作,以此盡快恢復存在故障的副本。多副本技術是指多個副本供系統(tǒng)操作,該系統(tǒng)可以將一個數(shù)據(jù)分散存儲在多個副本內(nèi)。此時,其可以減輕系統(tǒng)存儲數(shù)據(jù)的壓力,提升可操作性以及系統(tǒng)運行功能。并且,當前這些云儲存內(nèi)的主流分布操作系統(tǒng),均使用這一技術,可充分發(fā)揮其具有的價值。
(二)數(shù)據(jù)完整性驗證技術
可證明數(shù)據(jù)持有(PDP模型)是典型的大數(shù)據(jù)儲存資料認證形式,PDP模型主要是由Ateniese學者經(jīng)過不同研究后,根據(jù)數(shù)據(jù)形態(tài)提出的相關方案內(nèi)容。PDP可以分為兩個不同的階段,即預處理和驗證。預處理過程中,用戶提交相關文本以及數(shù)據(jù)后,可以獲取修改之后的文本內(nèi)容,并在本地保留原本的數(shù)據(jù),服務端存儲修改之后的文件。驗證過程中,則由用戶隨機對服務器生成不同的挑戰(zhàn),隨后結合服務器內(nèi)存在的內(nèi)容,獲得完整的證據(jù),及時將其傳遞給用戶。用戶通過驗證內(nèi)容,再加上預處理過程中使用的元數(shù)據(jù),可以詳細計算數(shù)據(jù)的有效性,以此保證數(shù)據(jù)的完整性。為了完成上述兩個階段的運算,PDP模型共包括四個基本計算,而為了提高有效性,上述計算均為多項式時間的計算。PDP模型僅能檢驗數(shù)據(jù)塊是否完整,而無法恢復錯誤的數(shù)據(jù)塊,這對挽回經(jīng)濟損失并沒有幫助,于是,學者就設計了可恢復證明(POR模型)的方法,利用POR模型采用糾刪碼原理進行數(shù)據(jù)恢復。也可以擴充PDP模塊,并支持動態(tài)操作,但該方法僅支持對數(shù)據(jù)的更改、刪除和插入功能,而不支持對數(shù)據(jù)塊的嵌入功能。
四、大數(shù)據(jù)審計分析技術
大數(shù)據(jù)挖掘中采用的數(shù)據(jù)挖掘技術和機器學習方法,是實現(xiàn)從檢驗式審計轉(zhuǎn)向發(fā)現(xiàn)式審計的主要手段。云計算架構是進行大數(shù)據(jù)審計的主要框架。按照審計使用差異,可分為以下結構:批信息處理結構、流信息處理結構、混合信息處理結構等。首先,批信息處理結構通過把無依賴關聯(lián)的大量數(shù)據(jù)分成多組小批量的生產(chǎn)數(shù)據(jù),每群數(shù)據(jù)分布到各個區(qū)域的同時數(shù)據(jù),完成大數(shù)據(jù)的分布式并行處理。批處理結構擁有最高吞吐概率,主要運用于事后審核,也是目前使用量最大的一個結構。其次,流處理結構與傳統(tǒng)的批處理結構完全不同,它將信息看作如同從水龍頭流出的水一般源源不斷的到來,將收到的信息熔成數(shù)據(jù)塊,即分配給相應的任務并進行信息處理,而信息處理的全部過程也是流式的。流處理結構的主要運用在對即時化要求較高的情景,速度通??梢赃_到秒級甚至毫秒量級,也主要運用在實時審計中。但因為即時化的特性,流程式處理大部分的結果都保留在存儲器中,而不是直接存儲在硬盤上。最后,混合處理結構結合了批處理的高吞吐度與過程管理的高即時化,因此基于過程式處理和批處理的混合結構也日益受到人們的重視,是未來審計應用的重點方向。其中,Spark是目前應用較為廣泛的混合處理架構。Spark把數(shù)據(jù)組織為RDD(彈性分布式數(shù)據(jù)集)的方法,所有的運算工作均通過RDD完成,其過程和MapReduce框架非常相似,但為了提高工作效率,中間結果可只保留到存儲器中,而不必通過磁盤。同時,為了滿足流程管理要求,Spark發(fā)布了Steaming版本,它把所有輸入數(shù)據(jù)流都以時間片(秒級)為單元加以分割,然后再以類似批處理的方法管理各個時間片數(shù)據(jù)。盡管借助云計算架構,可以顯著提升審計大數(shù)據(jù)分析的時效性,不過要得出合理的審計分析結果,還需要借助大數(shù)據(jù)挖掘技術。大數(shù)據(jù)挖掘的目標與傳統(tǒng)數(shù)據(jù)挖掘的目標是非常接近的,都是從大量復雜數(shù)據(jù)中獲取了對數(shù)據(jù)挖掘目標具有重要價值的信息。而面向大統(tǒng)計的數(shù)據(jù)挖掘方法,則是在傳統(tǒng)數(shù)據(jù)挖掘算法基礎上發(fā)展起來的,因為它比采用傳統(tǒng)大數(shù)據(jù)挖掘方式的數(shù)據(jù)源多、統(tǒng)計資料量大、類型復雜、數(shù)據(jù)價值存在的密度較低。因為大數(shù)據(jù)上的很多運算都可以用標準數(shù)據(jù)庫的原語來表示,所以,為了方便地把傳統(tǒng)資料挖掘的計算方式運用于大數(shù)據(jù)挖掘,部分學者已經(jīng)對在關系代數(shù)中標準運算的MapReduce映射方式展開了研究。
五、基于區(qū)塊鏈的大數(shù)據(jù)審計
大數(shù)據(jù)審計分析過程中,被審核人員所提交電子產(chǎn)品財務數(shù)據(jù)的真實性、正確性與完整度直接關系到具體實際審核業(yè)務的發(fā)展方向,對電子產(chǎn)品財務數(shù)據(jù)等會計信息真實性做出一定的鑒別和定義是人員順利完成審核項目的基礎環(huán)節(jié),也是提高審核服務質(zhì)量的重要基礎。大數(shù)據(jù)分析審核的基礎流程就是獲取大量必需和完整的電子信息,構建被審核資料數(shù)據(jù)庫,開展審查中間表、分析數(shù)據(jù)處理、延伸查實表以及審核取證工作,采集、交換、管理電子產(chǎn)品財務數(shù)據(jù)信息是實現(xiàn)大數(shù)據(jù)分析審計工作的基礎工作,而電子產(chǎn)品財務數(shù)據(jù)的質(zhì)量則直接影響著審核目標的實現(xiàn)。要想獲取完整的、統(tǒng)一性的、可追溯的審核,電子數(shù)據(jù)信息質(zhì)量尤為重要。數(shù)據(jù)處理過程中,將區(qū)塊鏈技術作為關鍵技術,結合分布式網(wǎng)絡結構,并采用多種數(shù)據(jù)信息技術,可以及時針對審核流程中電子產(chǎn)品數(shù)據(jù)信息的不安全因素,以區(qū)塊鏈技術為基礎,重點研究審核中電子產(chǎn)品數(shù)據(jù)信息采集及新聞真實性的核實機理、一致性傳輸與可溯源保存機理,以及安全性和可追溯性加強方案的實現(xiàn)機理。本文認為基于區(qū)塊鏈技術的大數(shù)據(jù)審計,主要可以從如下幾個方面進行研究:首先,在審計電子產(chǎn)品數(shù)據(jù)信息收集的過程中,由于在大數(shù)據(jù)處理環(huán)境下審計的電子產(chǎn)品統(tǒng)計數(shù)量多且繁雜,又牽涉諸多主體,所收集的電子產(chǎn)品數(shù)據(jù)信息中往往夾帶著巨量噪音,其完全、真實感都很難保障。而通過區(qū)塊鏈技術,就能夠?qū)⑺袑徲嫻?jié)點單位的各種待審核電子記錄進行自動收集,并將其定期分批加密進行傳播。同時,通過分布式節(jié)點自動解密和確認機制,對各種待審核記錄所涉及的信息關聯(lián)方實現(xiàn)了交叉確認。經(jīng)過確定的審核記錄,數(shù)據(jù)在加入時間戳和密碼機制之后被確認并進入?yún)^(qū)塊鏈,而無法再進行更改。與傳統(tǒng)的審計數(shù)據(jù)收集方式比較,采用區(qū)塊鏈技術的審計數(shù)據(jù)收集方式將具備質(zhì)量較高、真實、無法修改、可追溯性的優(yōu)點,將大大減少審核流程中的上下一級重復性勞動,并解決了審計電子數(shù)據(jù)收集方式不全面、不真實,無法運用于全覆蓋審核分析中的問題。其次,在審核電子商務數(shù)據(jù)分析中,我們可以利用區(qū)塊鏈的時限戳管理機制,即以每組數(shù)據(jù)分析前后的時限戳為重要參量,根據(jù)審計電子商務數(shù)據(jù)傳輸方法、統(tǒng)計量、信息的重要性、可恢復力量等統(tǒng)計相關性信息,建立電子數(shù)據(jù)一致性評價模型,從而為數(shù)據(jù)傳輸過程中的安全性評價提供基礎。最后,針對所存放的審核電子產(chǎn)品財務數(shù)據(jù)的安全與可靠性問題,以區(qū)塊鏈的多數(shù)據(jù)副本共識技術為基礎,將審核電子產(chǎn)品財務數(shù)據(jù)以多副本的方法分布式存放,并基于存放的位置、級別、管理授權等各方面的影響因素,對所存放的數(shù)據(jù)副本實行了本地評價,最后再將對每個數(shù)據(jù)副本的評價結果加以綜述,形成各數(shù)據(jù)副本當前的存放有效性評價模型。然后以此為依據(jù),對該電子數(shù)據(jù)的有效性做出評價,然后根據(jù)評估價值和該信息的應用范圍確定有效性,防止錯誤信息流入審計報告體系,造成巨大會計風險。同時采用區(qū)塊鏈技術對審計報告信息加以組合,并針對審計報告電子信息的類別、屬性等諸多因素,以B+樹等方法形成多索引。根據(jù)該索引和區(qū)塊鏈的鏈式化構造,通過設計對數(shù)據(jù)修改記錄的快速追溯監(jiān)控方法,不僅追溯了存儲中的不安全因素,還保證了重要數(shù)據(jù)的可重構性,為進行快速可追溯審計提供了基礎。
六、結束語
大數(shù)據(jù)信息技術在各行各業(yè)中的廣泛應用,為國民經(jīng)濟高速發(fā)展與社會和諧穩(wěn)定提供了助力,同時也是實現(xiàn)信息審計全面覆蓋的必然需要。根據(jù)現(xiàn)階段會計信息化發(fā)展狀況,系統(tǒng)梳理了電子數(shù)據(jù)審計的發(fā)展脈絡,系統(tǒng)總結了大數(shù)據(jù)信息技術在會計電子數(shù)據(jù)的收集、保存、大數(shù)據(jù)分析與可視化等工作中的相關研究,探索了在大數(shù)據(jù)處理環(huán)境下電子數(shù)據(jù)審計所面臨的新機遇、新挑戰(zhàn),并預測了未來的重點研發(fā)方向。同計算機輔助審計與物聯(lián)網(wǎng)審計比較,大數(shù)據(jù)審計在思想模型、技術方法等方面,均有明顯不同,雖然目前有若干探索性研究工作,但從總體來看,中國大數(shù)據(jù)審計的重點研發(fā)方向還有待進一步明確,而且還有許多問題亟待解決。
作者:陶燕 單位:武漢商學院