前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大額保險大數(shù)據(jù)反欺詐系統(tǒng)設(shè)計探析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:為了更好地識別針對大額保險的欺詐行為,總結(jié)了大額保險的主要風險類型,明確了大額保險反欺詐系統(tǒng)的主要構(gòu)建方向?;贏priori算法提出了大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)模型,重點分析了數(shù)據(jù)統(tǒng)計識別、保險欺詐規(guī)律挖掘、保險欺詐行為識別。構(gòu)建的大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)經(jīng)實證運行,結(jié)果表明,基于Apriori算法構(gòu)建的大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)能快速完成對大額保險欺詐行為的有效識別。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);Apriori算法;反欺詐系統(tǒng);實踐
0引言
大額保險是指投保的保險金額相對較大的人身保險,通常保險金額是在50萬以上,投保時需要對其實施契約調(diào)查,充分掌握投保人的資產(chǎn)情況,明確投保人的投保動機,身體健康情況等[1]。近年來,在中國經(jīng)濟飛速發(fā)展的影響下,國內(nèi)保險行業(yè)迅速崛起,為廣大社會群體提供了健康保障。大額保險作為保險行業(yè)非常重要的一類產(chǎn)品,具有“避債、避稅、傳承”的作用,成為了高凈值人士投資理財?shù)臒衢T選擇,這使得大額保單量持續(xù)增加,保額也在不斷攀升。本文擬根據(jù)大額保險的特點,基于關(guān)聯(lián)規(guī)則挖掘算法的經(jīng)典算法Apriori算法,設(shè)計一套具有較高可行性的反欺詐系統(tǒng),期望以此降低保險運營成本,營造一個良好的保險行業(yè)環(huán)境。
1大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)模型設(shè)計
本文從變量篩選、數(shù)據(jù)預處理、保險欺詐規(guī)律挖掘和行為識別等方面,挖掘數(shù)據(jù)信息,基于Apriori算法建立大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)。
1.1數(shù)據(jù)統(tǒng)計識別
1.1.1變量選擇。變量篩選主要是從個人行為數(shù)據(jù)中選擇能夠反映個人信用的變量。因為互聯(lián)網(wǎng)上個人行為種類繁多,有些變量能很好體現(xiàn)個人信用度,有些變量則對個人信用的影響不明顯。因此,我們需要選擇合適變量,才能夠準確評價用戶的信用度[2]。大額保險用戶大致可分為以下幾個方面。用戶數(shù)據(jù)用戶數(shù)據(jù):包括用戶的年齡,性別,婚姻,職業(yè),教育程度,收入情況等。信用數(shù)據(jù)信用數(shù)據(jù):包括用戶在銀行的征信記錄,用戶在銀行或其他征信公司的征信記錄。交易數(shù)據(jù)交易數(shù)據(jù):包括用戶的交易金額,交易頻率,交易地點,交易賬戶等。消費數(shù)據(jù)消費數(shù)據(jù):包括用戶的消費時間,消費地點,消費習慣,消費金額等。社交數(shù)據(jù)社交數(shù)據(jù):包括用戶的好友數(shù)量,好友的信用評級,好友的身份特征等。除此之外變量之間可能存在一定聯(lián)系,共同反映用戶的某種特性,所以我們要盡量從多個維度來刻畫用戶的特征。1.1.2數(shù)據(jù)預處理。原始數(shù)據(jù)集常規(guī)情況下很難直接將其作為系統(tǒng)數(shù)據(jù)來源,針對該情況,必須對所收集到的數(shù)據(jù)作出相應的處理,以確保建模和統(tǒng)計處理的相關(guān)要求。
1.2保險欺詐規(guī)律挖掘
保險欺詐盡管花樣百出,但保險公司有豐富的經(jīng)驗和積累了豐富的數(shù)據(jù),那么就能夠結(jié)合數(shù)據(jù)掌握其具體規(guī)律。目前,不少的保險公司,針對大額保險的欺詐處理,多以保險人員個人的經(jīng)驗為主,并從中總結(jié)出相應的規(guī)律。大額保險所出現(xiàn)的欺詐行為分析指標主要包括了欺詐特征、行為特征指標兩個部分,抽取其中的一部分的指標用來對Apriori算法進行演示。
1.3保險欺詐行為識別
經(jīng)由保險公司的信息系統(tǒng)數(shù)據(jù)庫來進行數(shù)據(jù)的構(gòu)建,在對傳統(tǒng)分析模型進行使用的過程中,結(jié)合Apriori算法數(shù)據(jù)關(guān)聯(lián)挖掘技術(shù),對欺詐行為進行分析、識別和評價。借助欺詐行為發(fā)生風險、可能性和成本、指數(shù)的分析,總結(jié)出一套相應的欺詐風險評價結(jié)果,并基于提出反欺詐風險管理策略與監(jiān)督管理體系??紤]到保險欺詐行為的識別業(yè)務的特殊性,如果將保險欺詐的挖掘業(yè)務模式應用與保險欺詐行為的識別業(yè)務中是不可行的。為此,本文在進行欺詐行為識別業(yè)務過程中,首先提出了先分布、然后再集中的流程處理模型。保險欺詐行為的詳細識別業(yè)務模型如圖1所示。各個保險公司首先將內(nèi)部數(shù)據(jù)庫中的業(yè)務數(shù)據(jù)進行數(shù)據(jù)預處理,所有的公司處理后的數(shù)據(jù)結(jié)構(gòu)應該是一致的。
2大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)實證分析
2.1數(shù)據(jù)預處理及描述
本文基于Apriori算法構(gòu)建大額保險大數(shù)據(jù)智能反欺詐新系統(tǒng),具體的操作步驟如下。首先掃描整張事務數(shù)據(jù)庫D,設(shè)置一個最小支持度Smin,根據(jù)最小支持度Smin產(chǎn)生第一個頻繁項集S1;由S1執(zhí)行連接和剪枝操作,產(chǎn)生候選項集的集合,并根據(jù)Smin產(chǎn)生頻繁項集S2;接下來再由S2產(chǎn)生S3;這樣的操作一直進行下去,直到Sk成為空集時結(jié)束。根據(jù)聚類分析中運行效率高低的類別,所有的事務也可以分為五大類。對這五類數(shù)據(jù)分別使用Apriori算法,找到各自情況下的主要影響因素。所以頻繁項集的最小支持度滿足:Sminn<||An⑴公式⑴中,An主要用于表示第n類運行效率的事務集;Sminn主要用于對該事務集的頻繁項集的最小支持度進行表示。每個影響因素都產(chǎn)生五個“項”,假設(shè)最終數(shù)據(jù)產(chǎn)生的項為B1,B2,B3,B4,C1,C2,C3,D1,...,掃描整張數(shù)據(jù)表格,根據(jù)最小支持度Smin找到第一個頻繁項集的集合;在此基礎(chǔ)上,連接下一個項,產(chǎn)生含有兩個項的候選項集(例如:B1BC2,B1BC3,C2D2,...);剪枝后根據(jù)最小支持度得出第二個頻繁項集的集合。以此類推,直到最后產(chǎn)生的頻繁項集是空集。最終,該算法一共得到五個頻繁項集。該算法分別找出了可以欺詐行為風險高、較高、一般、較低、低的頻繁項集。在這些項集中,所有出現(xiàn)的疑似欺詐行為,都是導致大額保險管理風險的主要影響因素。
2.2大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)實證結(jié)果
2.2.1系統(tǒng)主體業(yè)務流程。系統(tǒng)的主體業(yè)務流程分為四個階段:StepStep1:數(shù)據(jù)抽取,系統(tǒng)通過把各個保險公司的大額保險業(yè)務數(shù)據(jù)集合起來并進行預處理,然后把保單數(shù)據(jù)保存至汽車保險反欺詐系統(tǒng)的中央數(shù)據(jù)庫。StepStep2:數(shù)據(jù)加工,大額保險反欺詐系統(tǒng)的核必系統(tǒng)通過這些數(shù)據(jù)進行挖掘,發(fā)現(xiàn)其中的規(guī)律,并將規(guī)律與數(shù)據(jù)進行保存。StepStep3:數(shù)據(jù)查詢,當各個保險公司的業(yè)務員在建立保單時,需要通過大額保險的反欺詐系統(tǒng)進行風險分析,以確定該保單是否接受,當投保人要求理賠時,可以根據(jù)分析結(jié)果來確定是否應該賠付與賠付的具體額度。StepStep4:數(shù)據(jù)保存,對于風險特別高的數(shù)據(jù),業(yè)務員應該保存到大額保險反欺詐系統(tǒng)中。2.2.2試驗結(jié)果。將已有的數(shù)據(jù)分別分為訓練集和測試集兩個部分,訓練集用于反向傳播訓練系統(tǒng),測試集用來檢驗系統(tǒng)輸出的誤差與精度。將所有數(shù)據(jù)循環(huán)處理一次,時間在0.5s左右,此時的測試誤差約15%;循環(huán)處理100、1000、2000次系統(tǒng)的預測精度會有明顯的提升。最終將2000次循環(huán)后的結(jié)果等價為:運行效率與其主要影響因素的定量關(guān)系。將提取主要影響因素的訓練結(jié)果(CNN4)、不提取主要影響因素的結(jié)果(CNN6)以及使用Apriori算法的結(jié)果放到一張表中進行對比,結(jié)果見表1。從表1對比結(jié)果來看,Apriori算法考慮全部影響因素的運行效率預測值誤差為0.98%;而僅考慮主要影響因素的預測誤差0.71%,預測精度都很高,都可以很好地預測運行效率值。本系統(tǒng)已經(jīng)在某財險的部分分公司與某保險的部分分公司試運營,通過半年內(nèi)的152件減損與拒賠的案件的處理,總共為保險公司減損或拒賠的金額達9638.84萬元。
3結(jié)束語
近年來,我國各個地區(qū)保險欺詐事件的頻頻出現(xiàn),且發(fā)生率日漸明顯。面對這種層出不窮的欺詐行為,保險人士很難經(jīng)由個人經(jīng)驗來進行有效識別,但隨著大數(shù)據(jù)技術(shù)的發(fā)展,基于Apriori算法就能夠?qū)崿F(xiàn)對各項數(shù)據(jù)的關(guān)聯(lián)處理,從而快速完成對大額保險欺詐行為的有效識別。為了能夠盡可能地減少欺詐案件,推動社會資金的合理分配與保險行業(yè)的正常發(fā)展,本文基于Apriori算法構(gòu)建起了大額保險大數(shù)據(jù)智能反欺詐系統(tǒng),較好的實現(xiàn)對現(xiàn)階段大額保險欺詐行為的有效識別,但該系統(tǒng)還存在一定的局限之處,還需要借助數(shù)據(jù)挖掘技術(shù)對各項業(yè)務數(shù)據(jù)做進一步的挖掘,提高系統(tǒng)運作的有效性。
參考文獻
[1]白浩,袁智勇,孫睿等.基于Apriori算法和卷積神經(jīng)網(wǎng)絡(luò)的配電設(shè)備運行效率主要影響因素挖掘[J].電力建設(shè),2020.41(3):31-38
[2]翟繼強,馬文亭,肖亞軍.Apriori-KNN算法的警報過濾機制的入侵檢測系統(tǒng)[J].小型微型計算機系統(tǒng),2018.39(12):2632-2635
作者:須秋夢 章民融 單位:中國人民財產(chǎn)保險股份有限公司 上海市分公司上海市計算技術(shù)研究所