來自國(guó)家新一代人工智能戰(zhàn)略咨詢委員會(huì)、國(guó)家兩院院士、人民銀行等有關(guān)領(lǐng)導(dǎo)以及國(guó)家開發(fā)銀行、中農(nóng)工建交五大行及20余家商業(yè)銀行及保險(xiǎn)等金融領(lǐng)域?qū)<?00余人出席會(huì)議。
大會(huì)聯(lián)合發(fā)布了專題報(bào)告《智能金融聯(lián)合報(bào)告:與AI共進(jìn),致勝未來》,同時(shí)中國(guó)工商銀行、中國(guó)農(nóng)業(yè)銀行、中國(guó)銀行、國(guó)泰君安等國(guó)內(nèi)主流金融機(jī)構(gòu)以及百度、騰訊、百度等知名科技企業(yè)、研究機(jī)構(gòu)發(fā)布了金融科技最新成果和應(yīng)用創(chuàng)新案例;微軟、IBM、埃森哲、畢馬威、普華永道等國(guó)際知名科技與咨詢公司就“區(qū)塊鏈、數(shù)字貨幣與智能金融”等當(dāng)前熱點(diǎn)話題進(jìn)行了圓桌對(duì)話。
中國(guó)金融科技創(chuàng)新大會(huì)在國(guó)家互聯(lián)網(wǎng)信息辦公室、中國(guó)人民銀行、工業(yè)和信息化部等部委的指導(dǎo)和支持下,已成功舉辦三屆,活動(dòng)立足國(guó)內(nèi),放眼全球,已成為金融科技業(yè)界理論研究、趨勢(shì)探討、案例推介、成果分享、應(yīng)用指導(dǎo)和業(yè)務(wù)對(duì)接的交流平臺(tái),對(duì)于推動(dòng)我國(guó)金融科技的理論研究和業(yè)務(wù)創(chuàng)新,維護(hù)國(guó)家金融信息安全和金融體系穩(wěn)定有著積極意義。
天云大數(shù)據(jù)獲獎(jiǎng)全文:天云大數(shù)據(jù)有效對(duì)銀行信用卡申卡欺詐預(yù)警
當(dāng)前,伴隨著金融市場(chǎng)向著國(guó)際化、自由化的方向發(fā)展,由金融衍生出的信貸工具越來越多,信用卡作為一種新型的、大眾化的金融電子產(chǎn)品給銀行帶來了兼有利弊的機(jī)遇和挑戰(zhàn)。所謂挑戰(zhàn)則是在辦理信用卡中存在的風(fēng)險(xiǎn)問題,銀行每年因金融欺詐損失數(shù)十億元,傳統(tǒng)的離散式反欺詐分析方法的漏洞暴露得越來越多,已無法有效阻止這些欺詐行為,經(jīng)驗(yàn)豐富的欺詐者利用這些漏洞創(chuàng)造出更多的欺詐手段而不被金融機(jī)構(gòu)發(fā)現(xiàn)。如何迅速有效的預(yù)測(cè)信用卡欺詐者,成為避免信用卡風(fēng)險(xiǎn)的關(guān)鍵。在這個(gè)需求的推動(dòng)下,大數(shù)據(jù)信用卡申卡欺詐預(yù)警應(yīng)運(yùn)而生。
天云大數(shù)據(jù)致力于幫助企業(yè)解決內(nèi)部數(shù)據(jù)的分析和已有數(shù)據(jù)孤島問題,基于對(duì)金融、保險(xiǎn)、運(yùn)營(yíng)商、廣視等行業(yè)的數(shù)據(jù)治理經(jīng)驗(yàn)的沉淀和復(fù)制,在服務(wù)過程中,研究由數(shù)據(jù)衍生出的各類產(chǎn)品的共性,探索出一套完整的數(shù)據(jù)產(chǎn)品服務(wù)體系。其在金融服務(wù)領(lǐng)域?yàn)殂y行、保險(xiǎn)等客戶提供歷史數(shù)據(jù)挖掘、風(fēng)險(xiǎn)一體化、風(fēng)險(xiǎn)種子識(shí)別、申卡欺詐預(yù)警等服務(wù)。
需要解決的問題
2016年上半年中國(guó)信用卡行業(yè)整體逾期半年未償貸款總額超過480億元,壞賬率較年初上升0.2個(gè)百分點(diǎn)。為更好應(yīng)對(duì)欺詐風(fēng)險(xiǎn),提高欺詐預(yù)警效率,國(guó)內(nèi)銀行不斷加強(qiáng)研究反欺詐手段,加強(qiáng)不同產(chǎn)品條線、業(yè)務(wù)部門之間的分工協(xié)作,防范欺詐風(fēng)險(xiǎn)。但是,從總體情況來看,國(guó)內(nèi)銀行的欺詐風(fēng)險(xiǎn)分析預(yù)警工作仍處于初級(jí)階段,面對(duì)欺詐者越來越多樣的高新技術(shù)手段,欺詐團(tuán)伙越來越組織嚴(yán)禁密切復(fù)雜的欺詐活動(dòng),欺詐范圍逐漸趨向國(guó)際化的現(xiàn)狀,以及隨著信用卡交易由有卡交易逐漸向無卡交易過度,為欺詐者提供了更多的便利,加強(qiáng)了其欺詐手段的隱蔽性,造成欺詐分析預(yù)警工作難度的增大,銀行亟需系統(tǒng)研究銀欺詐風(fēng)險(xiǎn),積極探尋應(yīng)對(duì)之策。
目前行業(yè)申卡欺詐分析預(yù)警工作存在的問題如下:
1.欺詐分析數(shù)據(jù)僅僅局限于歷史數(shù)據(jù)
銀行現(xiàn)有的申卡欺詐分析預(yù)警系統(tǒng)主要基于歷史數(shù)據(jù)進(jìn)行分析建立相關(guān)規(guī)則,對(duì)申卡信息進(jìn)行規(guī)則匹配判斷預(yù)警欺詐人員以及進(jìn)行欺詐類別判斷。而對(duì)于目前大部分銀行來說,其欺詐分析預(yù)警系統(tǒng)都是由不同部門在不同時(shí)期根據(jù)各自業(yè)務(wù)需要建立的,不同系統(tǒng)間信息相對(duì)隔離,不能做到及時(shí)傳遞、整合和共享,風(fēng)險(xiǎn)信息條線化、碎片化問題嚴(yán)重。此外,已經(jīng)建立的系統(tǒng)主要是客戶信息采集系統(tǒng),以收集客戶信息、檢測(cè)業(yè)務(wù)動(dòng)態(tài)、提供綜合查詢和統(tǒng)計(jì)報(bào)表等功能為主,對(duì)損失歷史數(shù)據(jù)的積累和分析嚴(yán)重不足,在缺乏損失事件基礎(chǔ)數(shù)據(jù)庫(kù)支撐的情況下,難以對(duì)欺詐風(fēng)險(xiǎn)進(jìn)行定量識(shí)別和評(píng)估。
2.基于規(guī)則匹配預(yù)判,受限制性強(qiáng)
目前銀行的申卡欺詐分析工作主要基于規(guī)則匹配進(jìn)行實(shí)現(xiàn)。一方面,傳統(tǒng)的規(guī)則匹配普適性較差,伴隨著新的參數(shù)狀態(tài)的出現(xiàn)常常有新的匹配規(guī)則需要被及時(shí)定制以進(jìn)行新的欺詐判斷。長(zhǎng)久積累的結(jié)果就是規(guī)則積累的數(shù)量不斷增多,與此同時(shí)規(guī)則維護(hù)需要的人員也迅速增長(zhǎng),銀行壓力漸漸增大,到最后已經(jīng)無力應(yīng)付規(guī)則維護(hù)強(qiáng)大的壓力沖擊。另一方面,規(guī)則匹配要求業(yè)務(wù)的可表達(dá)性強(qiáng),需要人工的介入,此種情況下,必然受到職業(yè)素養(yǎng)、道德品質(zhì)等主觀因素影響,造成的結(jié)果為較強(qiáng)的規(guī)則可規(guī)避性,引起欺詐風(fēng)險(xiǎn)的提高。
3.人才配備不能滿足需要,專業(yè)人才能力要求較高。
欺詐風(fēng)險(xiǎn)分析預(yù)警對(duì)商業(yè)銀行而言是一項(xiàng)難度系數(shù)比較高的工作,專業(yè)人才的積累和培養(yǎng)還需要一定時(shí)間,二隨著新技術(shù)的引入,人才空缺的范圍進(jìn)一步擴(kuò)大,接受過系統(tǒng)培訓(xùn)的人才一旦跳槽,很難從市場(chǎng)上找到合適人選。此外,銀行人才資源主要向前臺(tái)傾斜,中后臺(tái)配置高素質(zhì)人才在薪酬激勵(lì)、職業(yè)發(fā)展等方面也都存在諸多制約。反欺詐工作缺乏高素質(zhì)、復(fù)合性人才資源支撐,直接影響了反欺詐工作的專業(yè)化水平。
解決方案
隨著互聯(lián)網(wǎng)+時(shí)代的到來,各種各樣的信息越來越多的被以“數(shù)據(jù)”的形式記錄、存儲(chǔ)下來。對(duì)于銀行而言,其數(shù)據(jù)體系也逐漸發(fā)展成包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)的完整體系,涵蓋除了申卡系統(tǒng)及其相關(guān)流程的文本數(shù)據(jù)之外的email數(shù)據(jù)、錄音數(shù)據(jù)、視頻數(shù)據(jù)等以及其他的外部數(shù)據(jù)如銀聯(lián)數(shù)據(jù)。數(shù)據(jù)體系的擴(kuò)展如雙刃劍一般對(duì)銀行欺詐分析預(yù)警帶來機(jī)遇和挑戰(zhàn)。一方面,數(shù)據(jù)的豐富拓展,提高了欺詐風(fēng)險(xiǎn)分析預(yù)警的準(zhǔn)確度,帶來了新的研究方式與研究角度;另一方面,數(shù)據(jù)量的增大,數(shù)據(jù)類型的增多,增加了數(shù)據(jù)處理的難度,傳統(tǒng)的基于規(guī)則匹配的離散式欺詐分析預(yù)警系統(tǒng)已經(jīng)無法適應(yīng)龐大的數(shù)據(jù)系統(tǒng),無法提供更為合適準(zhǔn)確的判斷方法。
天云融創(chuàng)融合銀行內(nèi)部的數(shù)據(jù),建立數(shù)據(jù)挖掘系統(tǒng),引入地域關(guān)系、聯(lián)系關(guān)系、推薦關(guān)系等拓展建立申請(qǐng)人社交關(guān)系復(fù)雜網(wǎng)絡(luò),聯(lián)合銀行信用卡申請(qǐng)系統(tǒng)數(shù)據(jù),利用大數(shù)據(jù)分析技術(shù),建立信用卡申卡欺詐分析預(yù)警新模式。
1.引入復(fù)雜網(wǎng)絡(luò),構(gòu)建申請(qǐng)客戶社交關(guān)系網(wǎng)絡(luò)
具有自組織、自相似、吸引子、小世界、無標(biāo)度中部分或全部性質(zhì)的網(wǎng)絡(luò)稱為復(fù)雜網(wǎng)絡(luò),只要能抽象出網(wǎng)絡(luò)結(jié)構(gòu)的客觀事務(wù),都可以作為復(fù)雜網(wǎng)絡(luò)的研究的對(duì)象。天云融創(chuàng)將某大型股份制商業(yè)銀行北京地區(qū)信用卡申請(qǐng)客戶的基礎(chǔ)信息數(shù)據(jù)(總計(jì)超過30萬)借助復(fù)雜神經(jīng)網(wǎng)絡(luò)Hilbert,把申請(qǐng)人、申請(qǐng)人親屬、聯(lián)系人及推廣人這四種角色的移動(dòng)電話、家庭電話、辦公電話的相同作為關(guān)系,構(gòu)建客戶社交網(wǎng)絡(luò)圖,設(shè)計(jì)并計(jì)算出相關(guān)社交數(shù)據(jù)。
2.引入深度學(xué)習(xí),構(gòu)建欺詐分析新模式
深度學(xué)習(xí)是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上構(gòu)建一個(gè)多層結(jié)構(gòu)學(xué)習(xí)能力的算法。2016年Gartner在全球范圍內(nèi)對(duì)于計(jì)算智能的統(tǒng)計(jì)顯示,深度學(xué)習(xí)的熱度僅次于機(jī)器人被列入前三名的位置。近年來依托分布式、內(nèi)存等機(jī)器計(jì)算能力的飛速發(fā)展,深度學(xué)習(xí)在金融領(lǐng)域有了更廣泛的應(yīng)用。
神經(jīng)網(wǎng)絡(luò)是一種通過模仿人腦信息,類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)加工過程的智能化信息處理技術(shù)及進(jìn)行信息處理的數(shù)學(xué)模型,與博弈論中的動(dòng)態(tài)博弈很相似,具有自適應(yīng)性、自組織性以及較強(qiáng)勁的穩(wěn)健性,在應(yīng)用過程中具有很強(qiáng)的魯棒性和容錯(cuò)性,能夠并行處理方法,具有自學(xué)習(xí)性,擁有自組織、自適應(yīng)性和很強(qiáng)的信息綜合能力等良好性能,能同時(shí)處理定量和定性的信息,能很好的協(xié)調(diào)多種輸入信息關(guān)系,適用于處理復(fù)雜非線性和不確定對(duì)象,能成功的應(yīng)用于多種不同的信息處理。天云融創(chuàng)將復(fù)雜網(wǎng)絡(luò)得出的申請(qǐng)人社交數(shù)據(jù),聯(lián)合推廣人信息數(shù)據(jù)、申請(qǐng)人信息數(shù)據(jù)、單位聯(lián)系數(shù)據(jù)等引入神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)網(wǎng)絡(luò)在真實(shí)的數(shù)據(jù)集環(huán)境中學(xué)習(xí),通過不斷地學(xué)習(xí)過程提高效率,交互式的調(diào)整其連接權(quán)重,通過不斷增加學(xué)習(xí)過程,增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型對(duì)真實(shí)數(shù)據(jù)集的環(huán)境的了解,當(dāng)所有用于估計(jì)模型的訓(xùn)練集樣本誤差達(dá)到最小時(shí),神經(jīng)網(wǎng)絡(luò)擬合完成,并且隱含的神經(jīng)網(wǎng)絡(luò)模型決定屬性的分類規(guī)則。根據(jù)需求把新的申請(qǐng)信用卡客戶屬性轉(zhuǎn)換為相應(yīng)的數(shù)據(jù)代入模型,便可以得到客戶是否數(shù)據(jù)欺詐屬性以及其所屬類別。
圖 一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)
3.申卡客戶社交關(guān)系網(wǎng)絡(luò)構(gòu)建
在申卡客戶復(fù)雜關(guān)系網(wǎng)絡(luò)的過程中,天云融創(chuàng)利用具體某地區(qū)信用卡申請(qǐng)客戶的基礎(chǔ)信息數(shù)據(jù),對(duì)該地區(qū)進(jìn)件審批數(shù)據(jù)有全面的了解之后,確定該數(shù)據(jù)中包含申請(qǐng)人、推薦人在內(nèi)的四種角色,借助復(fù)雜神經(jīng)網(wǎng)絡(luò)Hilbert將申請(qǐng)人角色作為社交網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn),把四種角色的電話、地址等的相同作為關(guān)系,來實(shí)現(xiàn)復(fù)雜網(wǎng)絡(luò)的構(gòu)建,設(shè)計(jì)并計(jì)算出相關(guān)社交數(shù)據(jù)。
圖 申卡客戶社交關(guān)系復(fù)雜網(wǎng)絡(luò)
4.基于神經(jīng)網(wǎng)絡(luò)模型的客戶欺詐分析預(yù)警
天云融創(chuàng)將該地區(qū)信用卡申請(qǐng)客戶基礎(chǔ)信息數(shù)據(jù),以及復(fù)雜網(wǎng)絡(luò)計(jì)算所得社交數(shù)據(jù),主要使用神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸模型進(jìn)行模型訓(xùn)練和樣本測(cè)試。選取指標(biāo)對(duì)模型測(cè)試結(jié)果進(jìn)行評(píng)價(jià),并進(jìn)行相應(yīng)的改進(jìn),最終運(yùn)用模型對(duì)申卡客戶進(jìn)行欺詐分析。
通過神經(jīng)網(wǎng)絡(luò)和邏輯回歸模型的交叉驗(yàn)證以及預(yù)測(cè)結(jié)果可以看出,神經(jīng)網(wǎng)絡(luò)模型的AUC值能夠達(dá)到0.9,相比邏輯回歸模型的AUC值0.86,具有明顯的優(yōu)化效果。
達(dá)到的效果
當(dāng)前階段,大數(shù)據(jù)申卡欺詐分析預(yù)警技術(shù)是傳統(tǒng)欺詐預(yù)警的有力補(bǔ)充,二者結(jié)合既提高了申卡欺詐分析預(yù)警的效果,使普惠金融得以有可能真正落地。尤其隨著互聯(lián)網(wǎng)+的發(fā)展,各種信息以數(shù)據(jù)的形式被存儲(chǔ)記錄,大數(shù)據(jù)欺詐預(yù)警更是發(fā)揮了重要的作用,其使欺詐預(yù)警的評(píng)估維度更多、預(yù)警效率更高、應(yīng)用場(chǎng)景也更加多樣化。
1.擴(kuò)大了申卡欺詐數(shù)據(jù)源
目前的大數(shù)據(jù)反欺詐技術(shù)離不開文本挖掘,最重要的是語義識(shí)別。其次重要的是圖像的挖掘,包括OCR識(shí)別圖像文字、相似圖片等等。傳統(tǒng)申卡欺詐分析中往往運(yùn)用強(qiáng)變量來評(píng)估個(gè)人在未來信用卡使用行為中的表現(xiàn),沒有整合分析其他維度的數(shù)據(jù)源。大數(shù)據(jù)申卡欺詐分析預(yù)警系統(tǒng),首先,融合了信用卡申請(qǐng)環(huán)節(jié)的各個(gè)業(yè)務(wù)數(shù)據(jù),解決了數(shù)據(jù)孤島的問題;其次,引入第三方數(shù)據(jù),比如銀聯(lián)數(shù)據(jù)等,擴(kuò)展了數(shù)據(jù)的維度;最后,通過復(fù)雜網(wǎng)絡(luò)技術(shù),構(gòu)建申卡客戶的社交復(fù)雜網(wǎng)絡(luò)提供客戶的社交數(shù)據(jù),在拓展覆蓋維度的同時(shí),以弱變量來體現(xiàn)強(qiáng)變量,并且實(shí)現(xiàn)了社交數(shù)據(jù)的高頻率更新,提高了數(shù)據(jù)的準(zhǔn)確有效性。
2.極大提高申卡欺詐預(yù)警準(zhǔn)確率
傳統(tǒng)的申卡欺詐分析預(yù)警技術(shù)需要大量的人工審核工作,必然摻雜了員工的主觀因素,同時(shí)也提高了銀行內(nèi)外部聯(lián)合詐騙的風(fēng)險(xiǎn)?;诖髷?shù)據(jù)技術(shù)的申卡欺詐分析預(yù)警系統(tǒng),大量減少了人工操作部分,同時(shí)提供了社交關(guān)系數(shù)據(jù)庫(kù),提高申卡欺詐預(yù)警的準(zhǔn)確率。
3.擴(kuò)大了申卡欺詐分析模式
傳統(tǒng)的申卡欺詐分析模式主要是基于規(guī)則匹配模型進(jìn)行實(shí)現(xiàn)。隨著經(jīng)濟(jì)的發(fā)展,市場(chǎng)的變化,科技的創(chuàng)新,欺詐方式不斷更新積累,這倒是規(guī)則的數(shù)量不斷增多到非常龐大的數(shù)量,維護(hù)和迭代更新的壓力增大?;诖髷?shù)據(jù)技術(shù)的申卡欺詐分析預(yù)警模式,主要是對(duì)大量數(shù)據(jù)進(jìn)行挖掘,提供和清洗訓(xùn)練樣本,針對(duì)億級(jí)別的訓(xùn)練樣本,提取擴(kuò)展千萬的特征,結(jié)合社交關(guān)系數(shù)據(jù),利用大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí)平臺(tái)進(jìn)行模型訓(xùn)練。新型模式具有準(zhǔn)召率高、預(yù)測(cè)效率高、善于發(fā)現(xiàn)新模型、從海量數(shù)據(jù)中總結(jié)規(guī)律、模型穩(wěn)定、還有能力同時(shí)應(yīng)對(duì)多個(gè)分類的優(yōu)勢(shì)。