螞蟻集團(tuán)王興馳首次公開分享螞蟻全圖風(fēng)控技術(shù)架構(gòu)
8月5日消息,在剛剛結(jié)束的數(shù)字中國峰會展會上,螞蟻集團(tuán)全圖風(fēng)控技術(shù)負(fù)責(zé)人王興馳發(fā)表現(xiàn)場演講,首次公開分享螞蟻全圖風(fēng)控技術(shù)架構(gòu)。全圖風(fēng)控是螞蟻自研的智能風(fēng)控技術(shù)體系“IMAGE”的組成部分,該體系還包括交互式主動風(fēng)控、端邊云協(xié)同風(fēng)控、多方風(fēng)控和智能對抗。
圖技術(shù)正成為風(fēng)控市場的關(guān)注重點。把圖技術(shù)應(yīng)用于風(fēng)控領(lǐng)域,可以構(gòu)建風(fēng)險關(guān)系網(wǎng)絡(luò),實現(xiàn)對風(fēng)險全鏈路的、關(guān)系視角的刻畫,從而解決傳統(tǒng)風(fēng)控碎片化的問題。
以下是王興馳的演講內(nèi)容實錄:
各位下午好,今天我的分享會分三個部分,首先,概述整個風(fēng)控行業(yè)面臨怎樣的風(fēng)險形勢升級;第二,在這種風(fēng)險形勢變化下,螞蟻如何用圖解決問題;第三,介紹螞蟻的全圖風(fēng)控整體架構(gòu)是什么樣子,應(yīng)用情況如何。
風(fēng)控行業(yè)面臨的風(fēng)險形式升級
1. 風(fēng)險趨勢一:利用跑分/水房賬號進(jìn)行三方欺詐的模式出現(xiàn), 欺詐交易鏈條復(fù)雜化
我們先看一個簡單的欺詐案例:張某是一個小商家,突然有一天接到一個冒充公檢法的電話,威脅他如果不轉(zhuǎn)賬做保障,可能要吊銷他的商家執(zhí)照。張某心慌,就把錢轉(zhuǎn)給了對方陸某。這時候螞蟻的智能風(fēng)控引擎會立刻判斷陸某是否曾經(jīng)被投訴過,是否在我們的處罰名單里面,以及過去一天是否有大額的或者多頻交易,通過這樣多個維度的判斷,幫助張某去識別陸某是不是一個欺詐者,這是我們在過去五六年用得最多的一種場景。
但是,風(fēng)控是一個攻防的過程,也就是說,黑產(chǎn)一直在進(jìn)化。我們發(fā)現(xiàn)現(xiàn)階段一個很重要的變化就是,黑產(chǎn)引入了“跑分平臺”或“水房賬號”等模式, 來規(guī)避之前的防御。
什么叫跑分平臺和水房賬號?跑分平臺可以把許多受騙普通用戶的支付寶賬號收集起來的平臺,然后黑產(chǎn)利用這些用戶的個人收款碼,為別人進(jìn)行代收款,隨后賺取傭金,俗稱“過水”。
跑分平臺的加入,讓整個支付鏈路變得更加復(fù)雜,隔絕了被騙的張某和騙子陸某,從而讓風(fēng)險更難識別。而且復(fù)雜的欺詐交易鏈路會有多度,它可能會從中規(guī)模的跑分到小規(guī)模,小規(guī)模再到大規(guī)模等等,經(jīng)過幾度的傳播,這筆錢才真正到達(dá)陸某。
錢在不停地流轉(zhuǎn),這使得風(fēng)控系統(tǒng)面對同一個賬戶找出欺詐行為的難度提高。因此,新型風(fēng)險升級的趨勢變化之一,就是跑分平臺和水房賬號的加入,讓交易鏈路復(fù)雜化,從而難以識別。
2. 風(fēng)險趨勢二:黑產(chǎn)團(tuán)隊化,聚集性風(fēng)險上升
如今的風(fēng)險基本不是用戶的一張銀行卡掉到地上,被其他人撿起來盜刷,這樣簡單的個體風(fēng)險。通過我們的風(fēng)控實踐來看,團(tuán)伙性風(fēng)險在逐年增高,現(xiàn)在更多都是團(tuán)伙作案。
大家可以通過下面這個案例了解:今天張某去劉某處消費,花了35塊錢,用了6塊錢的券;吳某也去劉某處消費,交易了10塊錢,用了2塊錢的券;之后劉某轉(zhuǎn)了45塊錢給高某。
如果我們從每一筆孤立的行為來看,每一筆轉(zhuǎn)帳都是正常的。但如果把視角往上升到全局來看,其實發(fā)生了什么事情呢?所謂的“買賣”雙方聯(lián)合了起來,把本應(yīng)該用于拉新促活的消費券薅走了。“賣家”收到資金之后, 并沒有出貨, 只是把錢轉(zhuǎn)回去循環(huán)利用,通過小小的45塊錢,他們可以循環(huán)著把大量營銷費用薅走。這是我們發(fā)現(xiàn)的第二個風(fēng)險變化趨勢,即黑產(chǎn)行為團(tuán)伙化,聚集性風(fēng)險上升,傳統(tǒng)地從個體角度孤立看風(fēng)險的做法不適用了。
3. 風(fēng)險趨勢三:資金時序變化加快,通過單筆交易識別資金流轉(zhuǎn)鏈路難度上升
第三個風(fēng)險形式的升級是資金時序的變化,這常見于洗錢。前面我們講過,如今黑產(chǎn)會引入水房賬號,參與主體變多了,導(dǎo)致風(fēng)險難以識別。而在洗錢的場景中,變化的不僅是主體數(shù)量,錢的流轉(zhuǎn)速度也大為提高。因此我們要關(guān)注的不僅是交易的空間關(guān)系,也包括時序關(guān)系。
圖源: 螞蟻技術(shù)AntTech官微,下同
在洗錢的場景中,大家要把自己想成一筆錢,這筆錢到底在體系里面經(jīng)歷哪些節(jié)點?這些節(jié)點到底是水房賬號還是賭博莊家?最終這筆錢轉(zhuǎn)出體系的時候,我們需要根據(jù)這筆交易的歷史,溯源出當(dāng)前這筆交易是否是洗錢最后一步。
應(yīng)對復(fù)雜風(fēng)險形勢的下一代風(fēng)控基礎(chǔ)設(shè)施
總結(jié)起來,現(xiàn)在整個風(fēng)控業(yè)界面臨的風(fēng)險,是從顯性的個體風(fēng)險,轉(zhuǎn)化為了隱性的、有組織有規(guī)模的團(tuán)伙化風(fēng)險。
面對風(fēng)險的新態(tài)勢,我們需要什么?需要具備同時刻畫空間和時間維度的能力??臻g上,它能夠關(guān)聯(lián)除了人以外的更多主體,例如常用的WiFi等;時間上,它要能反映出多種主體的時序行為特征。
經(jīng)過大量研究,我們認(rèn)為,圖具有這樣強(qiáng)的承載力和刻畫能力。
其實圖技術(shù)目前在很多領(lǐng)域都有應(yīng)用,但把圖技術(shù)和風(fēng)控結(jié)合起來沒有這么簡單,這跟風(fēng)控本身強(qiáng)對抗、低延時的特性有關(guān)。舉個例子,在搜索推薦場景下,下午2點鐘,你用圖找出一群人,他們是高凈值人群,你給高凈值人群推薦匹配的一些產(chǎn)品。一個小時之后,他們大概率還依然是高凈值人群。但是,在風(fēng)控場景里面,一個小時可以完成十幾筆甚至幾百筆的轉(zhuǎn)賬,可能一分鐘就發(fā)生了一次洗錢行為,所以風(fēng)控必須是低延時的,是實時的。
圖技術(shù)能解決風(fēng)控的許多問題,同時風(fēng)控的特性也對圖提出了非常多的挑戰(zhàn)。綜合這些因素,螞蟻安全團(tuán)隊建設(shè)了全圖風(fēng)控設(shè)施,作為應(yīng)對復(fù)雜風(fēng)險形勢的下一代風(fēng)控基礎(chǔ)設(shè)施。全圖風(fēng)控也是螞蟻“IMAGE”智能風(fēng)控體系中的一個核心技術(shù)(G)。
全圖風(fēng)控即全域一張圖,強(qiáng)對抗、低延時特性也要求提高圖計算的豐富程度。在全圖風(fēng)控中,除了用傳統(tǒng)的多度查詢來進(jìn)行風(fēng)險鏈路判斷,我們還引入模式識別的方式(菱形/三角型等)、社區(qū)發(fā)現(xiàn)的算法等來應(yīng)對更加復(fù)雜的場景。同時我們也必須保證圖計算和圖數(shù)據(jù)的時效性,能在毫秒級進(jìn)行一次識別。
總的來說,全圖風(fēng)控可以提供以下幾個核心服務(wù)能力:第一是基于圖的團(tuán)伙挖掘的能力,包括團(tuán)伙整個行動鏈路上的挖掘、定性、分析以及追蹤;第二,基于圖的資金鏈路識別,在反洗錢場景上,我們會看一筆錢最終是怎么到達(dá)這里,它進(jìn)入支付寶和出支付寶路徑是什么;第三,基于圖的可信識別,我們能構(gòu)建一個可信網(wǎng)絡(luò),幫助風(fēng)控快速判斷一筆交易是否可信。
全圖風(fēng)控是應(yīng)對復(fù)雜風(fēng)險的下一代風(fēng)控基礎(chǔ)設(shè)施。在應(yīng)用層,全圖風(fēng)控應(yīng)用于整個風(fēng)控的生命周期,包括風(fēng)險感知、風(fēng)險識別、風(fēng)險管控、風(fēng)險審理、風(fēng)險分析?;趫D的異常檢測,能夠提前做到風(fēng)險感知;在事中識別的時候,通過多樣化圖計算,配置不同SLA的特征去幫助事中風(fēng)險識別;在風(fēng)險分析階段,利用豐富的圖數(shù)據(jù)去關(guān)聯(lián)或者探索出更多信息來輔助案件審理和分析。
螞蟻全圖風(fēng)控的技術(shù)架構(gòu)和應(yīng)用情況
接下來講一講螞蟻全圖風(fēng)控的技術(shù)架構(gòu)。我簡單地分為風(fēng)險一張圖的構(gòu)圖層和多模圖計算的計算架構(gòu)層。
先從風(fēng)險構(gòu)圖來說:
1. 圖數(shù)據(jù)來源的數(shù)據(jù)格式各不相同,有半結(jié)構(gòu)化的數(shù)據(jù)、非結(jié)構(gòu)化的數(shù)據(jù)以及相對結(jié)構(gòu)化的數(shù)據(jù),同時源數(shù)據(jù)的多樣性也體現(xiàn)在它的時效性存在差異,有離線版的源數(shù)據(jù)也有近線版的源數(shù)據(jù)。針對源數(shù)據(jù)的多樣性, 建設(shè)一套標(biāo)準(zhǔn)化的圖清洗流程,從最源頭的數(shù)據(jù)源內(nèi)容管理來保障接入數(shù)據(jù)源質(zhì)量和標(biāo)準(zhǔn)化, 到運行時保障整套流程能夠適配到多種運行時應(yīng)對時效性的差異。
2. 當(dāng)原始數(shù)據(jù)清洗成相應(yīng)的圖數(shù)據(jù)時候, 就需要針對圖數(shù)據(jù)進(jìn)行建模。在圖建模過程中為了應(yīng)對跨域共享共知的問題, 首次提出風(fēng)險一張圖的概念,建設(shè)一套全局邏輯大圖來承載和管理多源化數(shù)據(jù)的一致性和口徑等問題, 在這個過程中引入圖數(shù)據(jù)委員會的機(jī)制標(biāo)準(zhǔn)化以及整個邏輯大圖的運營工作。
3. 為了解決各域業(yè)務(wù)對于場景化圖應(yīng)用的問題, 設(shè)計業(yè)務(wù)圖組件來解決多樣化點/邊轉(zhuǎn)化需求, 同時在這個模塊中加入存儲物化方案,保障圖數(shù)據(jù)可以物化到在線/近線/離線的場景的解決物化遇見的大點/熱點等場景問題。
再說全圖計算層:
1. 在計算層中首要解決的,就是風(fēng)險對抗中,如何用一套統(tǒng)一的框架把圖查詢、圖挖掘、圖學(xué)習(xí)等圖計算手段進(jìn)行歸納并且抽象, 來保障業(yè)務(wù)可以在不同場景中選擇最合適手段進(jìn)行風(fēng)控模式的識別。經(jīng)過多年圖應(yīng)用場景的定制和磨礪, 全圖風(fēng)控沉淀了一套多模計算框架來解決上訴問題。統(tǒng)一的多模計算框架分觸發(fā)源模塊、計算模式模塊、圖計算DSL模塊、靜態(tài)編譯和評估仿真模塊。觸發(fā)源模塊和計算模式兩個模塊相互配合, 重點解決圖應(yīng)用場景中不同數(shù)據(jù)源用不同計算方式觸發(fā)計算的多樣性問題, 例如常見的實時風(fēng)險識別中來風(fēng)險事件進(jìn)行一次識別, 或者定時一個小時進(jìn)行一次全圖點觸發(fā)的圖計算等。
2. 統(tǒng)一圖計算DSL模塊。圖查詢/圖挖掘/圖學(xué)習(xí)的方式多樣, 如何利用用一個統(tǒng)一圖DSL來歸納和收斂多樣性,保障業(yè)務(wù)可以靈活的應(yīng)用?在設(shè)計統(tǒng)一圖DSL時,我們把純粹的子圖抽取的DSL先拆分出來,保障可以靈活查詢一個子圖; 然后再根據(jù)這個子圖進(jìn)行兩種計算,一種是子圖轉(zhuǎn)換成表的統(tǒng)計型計算,一種是針對子圖的模型型計算。
3. 當(dāng)圖計算模式確定之后, 接下來就是針對圖計算模式進(jìn)行物化選擇和優(yōu)化。由于底層針對不同時效性的圖計算引擎差異, 導(dǎo)致圖計算模式最終根據(jù)業(yè)務(wù)需求和SLA所確定引擎會存在不同, 多模圖計算選擇就是用來根據(jù)圖計算模式, 業(yè)務(wù)SLA和成本來匹配相應(yīng)的引擎。當(dāng)圖計算模式匹配成功之后, 接下來就會進(jìn)行優(yōu)化階段主要解決就是風(fēng)控特性帶來的時效性問題, 例如在線圖查詢要求三度以內(nèi)20ms返回。重點基于底層影響大的大點/緩存,以及數(shù)據(jù)分區(qū)進(jìn)行優(yōu)化。
接下來簡單介紹一下全圖風(fēng)控目前在整個螞蟻集團(tuán)應(yīng)用的情況。從圖數(shù)據(jù)層面,我們構(gòu)建了螞蟻風(fēng)險一張圖,是整個風(fēng)控的數(shù)據(jù)底盤,在一些業(yè)務(wù)結(jié)果上,我們的風(fēng)險識別在原有的基礎(chǔ)上提升了9.4倍,審理分析能力提升了90%。
我們對全圖風(fēng)控的定位是應(yīng)對復(fù)雜風(fēng)險的下一代風(fēng)控的基礎(chǔ)設(shè)施。為什么?在跨域的風(fēng)險數(shù)據(jù)上,我們希望能有一張圖能夠做補(bǔ)全對齊,保證我們在應(yīng)對黑產(chǎn)的時候,可以會跨主體和時間的交互去刻畫風(fēng)險,而不是一個單一維度上去刻畫。在顯性模式挖掘基礎(chǔ)上挖掘隱式特征關(guān)聯(lián),把一種被動的攻防能夠轉(zhuǎn)化成主動出擊,這就是我們認(rèn)為全圖風(fēng)控是下一代風(fēng)控基礎(chǔ)設(shè)施的原因。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
