螞蟻數科在中關村論壇系列活動第12屆數位金融與科技金融大會上,以其Deepfake檢測方案榮獲「金融科技技術創新與應用案例」獎項。此方案依託於螞蟻數科天璣實驗室,建構了業界首個大規模、高品質、多模態的Deepfake資料集,有效提升了Deepfake檢測模型的準確性與可靠性,成功應用於實際金融業務場景,有效保護使用者資產安全。此資料集的建構解決了以往金融領域Deepfake檢測模型訓練規模小和無法在真實環境中評估的難題,並推動了傳統檢測模型的發展。
近日,在中關村論壇系列活動第12屆數位金融與科技金融大會上,螞蟻數科的Deepfake檢測方案入選大會「金融科技科技創新與應用案例」。
螞蟻數科依托旗下天璣實驗室,業界首次建構了大規模、高品質、多模態的Deepfake資料集,其合成超過百萬級多媒體內容,充分模擬了真實世界金融風控環境中的Deepfake攻擊樣本,成為評測現有金融領域Deepfake偵測模型效能的重要標準。在金融業務場景中,螞蟻數科多組測試資料集上的Deepfake檢測準確率達到了98%以上,並成功阻止了多起利用Deepfake技術進行的詐欺行為,保護了用戶的資產安全。
此資料集解決了以往金融領域Deepfake檢測模型無法大規模訓練,無法在真實環境中評估的問題,並且從多模態分析角度促進了傳統檢測模型的發展。目前該資料集已成為螞蟻數科反深偽產品ZOLOZDeeper對外服務客戶的關鍵能力。

據了解,螞蟻數科使用先進的多達81種Deepfake技術產生高品質的合成影像,涵蓋了多種偽造技術類型、複雜光照條件、背景環境和臉部表情,以模擬複雜逼真的真實世界攻擊環境。除了靜態影像外,還收集並產生了大量包含聲音的視訊數據,包括100多種偽造技術類型,涵蓋不同語種、口音和背景噪音,確保資料集的多樣性和複雜性。
在資料預處理和標註階段,螞蟻數科會對收集到的資料進行清洗和預處理,確保資料品質。透過專家團隊將資料標註,明確每張影像或每個影片是否為Deepfake產生的內容,同時確保偽造痕跡的最小化,達到高度逼真的效果。此前,螞蟻數科發布了AI數據合成與生產平台,在數據標註層面實現了“AI主導”,標註模型依賴人工標註量降低了70%以上。
此外,螞蟻數科在2024外灘大會發起了一場Deepfake攻防挑戰賽,將Deepfake數據集作為比賽的基礎訓練和測試數據,吸引到了全球26個國家和地區,2200多名選手報名參賽。透過大賽選手貢獻的演算法方案,Deepfake資料集的攻擊品質和偵測難度都得到了有效驗證和評估。
隨著人工智慧技術的發展,Deepfake技術也迅速進步。這種技術利用深度學習演算法,可以對影片中的人臉進行逼真的替換。儘管Deepfake在娛樂和傳媒等領域有著積極的應用,但在金融領域,特別是身分驗證和交易驗證環節,Deepfake技術帶來了新的風險。金融機構的身份驗證系統往往依賴生物辨識技術,如人臉辨識。一旦這些系統被Deepfake技術所欺騙,可能導致嚴重的金融詐欺。
有鑑於此,開發針對Deepfake攻擊的偵測系統在金融領域是十分必要的,但是強大的Deepfake偵測防禦模型需要高品質符合真實世界環境的人臉Deepfake資料集,所以如何建立模擬真實世界的資料集以及如何驗證其有效性是緊迫的問題。
螞蟻數科的Deepfake檢測方案為金融安全提供了有力保障,其建構的大規模高品質資料集也為業界研究提供了寶貴資源,推動了Deepfake檢測技術的發展,為未來金融安全提供了新的方向。