Případová studie modelu rozpoznávání obličeje
Anti-Spoofing Video Dataset pro modely AI pro detekci podvodů
Zjistěte, jak Shaip dodal 25,000 XNUMX vysoce kvalitních videodatových souborů proti falšování obsahujících skutečné a opakované scénáře útoků pro trénování modelů umělé inteligence pro detekci podvodů.
Přehled projektu
Společnost Shaip se spojila s přední společností zabývající se zabezpečením umělé inteligence, aby poskytla vysoce kvalitní, komerčně dostupný soubor video dat proti falšování, který byl navržen tak, aby zlepšil školení modelů umělé inteligence pro odhalování podvodů. Datový soubor obsahoval 25,000 XNUMX videí zachycujících skutečné i přehrávané scénáře útoku, což zajistilo robustní trénovací data pro modely proti falšování.
Každý z Účastníci 12,500 přispěl dvěma videi – jedním skutečným a jedním opakovaným útokem – zaznamenaným na 720p nebo vyšší rozlišení se snímkovou frekvencí 26 FPS a více.
Cílem projektu bylo doručit autentické a různorodé datové sady to by umožnilo modelům umělé inteligence efektivně rozlišovat mezi skutečnými a podvrženými biometrickými videi, čímž by se snížilo riziko podvodu v systémech biometrické autentizace.

Klíčové statistiky
25,000 celkem videí (12,500 skutečná videa, 12,500 přehrát útočná videa)
12,500 unikátní
účastníci
5 etnické skupiny
zastoupené v datové sadě
Postupné dodání: 4 šarží 6,250 videa každý
Atributy metadat: 12 klíčové parametry pro lepší použitelnost datové sady
Anti-Spoofing rozsah biometrické datové sady
Správa datové sady: Projekt se zaměřil na dodání vysoce kvalitních anti-spoofing video datových sad sestávajících z skutečná a přehrání útočných videí. Mezi klíčové aspekty patří:
- Účastníci 12,500 přispívat každé dvě videa (1 skutečný, 1 falešný).
- Rozmanitost v záznamových zařízeních zlepšit přizpůsobivost modelu.
- Vyvážené etnické zastoupení aby byla zajištěna inkluzivita datové sady.
Sběr metadat: Každé video bylo doplněno o 12 atributů metadat zlepšit použitelnost datové sady.
Výzvy pro sběr videodat
Zachování vyvážené distribuce dat z hlediska etnického původu a zároveň získávání vysoce kvalitních videí.
Zajištění toho, aby každý účastník přispěl jedním skutečným a jedním přehraným útočným videem, aby byla zachována integrita datové sady.
Dodržování přísných pokynů pro FPS (≥ 26), rozlišení (≥ 720p) a přesnost časového razítka (+/- 0.5 ms).
Jak jsme to vyřešili
Společnost Shaip poskytla strukturovaný a vysoce kvalitní soubor dat, který splňuje požadavky projektu. Řešení zahrnovalo:
Správa datové sady a kontrola kvality
- 25,000 videa shromážděné napříč Fáze 4 zajistit stabilní a strukturovaný tok dat a vyhnout se úzkým místům.
- Přísný proces ověřování zajistit dodržování FPS, rozlišení a přesnost metadat. Každé video prošlo před konečným přijetím několika kontrolami kvality.
- Komplexní značkování metadat s 12 atributy:
- ID/název souboru
- Typ útoku (skutečný/replay)
- ID osoby
- Rozlišení videa
- Video Doba trvání
- Etnická příslušnost subjektu
- Pohlaví subjektu
- Zda je video původní nebo falešné
- Název/Model zařízení
- Osoba, která mluví nebo ne
- Časové razítko Čas začátku
- Časové razítko Čas konce
- Vyvážená etnická skupinová distribuce: Soubor dat byl pečlivě upraven, aby bylo zachováno vyvážené etnické zastoupení. Distribuce zahrnuje hispánskou (33 %), jihoasijskou (21 %), kavkazskou (20 %), africkou (15 %) a východoasijskou a blízkovýchodní populaci (každá tvoří až 6 %).
- Žádné duplicitní záznamy zachovat jedinečnost datové sady a zabránit zkreslení při školení AI.
- Etnicky různorodý výběr účastníků k vytvoření datové sady, která odráží skutečné uživatelské variace a zlepšuje přizpůsobivost a spravedlivost modelu AI.
- Variace záznamového zařízení zahrnoval několik modelů smartphonů, fotoaparátů a světelných podmínek, aby se zvýšila odolnost modelu vůči různým prostředím.
Výsledek
Vysoce kvalitní a různorodá datová sada videa proti falšování poskytovaná společností Shaip umožnila klientovi trénovat modely umělé inteligence, aby přesně rozlišovaly mezi skutečnými a falešnými videi v různých scénářích biometrické autentizace. Datový soubor přispěl k:
Vylepšený výkon AI při odhalování podvodných biometrických útoků.
Posílena schopnost modelu rozpoznat opakované útoky napříč různými etniky, zařízeními a podmínkami prostředí.
Tato datová sada slouží jako základ pro budoucí vylepšení a rozšíření modelu anti-spoofing.
Shaipova datová sada byla nápomocná při vylepšování našich anti-spoofing modelů řízených umělou inteligencí. Rozmanitost, kvalita a strukturovaná metadata poskytla pevný základ pro zlepšení odhalování podvodů v systémech biometrické autentizace.