Případová studie modelu rozpoznávání obličeje

Anti-Spoofing Video Dataset pro modely AI pro detekci podvodů

Zjistěte, jak Shaip dodal 25,000 XNUMX vysoce kvalitních videodatových souborů proti falšování obsahujících skutečné a opakované scénáře útoků pro trénování modelů umělé inteligence pro detekci podvodů.

Anti-spoofing shromažďování video dat

Přehled projektu

Společnost Shaip se spojila s přední společností zabývající se zabezpečením umělé inteligence, aby poskytla vysoce kvalitní, komerčně dostupný soubor video dat proti falšování, který byl navržen tak, aby zlepšil školení modelů umělé inteligence pro odhalování podvodů. Datový soubor obsahoval 25,000 XNUMX videí zachycujících skutečné i přehrávané scénáře útoku, což zajistilo robustní trénovací data pro modely proti falšování.

Každý z Účastníci 12,500 přispěl dvěma videi – jedním skutečným a jedním opakovaným útokem – zaznamenaným na 720p nebo vyšší rozlišení se snímkovou frekvencí 26 FPS a více.

Cílem projektu bylo doručit autentické a různorodé datové sady to by umožnilo modelům umělé inteligence efektivně rozlišovat mezi skutečnými a podvrženými biometrickými videi, čímž by se snížilo riziko podvodu v systémech biometrické autentizace.

Anti-spoofing shromažďování video dat

Klíčové statistiky

25,000 celkem videí (12,500 skutečná videa, 12,500 přehrát útočná videa)

12,500 unikátní
účastníci

5 etnické skupiny
zastoupené v datové sadě

Postupné dodání: 4 šarží 6,250 videa každý

Atributy metadat: 12 klíčové parametry pro lepší použitelnost datové sady

Anti-Spoofing rozsah biometrické datové sady

Správa datové sady: Projekt se zaměřil na dodání vysoce kvalitních anti-spoofing video datových sad sestávajících z skutečná a přehrání útočných videí. Mezi klíčové aspekty patří:

  • Účastníci 12,500 přispívat každé dvě videa (1 skutečný, 1 falešný).
  • Rozmanitost v záznamových zařízeních zlepšit přizpůsobivost modelu.
  • Vyvážené etnické zastoupení aby byla zajištěna inkluzivita datové sady.

Sběr metadat: Každé video bylo doplněno o 12 atributů metadat zlepšit použitelnost datové sady.

Výzvy pro sběr videodat

Zajištění rovného zastoupení

Zachování vyvážené distribuce dat z hlediska etnického původu a zároveň získávání vysoce kvalitních videí.

Kontrola kvality

Zajištění toho, aby každý účastník přispěl jedním skutečným a jedním přehraným útočným videem, aby byla zachována integrita datové sady.

Technická konzistence

Dodržování přísných pokynů pro FPS (≥ 26), rozlišení (≥ 720p) a přesnost časového razítka (+/- 0.5 ms).

Jak jsme to vyřešili

Společnost Shaip poskytla strukturovaný a vysoce kvalitní soubor dat, který splňuje požadavky projektu. Řešení zahrnovalo:

Správa datové sady a kontrola kvality

  • 25,000 videa shromážděné napříč Fáze 4 zajistit stabilní a strukturovaný tok dat a vyhnout se úzkým místům.
  • Přísný proces ověřování zajistit dodržování FPS, rozlišení a přesnost metadat. Každé video prošlo před konečným přijetím několika kontrolami kvality.
  • Komplexní značkování metadat s 12 atributy:
  • ID/název souboru
  • Typ útoku (skutečný/replay)
  • ID osoby
  • Rozlišení videa
  • Video Doba trvání
  • Etnická příslušnost subjektu
  • Pohlaví subjektu
  • Zda je video původní nebo falešné
  • Název/Model zařízení
  • Osoba, která mluví nebo ne
  • Časové razítko Čas začátku
  • Časové razítko Čas konce
  • Vyvážená etnická skupinová distribuce: Soubor dat byl pečlivě upraven, aby bylo zachováno vyvážené etnické zastoupení. Distribuce zahrnuje hispánskou (33 %), jihoasijskou (21 %), kavkazskou (20 %), africkou (15 %) a východoasijskou a blízkovýchodní populaci (každá tvoří až 6 %).
  • Žádné duplicitní záznamy zachovat jedinečnost datové sady a zabránit zkreslení při školení AI.
  • Etnicky různorodý výběr účastníků k vytvoření datové sady, která odráží skutečné uživatelské variace a zlepšuje přizpůsobivost a spravedlivost modelu AI.
  • Variace záznamového zařízení zahrnoval několik modelů smartphonů, fotoaparátů a světelných podmínek, aby se zvýšila odolnost modelu vůči různým prostředím.

Výsledek

Vysoce kvalitní a různorodá datová sada videa proti falšování poskytovaná společností Shaip umožnila klientovi trénovat modely umělé inteligence, aby přesně rozlišovaly mezi skutečnými a falešnými videi v různých scénářích biometrické autentizace. Datový soubor přispěl k:

Vylepšená detekce podvodů

Vylepšený výkon AI při odhalování podvodných biometrických útoků.

Různorodá tréninková data

Posílena schopnost modelu rozpoznat opakované útoky napříč různými etniky, zařízeními a podmínkami prostředí.

Škálovatelnost

Tato datová sada slouží jako základ pro budoucí vylepšení a rozšíření modelu anti-spoofing.

Shaipova datová sada byla nápomocná při vylepšování našich anti-spoofing modelů řízených umělou inteligencí. Rozmanitost, kvalita a strukturovaná metadata poskytla pevný základ pro zlepšení odhalování podvodů v systémech biometrické autentizace.

Zlatá - 5 hvězdiček