Případová studie: Moderování obsahu

Více než 30 XNUMX webových dokumentů bylo zlikvidováno a opatřeno poznámkami pro moderování obsahu

Content moderation - banner
Stále roste poptávka po moderování obsahu založeného na umělé inteligenci
které se snaží zabezpečit online prostor, kde se připojujeme a komunikujeme.

Vzhledem k tomu, že používání sociálních sítí stále roste,
problém kyberšikany se objevil jako a
významnou překážkou pro platformy, které se o to snaží
zajistit bezpečný online prostor. Ohromující
Setkává se s tím 38 % jedinců
škodlivé chování na denní bázi,
zdůrazňující naléhavou poptávku po vynalézavosti
přístupy moderování obsahu.
Organizace dnes spoléhají na využití
umělá inteligence k řešení trvalých
problém kyberšikany proaktivně.

Kybernetická bezpečnost:

Zpráva o prosazování komunitárních standardů společnosti Facebook za 4. čtvrtletí odhalena – akce na 6.3 milionu kusů obsahu šikany a obtěžování, s mírou proaktivního odhalení 49.9 %

Vzdělání:

2021 studie zjistila, že 36.5%% studentů ve Spojených státech ve věku let 12 & 17 let zažili kyberšikanu v té či oné době během školní docházky.

Podle zprávy z roku 2020 byl globální trh s řešeními pro moderování obsahu v roce 4.07 oceněn na 2019 miliardy USD a očekává se, že do roku 11.94 dosáhne 2027 miliardy USD s CAGR 14.7 %.

Skutečné řešení

Data, která moderují globální konverzace

Klient vyvíjel robustní automat
moderování obsahu Strojové učení
model pro svou nabídku Cloud, pro kterou jsou
hledali dodavatele specifické pro doménu, který
by jim mohl pomoci s přesnými tréninkovými daty.

S využitím našich rozsáhlých znalostí v oblasti zpracování přirozeného jazyka (NLP) jsme klientovi pomohli se shromažďováním, kategorizací a anotací více než 30,000 XNUMX dokumentů v angličtině i španělštině, abychom vytvořili automatizovaný model strojového učení pro moderování obsahu rozdělený na toxický, pro dospělé nebo sexuálně explicitní obsah. kategorií.

Real world solution

Problém

  • Web sbírá 30,000 XNUMX dokumentů ve španělštině i angličtině z prioritních domén
  • Rozdělení shromážděného obsahu do krátkých, středních a dlouhých segmentů
  • Označení kompilovaných dat jako toxický, nevhodný nebo sexuálně explicitní obsah
  • Zajištění vysoce kvalitních anotací s minimálně 90% přesností.

Řešení

  • Web sešrotoval 30,000 XNUMX dokumentů každý pro španělštinu a angličtinu od BFSI, zdravotnictví, výroby, maloobchodu. Obsah byl dále rozčleněn na krátké, střední a dlouhé dokumenty 
  • Úspěšné označení klasifikovaného obsahu jako toxický, obsah pro dospělé nebo sexuálně explicitní obsah
  • Pro dosažení 90% kvality zavedl Shaip dvoustupňový proces kontroly kvality:
    » Úroveň 1: Kontrola kvality: 100 % souborů k ověření.
    » Úroveň 2: Kontrola kritické analýzy kvality: Tým Shaips CQA posoudí 15%-20% retrospektivních vzorků.

Výsledek

Tréninkové údaje pomohly vytvořit model automatického ML pro moderování obsahu, který může přinést několik přínosů pro udržení bezpečnějšího online prostředí. Některé z klíčových výsledků zahrnují:

  • Efektivita zpracování obrovského množství dat
  • Důslednost při zajišťování jednotného prosazování politik moderování
  • Škálovatelnost pro přizpůsobení rostoucí uživatelské základně a objemu obsahu
  • Moderování v reálném čase dokáže identifikovat a
    odstraňovat potenciálně škodlivý obsah při jeho vytváření
  • Efektivita nákladů díky snížení závislosti na lidských moderátorech

Příklady moderování obsahu

Examples of content moderation

Zrychlete svou konverzační AI
vývoj aplikací o 100%

Řekněte nám, jak můžeme pomoci s vaší další iniciativou AI.