Případová studie: Moderování obsahu

Vzhledem k tomu, že používání sociálních médií neustále roste, problém kyberšikany se ukázal jako významná překážka pro platformy, které se snaží zajistit bezpečný online prostor. Ohromujících 38 % jednotlivců se s tímto škodlivým chováním setkává denně, což zdůrazňuje naléhavou poptávku po inovativních přístupech k moderování obsahu. Organizace se dnes spoléhají na využití umělé inteligence k aktivnímu řešení přetrvávajícího problému kyberšikany.
Kybernetická bezpečnost:
Zpráva o prosazování komunitárních standardů společnosti Facebook za 4. čtvrtletí odhalena – akce na 6.3 milionu kusů obsahu šikany a obtěžování, s mírou proaktivního odhalení 49.9 %
Vzdělání:
A 2021 studie zjistila, že 36.5%% studentů ve Spojených státech ve věku let 12 & 17 let zažili kyberšikanu v té či oné době během školní docházky.
Podle zprávy z roku 2020 byl globální trh s řešeními pro moderování obsahu v roce 4.07 oceněn na 2019 miliardy USD a očekává se, že do roku 11.94 dosáhne 2027 miliardy USD s CAGR 14.7 %.
Skutečné řešení
Data, která moderují globální konverzace
Klient vyvíjel robustní model automatizovaného strojového učení pro moderování obsahu pro svou cloudovou nabídku, pro kterou hledal dodavatele pro konkrétní doménu, který by mu mohl pomoci s přesnými školicími daty.
S využitím našich rozsáhlých znalostí v oblasti zpracování přirozeného jazyka (NLP) jsme klientovi pomohli se shromažďováním, kategorizací a anotací více než 30,000 XNUMX dokumentů v angličtině i španělštině, abychom vytvořili automatizovaný model strojového učení pro moderování obsahu rozdělený na toxický, pro dospělé nebo sexuálně explicitní obsah. kategorií.
Problém
- Web sbírá 30,000 XNUMX dokumentů ve španělštině i angličtině z prioritních domén
- Rozdělení shromážděného obsahu do krátkých, středních a dlouhých segmentů
- Označení kompilovaných dat jako toxický, nevhodný nebo sexuálně explicitní obsah
- Zajištění vysoce kvalitních anotací s minimálně 90% přesností.
Řešení
- Web sešrotoval 30,000 XNUMX dokumentů každý pro španělštinu a angličtinu od BFSI, zdravotnictví, výroby, maloobchodu. Obsah byl dále rozčleněn na krátké, střední a dlouhé dokumenty
- Úspěšné označení klasifikovaného obsahu jako toxický, obsah pro dospělé nebo sexuálně explicitní obsah
- Pro dosažení 90% kvality zavedl Shaip dvoustupňový proces kontroly kvality:
» Úroveň 1: Kontrola kvality: 100 % souborů k ověření.
» Úroveň 2: Kontrola kritické analýzy kvality: Tým Shaips CQA posoudí 15%-20% retrospektivních vzorků.
Výsledek
Tréninkové údaje pomohly vytvořit model automatického ML pro moderování obsahu, který může přinést několik přínosů pro udržení bezpečnějšího online prostředí. Některé z klíčových výsledků zahrnují:
- Efektivita zpracování obrovského množství dat
- Důslednost při zajišťování jednotného prosazování politik moderování
- Škálovatelnost pro přizpůsobení rostoucí uživatelské základně a objemu obsahu
- Moderování v reálném čase dokáže identifikovat a
odstraňovat potenciálně škodlivý obsah při jeho vytváření - Efektivita nákladů díky snížení závislosti na lidských moderátorech
Zrychlete vývoj své aplikace Conversational AI o 100 %
Řekněte nám, jak můžeme pomoci s vaší další iniciativou AI.