Případová studie: Kolekce výroků
Dodáno přes 7 milionů promluv k vytvoření vícejazyčných digitálních asistentů ve 13 jazycích
Skutečné řešení
Data, která podporují globální konverzace
Potřeba školení vyjadřování vyvstává, protože ne všichni zákazníci používají přesná slova nebo fráze při interakci nebo kladení otázek svým hlasovým asistentům ve skriptovaném formátu. Proto musí být specifické hlasové aplikace trénovány na datech spontánní řeči. Například: "Kde se nachází nejbližší nemocnice?" „Najít poblíž mě nemocnici“ nebo „Je poblíž nemocnice?“ všechny označují stejný záměr vyhledávání, ale jsou jinak formulovány.

Problém
Aby tým mohl realizovat cestovní mapu řeči digitálního asistenta pro celosvětové jazyky klientů, potřeboval získat velké objemy trénovacích dat pro model AI pro rozpoznávání řeči. Kritické požadavky klienta byly:
- Získejte velké objemy trénovacích dat (výzvy k promluvě jedním mluvčím v délce ne delší než 3–30 sekund) pro služby rozpoznávání řeči ve 13 globálních jazycích
- Pro každý jazyk vygeneruje dodavatel textové výzvy pro mluvčí k nahrání (pokud není
klientské potřeby) a přepište výsledný zvuk. - Poskytujte zvuková data a přepis nahraných promluv s odpovídajícími soubory JSON
obsahující metadata pro všechny nahrávky. - Zajistěte rozmanitou kombinaci mluvčích podle věku, pohlaví, vzdělání a dialektu
- Zajistěte rozmanitou kombinaci nahrávacích prostředí podle specifikací.
- Každý zvukový záznam musí mít alespoň 16 kHz, ale nejlépe 44 kHz
„Po vyhodnocení mnoha dodavatelů si klient vybral Shaip kvůli jejich odborným znalostem v projektech konverzační umělé inteligence. Byli jsme ohromeni kompetencemi společnosti Shaip v oblasti realizace projektů, jejich odborností při získávání, přepisování a poskytování požadovaných projevů od expertů lingvistů ve 13 jazycích v přísných termínech a v požadované kvalitě.
Řešení
Díky našemu hlubokému pochopení konverzační umělé inteligence jsme pomohli klientovi shromáždit, přepsat a anotovat data s týmem odborných lingvistů a anotátorů, aby trénovali jejich vícejazyčnou sadu Voice Processing využívající umělou inteligenci.
Rozsah práce pro Shaip zahrnoval, ale neomezoval se na získávání velkých objemů zvukových tréninkových dat pro rozpoznávání řeči, přepis zvukových nahrávek ve více jazycích pro všechny jazyky na naší jazykové mapě Tier 1 a Tier 2 a poskytování odpovídajících JSON soubory obsahující metadata. Shaip shromažďoval výroky v rozsahu 3–30 sekund při zachování požadované úrovně kvality potřebné k trénování modelů ML pro složité projekty.
- Zvuk shromážděný, přepsaný a komentovaný: 22,250 hodin
- Podporované jazyky: 13 (dánština, korejština, saúdská arabština, holandština, pevninská a tchajwanská čínština, francouzsko-kanadská, mexická španělština, turečtina, hindština, polština, japonština, ruština)
- Počet promluv: 7M +
- Časová osa: 7-8 měsíců
Při shromažďování zvukových projevů při 16 kHz jsme zajistili zdravý mix mluvčích podle věku, pohlaví, vzdělání a dialektů v různých nahrávacích prostředích.
Výsledek
Vysoce kvalitní zvuková data od odborných lingvistů umožnila klientovi přesně trénovat svůj vícejazyčný model rozpoznávání řeči ve 13 jazycích globální úrovně 1 a 2. Se zlatými standardy školicích datových sad může klient nabídnout inteligentní a robustní digitální asistenci při řešení budoucích reálných problémů.
Naše odbornost
Doporučené zdroje
Průvodce kupujícím
Průvodce kupujícího: Konverzační umělá inteligence
Chatbot, se kterým jste mluvili, běží na pokročilém konverzačním systému umělé inteligence, který je trénovaný, testovaný a vytvořený pomocí spousty datových sad pro rozpoznávání řeči.
Blog
Stav konverzační AI 2021
Infografika Konverzační AI 2021 hovoří o tom, co je to Konverzační AI, její vývoj, typy, Konverzační trh AI podle regionu, Případy použití, výzvy atd.
Blog
3 Překážky vývoje konverzační AI
Shaip nastartuje vývoj konverzační AI jako nástroje pro zapojení zákazníků tím, že nabízí potřebná anotovaná zvuková data ve více než 50 jazycích.
Řekněte nám, jak můžeme pomoci s vaší další iniciativou AI.