Případová studie: Kolekce výroků

Dodáno přes 7 milionů promluv k vytvoření vícejazyčných digitálních asistentů ve 13 jazycích

Sbírka výroků

Skutečné řešení

Data, která podporují globální konverzace

Potřeba školení vyjadřování vyvstává, protože ne všichni zákazníci používají přesná slova nebo fráze při interakci nebo kladení otázek svým hlasovým asistentům ve skriptovaném formátu. Proto musí být specifické hlasové aplikace trénovány na datech spontánní řeči. Například: "Kde se nachází nejbližší nemocnice?" „Najít poblíž mě nemocnici“ nebo „Je poblíž nemocnice?“ všechny označují stejný záměr vyhledávání, ale jsou jinak formulovány.

Sbírka promluv 1

Problém

Aby tým mohl realizovat cestovní mapu řeči digitálního asistenta pro celosvětové jazyky klientů, potřeboval získat velké objemy trénovacích dat pro model AI pro rozpoznávání řeči. Kritické požadavky klienta byly:

  • Získejte velké objemy trénovacích dat (výzvy k promluvě jedním mluvčím v délce ne delší než 3–30 sekund) pro služby rozpoznávání řeči ve 13 globálních jazycích
  • Pro každý jazyk vygeneruje dodavatel textové výzvy pro mluvčí k nahrání (pokud není
    klientské potřeby) a přepište výsledný zvuk.
  • Poskytujte zvuková data a přepis nahraných promluv s odpovídajícími soubory JSON
    obsahující metadata pro všechny nahrávky.
  • Zajistěte rozmanitou kombinaci mluvčích podle věku, pohlaví, vzdělání a dialektu
  • Zajistěte rozmanitou kombinaci nahrávacích prostředí podle specifikací.
  • Každý zvukový záznam musí mít alespoň 16 kHz, ale nejlépe 44 kHz

Zrychlete svou konverzační AI
vývoj aplikací o 100%

„Po vyhodnocení mnoha dodavatelů si klient vybral Shaip kvůli jejich odborným znalostem v projektech konverzační umělé inteligence. Byli jsme ohromeni kompetencemi společnosti Shaip v oblasti realizace projektů, jejich odborností při získávání, přepisování a poskytování požadovaných projevů od expertů lingvistů ve 13 jazycích v přísných termínech a v požadované kvalitě.

Řešení

Díky našemu hlubokému pochopení konverzační umělé inteligence jsme pomohli klientovi shromáždit, přepsat a anotovat data s týmem odborných lingvistů a anotátorů, aby trénovali jejich vícejazyčnou sadu Voice Processing využívající umělou inteligenci.

Rozsah práce pro Shaip zahrnoval, ale neomezoval se na získávání velkých objemů zvukových tréninkových dat pro rozpoznávání řeči, přepis zvukových nahrávek ve více jazycích pro všechny jazyky na naší jazykové mapě Tier 1 a Tier 2 a poskytování odpovídajících JSON soubory obsahující metadata. Shaip shromažďoval výroky v rozsahu 3–30 sekund při zachování požadované úrovně kvality potřebné k trénování modelů ML pro složité projekty.

  • Zvuk shromážděný, přepsaný a komentovaný: 22,250 hodin
  • Podporované jazyky: 13 (dánština, korejština, saúdská arabština, holandština, pevninská a tchajwanská čínština, francouzsko-kanadská, mexická španělština, turečtina, hindština, polština, japonština, ruština)
  • Počet promluv: 7M +
  • Časová osa: 7-8 měsíců

Při shromažďování zvukových projevů při 16 kHz jsme zajistili zdravý mix mluvčích podle věku, pohlaví, vzdělání a dialektů v různých nahrávacích prostředích.

Výsledek

Vysoce kvalitní zvuková data od zkušených lingvistů umožnila klientovi přesně trénovat
jejich vícejazyčný model rozpoznávání řeči ve 13 jazycích globální úrovně 1 a 2. Díky datovým sadám školení zlatého standardu může klient nabídnout inteligentní a robustní digitální pomoc při řešení budoucích problémů v reálném světě.

Naše odbornost

0 +
Hodiny řeči shromážděny
0
Tým sběratelů hlasových dat
0 %
Vyhovuje PII
0 +
Skvělé číslo
> 0
Přijímání dat a přesnost
0 +
Klientela Fortune 500

Řekněte nám, jak můžeme pomoci s vaší další iniciativou AI.