Případová studie: Kolekce výroků

Dodáno přes 7 milionů promluv k vytvoření vícejazyčných digitálních asistentů ve 13 jazycích

Skutečné řešení

Data, která podporují globální konverzace

Potřeba školení vyjadřování vyvstává, protože ne všichni zákazníci používají přesná slova nebo fráze při interakci nebo kladení otázek svým hlasovým asistentům ve skriptovaném formátu. Proto musí být specifické hlasové aplikace trénovány na datech spontánní řeči. Například: "Kde se nachází nejbližší nemocnice?" „Najít poblíž mě nemocnici“ nebo „Je poblíž nemocnice?“ všechny označují stejný záměr vyhledávání, ale jsou jinak formulovány.

Problém

Aby tým mohl realizovat cestovní mapu řeči digitálního asistenta pro celosvětové jazyky klientů, potřeboval získat velké objemy trénovacích dat pro model AI pro rozpoznávání řeči. Kritické požadavky klienta byly:

Získejte velké objemy trénovacích dat (výzvy k promluvě jedním mluvčím v délce ne delší než 3–30 sekund) pro služby rozpoznávání řeči ve 13 globálních jazycích
Pro každý jazyk vygeneruje dodavatel textové výzvy pro mluvčí k nahrání (pokud není
klientské potřeby) a přepište výsledný zvuk.
Poskytujte zvuková data a přepis nahraných promluv s odpovídajícími soubory JSON
obsahující metadata pro všechny nahrávky.
Zajistěte rozmanitou kombinaci mluvčích podle věku, pohlaví, vzdělání a dialektu
Zajistěte rozmanitou kombinaci nahrávacích prostředí podle specifikací.
Každý zvukový záznam musí mít alespoň 16 kHz, ale nejlépe 44 kHz

Zrychlete svou konverzační AI
vývoj aplikací o 100%

„Po vyhodnocení mnoha dodavatelů si klient vybral Shaip kvůli jejich odborným znalostem v projektech konverzační umělé inteligence. Byli jsme ohromeni kompetencemi společnosti Shaip v oblasti realizace projektů, jejich odborností při získávání, přepisování a poskytování požadovaných projevů od expertů lingvistů ve 13 jazycích v přísných termínech a v požadované kvalitě.

Řešení

Díky našemu hlubokému pochopení konverzační umělé inteligence jsme pomohli klientovi shromáždit, přepsat a anotovat data s týmem odborných lingvistů a anotátorů, aby trénovali jejich vícejazyčnou sadu Voice Processing využívající umělou inteligenci.

Rozsah práce pro Shaip zahrnoval, ale neomezoval se na získávání velkých objemů zvukových tréninkových dat pro rozpoznávání řeči, přepis zvukových nahrávek ve více jazycích pro všechny jazyky na naší jazykové mapě Tier 1 a Tier 2 a poskytování odpovídajících JSON soubory obsahující metadata. Shaip shromažďoval výroky v rozsahu 3–30 sekund při zachování požadované úrovně kvality potřebné k trénování modelů ML pro složité projekty.

Zvuk shromážděný, přepsaný a komentovaný: 22,250 hodin
Podporované jazyky: 13 (dánština, korejština, saúdská arabština, holandština, pevninská a tchajwanská čínština, francouzsko-kanadská, mexická španělština, turečtina, hindština, polština, japonština, ruština)
Počet promluv: 7M +
Časová osa: 7-8 měsíců

Při shromažďování zvukových projevů při 16 kHz jsme zajistili zdravý mix mluvčích podle věku, pohlaví, vzdělání a dialektů v různých nahrávacích prostředích.

Výsledek

Vysoce kvalitní zvuková data od odborných lingvistů umožnila klientovi přesně trénovat svůj vícejazyčný model rozpoznávání řeči ve 13 jazycích globální úrovně 1 a 2. Se zlatými standardy školicích datových sad může klient nabídnout inteligentní a robustní digitální asistenci při řešení budoucích reálných problémů.

Naše odbornost

Hodiny řeči shromážděny

0 +

Tým sběratelů hlasových dat

Vyhovuje PII

0 %

Skvělé číslo

0 +

Přijímání dat a přesnost

> 0

Klientela Fortune 500

0 +

Doporučené zdroje

Průvodce kupujícím

Průvodce kupujícího: Konverzační umělá inteligence

Chatbot, se kterým jste mluvili, běží na pokročilém konverzačním systému umělé inteligence, který je trénovaný, testovaný a vytvořený pomocí spousty datových sad pro rozpoznávání řeči.

Blog

Stav konverzační AI 2021

Infografika Konverzační AI 2021 hovoří o tom, co je to Konverzační AI, její vývoj, typy, Konverzační trh AI podle regionu, Případy použití, výzvy atd.

Blog

3 Překážky vývoje konverzační AI

Shaip nastartuje vývoj konverzační AI jako nástroje pro zapojení zákazníků tím, že nabízí potřebná anotovaná zvuková data ve více než 50 jazycích.

Vytvoření klinického NLP je zásadní úkol, jehož řešení vyžaduje obrovskou odbornost. Jasně vidím, že jste v této oblasti o několik let před Googlem. Chci s tebou pracovat a rozšiřovat tě.

Google, Inc. Ředitel

Můj vývojový tým pracoval s Shaipovým týmem po dobu více než 2 let při vývoji rozhraní API pro zdravotní péči. Byli jsme ohromeni jejich prací provedenou v NLP specifické pro zdravotnictví a tím, čeho jsou schopni dosáhnout pomocí komplexních datových sad.

Google, Inc. Vedoucí inženýrství

Řekněte nám, jak můžeme pomoci s vaší další iniciativou AI.

Případová studie: Kolekce výroků

Dodáno přes 7 milionů promluv k vytvoření vícejazyčných digitálních asistentů ve 13 jazycích

Skutečné řešení

Problém

Řešení

Výsledek

Naše odbornost

Doporučené zdroje

Průvodce kupujícím

Průvodce kupujícího: Konverzační umělá inteligence

Blog

Stav konverzační AI 2021

Blog

3 Překážky vývoje konverzační AI

Datové služby AI

Speciality

Průmysl

Produkty

O nás

Zdroje

Kontaktujte nás

Dejte nám o sobě vědět víc!

Dejte nám o sobě vědět víc!

Dejte nám o sobě vědět víc!

Dejte nám o sobě vědět víc!

Dejte nám o sobě vědět víc!

Dejte nám o sobě vědět víc!