Klíčová fráze/výzvy sbírka zvuku

Případová studie: Sbírka klíčových frází pro hlasově aktivované systémy v autě

Sbírka klíčových frází

V automobilovém průmyslu roste poptávka po hlasově aktivovaných systémech v autě, což nově definuje způsob, jakým spolupracujeme s našimi mobilními vozidly.

Automobilový průmysl rychle přijal hlasem aktivované systémy, přičemž hlavní hráči jako Ford, Tesla a BMW integrovali pokročilé rozpoznávání hlasu do svých vozidel. Odhaduje se, že do roku 2022 bude více než 50 % nových vozů vybaveno funkcí rozpoznávání hlasu. Cílem těchto integrací je zvýšit bezpečnost a umožnit řidičům ovládat navigační, zábavní a komunikační funkce bez rozptylování.

Tržní hodnota pro rozpoznávání hlasu v automobilech měla do roku 1 překročit 2023 miliardu dolarů, což naznačuje rostoucí poptávku po hands-free a inteligentních interakcích v autě.

Automobilový průmysl

Výzkum naznačuje, že do roku 2022 bude hlasového asistenta v autě používat 73 % řidičů.

Trh s automobilovým systémem rozpoznávání hlasu byl v roce 2.01 oceněn na 2021 miliardy USD a očekává se, že do roku 3.51 dosáhne 2027 miliardy USD a zaznamená CAGR přibližně 8.07 %.

Skutečné řešení

Data, která napájejí hlasově aktivované systémy

Hlasově aktivované systémy v autech zvyšují bezpečnost a pohodlí. Umožňují řidičům přístup k navigaci, telefonování, odesílání textových zpráv a ovládání hudby, aniž by sundali ruce z volantu nebo oči ze silnice. Reagováním na verbální příkazy tyto systémy snižují rozptylování, podporují multitasking a zajišťují nepřetržité soustředění na řízení. 

Klient je globálním lídrem v oblasti konverzační inteligence, který nabízí řešení hlasové umělé inteligence, která podnikům umožňují nabízet svým zákazníkům neuvěřitelné konverzační zážitky. Spolupracovali s předními automobilovými společnostmi na školení jejich hlasově aktivovaných systémů pomocí značkových klíčových frází a potřebovali zkušenosti společnosti Shaip se sběrem zvukových dat.

Řešení reálného světa
Výzvy

Výzvy

  • Crowd Sourcing: Naverbujte 2800+ rodilých mluvčích na jazyk po celém světě.
  • Sběr dat: Zabezpečte více než 200 12 výzev ve XNUMX jazycích v nastaveném časovém rámci.
  • Rozpoznávání kontextu a záměru: Aby bylo možné správně porozumět požadavkům uživatelů, bylo třeba systémy naučit různé varianty pro stejnou klíčovou frázi.
  • Zvládání hluku na pozadí: Řešte hluk na pozadí reálného světa pro přesnost modelu ML.
  • Snížení zkreslení: Získejte vzorky hlasu z různých demografických skupin, abyste zajistili inkluzivitu.
  • Specifikace zvuku: 16khz 16bits PCM, mono, jednokanálový, WAV; žádné zpracování.
  • Nahrávací prostředí: Nahrávky by měly mít čistý zvuk bez šumu na pozadí nebo rušení. Klíčové fráze, které mají být zaznamenány pomocí běžné řeči.
  • Kontrola kvality:  Všechny nahrávky řeči projdou posouzením kvality a validací, budou dodány pouze ověřené nahrávky řeči. Pokud společnost Shaip nesplňuje dohodnuté standardy kvality, společnost Shaip znovu dodá data bez dalších nákladů

Řešení

Shaip se svými odbornými znalostmi v oblasti konverzační umělé inteligence umožnil klientovi:

  • Sběr dat: 208 tisíc klíčových frází/výzev ke značce shromážděných ve 12 světových jazycích od 2800 XNUMX mluvčích ve stanoveném časovém rámci
  • Různé akcenty a dialekty: Rekrutovaní specialisté z celého světa, zběhlí v požadovaných přízvukech a dialektech.
  • Rozpoznávání kontextu a záměru: Každý řečník měl za úkol zaznamenat klíčové fráze ve 20 různých variantách, což umožnilo modelům ML přesně uchopit požadavky uživatelů z hlediska kontextu a záměru.
  • Zvládání hluku na pozadí: Abychom zajistili nedotčenou kvalitu zvuku, zajistili jsme, aby byly klíčové fráze zachyceny v klidném prostředí s úrovní hluku pod 40 dB, bez rušení na pozadí, jako je televize, rádio, hudba, řeč nebo zvuky ulice.
  • Snížení zkreslení: Abychom minimalizovali zkreslení, zapojili jsme jednotlivce z různých regionů a udržovali jsme vyvážené demografické zastoupení s 50 % mužů a 50 % žen, pokrývající věkové skupiny od 18 do 60 let.
  • Pokyny pro nahrávání: Klíčové fráze byly zachyceny v konzistentním, normálním řečovém vzoru, bez jakýchkoliv variací, jako je rychlé nebo pomalé tempo. 2sekundové ticho na začátku i na konci, aby bylo zaručeno, že žádná část projevu nebyla neúmyslně oříznuta.
  • Formát záznamu: Zvuk byl nahrán při 16 kHz, 16bitovém PCM v mono, s využitím jednoho kanálu a uložen ve formátu souboru WAV. Zvuk zůstává nezpracovaný, což znamená, že nebyla použita žádná komprese, reverb nebo EQ.
  • Kvalita: Každá nahrávka řeči byla podrobena přísným kontrolám kvality a validaci. Byly doručeny pouze nahrávky, které prošly tímto hodnocením. Všechny soubory, které nesplňovaly dohodnuté standardy kvality, byly znovu zaznamenány a poskytnuty bez jakýchkoli dalších poplatků
Řešení
Výsledek

Výsledek

Vysoce kvalitní značkové klíčové fráze audio dat nebo hlasové výzvy umožní automobilovým společnostem a jejich zákazníkům:

  1. Značka a identita: Hlasové výzvy s konkrétní frází značky pomáhají společnostem vytvořit přímé a zapamatovatelné spojení mezi uživatelem a značkou, které zlepšuje zapamatování značky.
  2. Snadné použití: Hlasové příkazy usnadňují řidičům interakci s vozidlem, aniž by museli sundat ruce z volantu nebo oči z vozovky, čímž zvyšují bezpečnost silničního provozu.
  3. Funkce: Pomocí hlasových příkazů je přístup k funkcím vozu a jejich ovládání intuitivnější. Ať už jde o navigaci, přehrávání médií nebo ovládání klimatizace.
  4. Integrace s jinými systémy: Mnoho hlasově aktivovaných systémů je integrováno s chytrými telefony, zařízeními pro chytrou domácnost a dalšími zařízeními internetu věcí. Uživatel může například požádat své auto, aby rozsvítilo světla doma, když se blíží domů.
  5. Konkurenční výhoda: Nabídka pokročilých hlasově aktivovaných systémů může být prodejním argumentem a odlišením. Kupující při zvažování nákupu nového vozu hledají nejnovější technologie.
  6. Budoucnost: Jak se technologie vyvíjejí a internet věcí se stále více integruje do každodenního života, robustní hlasově aktivovaný systém umožňuje automobilovým společnostem, aby se více přizpůsobily budoucím technologiím.
  7. Příležitosti k příjmu: Další možnosti zpeněžení, tj. hlasové systémy nabízejí doporučení nebo integrované zkušenosti s elektronickým obchodováním (jako je objednání jídla nebo vyhledání služeb v okolí), které by mohly zajistit přidružené příjmy.
Zlatá - 5 hvězdiček

Když jsme začali získávat hlasové výzvy pro automobilový sektor, problémů bylo mnoho. Zachycení rozmanitosti řeči, přízvuků a tónů bylo zásadní pro reprezentaci globální klientely našeho klienta. Shaip vynikl nejen jako prodejce, ale i jako skutečný partner. Jejich odhodlání zajistit rozmanitou škálu hlasů z různých regionů bylo chvályhodné. Šli za pouhé shromažďování hlasů; pochopili nuance potřeb našeho projektu a zaručili špičkové nahrávky. Jejich bezchybné dodržování standardů zvukové sbírky předvedlo jejich profesionalitu a oddanost projektu.

Zrychlete svou konverzační AI
vývoj aplikací o 100%