Nejdůvěryhodnější služby sběru dat řeči pro vaši AI

Trénujte své modely NLP, VA, prototypy TTS a další pomocí kvalitních konverzačních dat s našimi službami shromažďování zvukových a řečových dat

Sběr zvukových dat

Objevte audio datové kanály bez překážek

Vybraní klienti

Profesionální služby sběru audio / hlasových dat

Jakýkoli předmět. Jakýkoli scénář.

Ve společnosti Shaip spočívá naše odbornost ve vytváření vysoce kvalitních datových sad řeči navržených pro různé požadavky AI/ML. Nabízíme širokou škálu jazyků a záznamů v různých nastaveních, díky čemuž jsou naše datové sady komplexní a přizpůsobitelné. Ózaměřujete se na krmení modelů s nejvyšším objemem vlastních řečových dat v co nejkratším čase. S námi na palubě můžete očekávat: 

Sbírka řečí
  • Spravovaná vysoce kvalitní vícejazyčná zvuková / hlasová data pro zvýšení přesnosti
  • Nejvyšší možná úroveň specifičnosti domény k tvytvořit různorodý scénář Nastavení
  •  Přizpůsobte svůj model ML tak, aby vyhovoval různým demografickým skupinám a vertikálám
  • Nahrávací prostředí: Studiová kvalita, s křišťálově čistým zvukem s minimálním šumem na pozadí a Přírodní prostředí, kde nahrávky obsahují okolní zvuky, které napodobují skutečné situace.

100+

země

55K +

Údaje o hodinách řeči

250+

Projekty

60+

Jazyky (100+ dialektů)

8 / 16 / 44 / 48 kHz

Vzorkovací frekvence

Naše odbornost

Zarovnejte zvuková data s pro chytřejší modely NLP

Shaip nabízí služby sběru dat řeči/zvukových dat od konce do konce ve více než 100 jazycích, aby technologie podporující hlas mohly uspokojit různorodou skupinu publika na celém světě. Můžeme pracovat na projektech jakéhokoli rozsahu a velikosti; počínaje licencováním stávajících běžně dostupných zvukových datových sad, přes správu vlastního shromažďování zvukových dat až po zvukový přepis a poznámky. Bez ohledu na to, jak velký je váš projekt sběru dat řeči, můžeme služby sběru zvuku přizpůsobit tak, aby vyhovovaly vašim potřebám, a vytvářet tak vysoce kvalitní datové sady NLP, které cílí na dialekty, tóny a jazyky. Vyberte si z naší široké škály datových sad řeči a zdrojů shromažďování zvukových dat pro inteligentní nastavení podporující hlas.

Monologická řeč

Monologická sbírka řeči

Zaměřuje se na zpracování řeči od jednoho mluvčího. Využijte skriptované výzvy ke vstupu do jednokanálových zvukových souborů, čímž zajistíte zachycení jedinečných vzorů řeči, tónů a nuancí specifických pro daného jedince.

Dialogová řeč

Projev dialogu
Sbírka

Interakce dvou osob, replikace konverzací a dialogů v reálném světě s vícejazyčným zobrazením prostřednictvím dvoukanálových souborů a přepsaných zdrojů.

Konverzace s více stranami

Skupina / Muti-party
Konverzace

Vícečlenné diskuse, zachycení skupinové dynamiky, přesahů a různých tónů, aby se přesně trénovaly řečové modely.

Promluva v přirozeném jazyce

Sbírka promluvy v přirozeném jazyce

Naučte AI identifikovat fráze nebo probudit slova s ​​podobným významem pomocí různorodých, bohatých a autentických promluv pro pokročilé zpracování a porozumění přirozenému jazyku.

Akustická řeč

Akustická data
Sbírka

Dokážeme profesionálně zaznamenat zvuková data ve studiové kvalitě, ať už jde o restaurace, kanceláře nebo domácnosti, nebo z různých prostředí a jazyků, přičemž pokryjeme širší akustický rozsah (Comprehensive Sound Datasets).

Automatické rozpoznávání řeči

Automatické rozpoznávání řeči (ASR)

Zlepšete přesnost svých systémů automatického rozpoznávání řeči (ASR) tím, že budete mít přístup k nejmodernějším diverzifikovaným řečovým/audio datovým sadám z celé řady demografických skupin.

Promluva v přirozeném jazyce

Vícejazyčná data školení řeči/zvuku

Naši zkušení jazykoví odborníci po celém světě nabízejí vícejazyčná zvuková/řečová data v různých jazycích a dialektech. Toto úsilí podporuje globální komunikaci a překonává jazykové bariéry, což přispívá k inkluzivnějším a účinnějším řešením AI.

Digitální virtuální asistenti

Text na řeč
(TTS)

Vytvořte si vícejazyčný model převodu textu na řeč (TTS) s pomocí naší globální pracovní síly, která vám pomůže shromažďovat data řeči ve více než 150 jazycích a dialektech, abyste vylepšili své modely umělé inteligence od ovládání v autě po chatboty a výuková řešení s vysokou kvalitní audio data.

Záznamy call centra

Call Center
Nahrávky

Skutečné výměny mezi agenty a klienty, které podporují řadu jazyků, jako je španělština, němčina, americká angličtina, bengálština, japonština, čínština a hindština.

Příběhy o úspěchu

Konverzační datové sady AI s více než 3 8 hodinami dat v XNUMX jazycích

Při snaze vybudovat vícejazyčnou platformu pro indické jazyky se klient spojil se společností Shaip za účelem shromažďování, segmentování a přepisu velkých datových sad v několika indických jazycích. To by pomohlo vyvinout efektivní modely řeči, které by mohly pohánět novou inovativní platformu klienta.

Problém: Více než 3,000 8 hodin zvukových dat shromážděných v XNUMX indických jazycích, segmentovaných a přepsaných za účelem vyvinutí automatického rozpoznávání řeči.

Řešení: Zajistili jsme sběr dat, segmentaci, přepis a dodali JSON soubory s metadaty. Pro klientský projekt technologie řeči jsme shromáždili 3000 hodin zvukových dat v 8 indických jazycích v měřítku.

Případová studie sběru řečových dat

Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči

Lidé

Lidé

Specializované a vyškolené týmy:

  • Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
  • Tým pověřeného řízení projektů
  • Zkušený tým vývoje produktů
  • Tým získávání a přihlašování talentů
Proces

Proces

Nejvyšší účinnost procesu je zajištěna pomocí:

  • Robustní 6stupňový proces sigma-gate
  • Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
  • Neustálé zlepšování a zpětná vazba
Plošina

Plošina

Patentovaná platforma nabízí výhody:

  • Webová platforma typu end-to-end
  • Bezvadná kvalita
  • Rychlejší TAT
  • Bezproblémové doručení

Běžné datové sady řeči / zvuku

DetailyJazyková datová sadaVzorkovací frekvenceTyp datové sadyCelkový počet hodin zvukuStručný popisPopis datové sadyAudio ChannelNahrávací platformaMY JSME (%)Audio FormatFormát přepisuPoužijte pouzdroPočet reproduktorůCTA
Řečcs_US_CC_8Afroamerická lidová mluvaAfroamerická lidová mluvacs8 kHzCall centrum211Data call-centra afroamerické lidové řečiNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 612, muž: 1242 a neznámý: 12
Řečcs_US_MA_16Afroamerická lidová mluvaAfroamerická lidová mluvacs16 kHzMédia Audio154Údaje o afroamerických lidových médiíchLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 151, muž: 150 a neznámý: 10
Řečafrikánština_GC_8afrikánštinaafrikánštinaaf_ZA8 kHzObecná konverzace368Údaje o obecné konverzaci v afrikánštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, afrikánština mluvená v AfriceDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 502, muž: 390 a neznámý: 2
Řečafrikánština_MA_16afrikánštinaafrikánštinaaf_ZA16 kHzMédia Audio658Africké mediální souboryLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 750, muž: 1278 a neznámý: 52
ŘečArabština_GC_8arabštinaarabštinaar_AE8 kHzObecná konverzace292Údaje o obecné konverzaci v arabštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, arabština ze zemí Perského zálivuDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 171, muž: 534 a neznámý: 1
ŘečArabština_SM_48arabštinaarabštinaar-SA48 kHzSkriptovaný monolog1,947Arabsky napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 838 Muž 1209 Neznámý 78
ŘečAssamese_CC_8Assameseásámština (v potrubí) jako vCall centrum60Data call-centra Assamese (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese_GCAssameseásámština (v potrubí) jako vObecná konverzace100Assamese (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese_MAAssameseásámština (v potrubí) jako vMédia Audio40Assamese (In Pipeline) Audio data médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengali_CC_8bengálskýbengálština (v potrubí) bn_INCall centrum60Data call-centra v bengálštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengálsko_GCbengálskýbengálština (v potrubí) bn_INObecná konverzace100Údaje o obecné konverzaci v bengálštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengálština_MAbengálskýbengálština (v potrubí) bn_INMédia Audio40Bengálština (In Pipeline) Zvuková data médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBoston_CC_8bostonská angličtinabostonská angličtinacs8 kHzCall centrum177Data bostonského call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 605, muž: 711 a neznámý: 0
ŘečBoston_GC_8bostonská angličtinabostonská angličtinacs8 kHzObecná konverzace32Boston General Conversation dataNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 53, muž: 83 a neznámý: 0
ŘečBoston_MA_16bostonská angličtinabostonská angličtinacs16 kHzMédia Audio93Zvuková data Boston MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 43, muž: 181 a neznámý: 2
ŘečCanadian_SM_48Kanadské francouzštiněKanadské francouzštiněfr-CA48 kHzSkriptovaný monolog1,222Kanadské francouzštiněNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 974 Muž 631 Neznámý 1
ŘečChinese_CC_8Čínština anglickyČínština anglickycs8 kHzCall centrum169Čínská data call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 1790, muž: 523 a neznámý: 13
ŘečChinese_MA_16Čínština anglickyČínština anglickycs16 kHzMédia Audio249Zvuková data čínských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 126, muž: 346 a neznámý: 6
ŘečZjednodušená čínština_SM_48Zjednodušená čínštinaZjednodušená čínštinazh-CN48 kHzSkriptovaný monolog2,762Zjednodušená čínštinaNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1920 Muž 1535 Neznámý 270
ŘečTradiční čínština_SM_48Tradiční čínštinaTradiční čínštinazh-TW48 kHzSkriptovaný monolog1,028Tradiční čínštinaNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1069 Muž 262 Neznámý 3
Řečdánština_GC_8dánskýdánskýda_DK8 kHzObecná konverzace372Údaje o dánské obecné konverzaciNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 311, muž: 417, neznámý: 0
Řečdánština_MA_16dánskýdánskýda_DK16 kHzMédia Audio664Zvuková data dánských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 369, muž: 864, neznámý: 27
Řečdánština_SM_48dánskýdánskýda-DK48 kHzSkriptovaný monolog2,579Dánský skriptovaný monologNahrávky s jednou promluvou, které se obvykle pohybují v rozmezí 5 až 30 sekund, dánština z DánskaMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1551 Muž 1233 Neznámý 42
ŘečEnglish Deep South_CC_8Angličtina Deep SouthAngličtina Deep Southcs8 kHzCall centrum151Data call centra v angličtině Deep SouthNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 221 , Muž 1004 , Neznámý 7
ŘečEnglish Deep South_GC_8Angličtina Deep SouthAngličtina Deep Southcs8 kHzObecná konverzace56Data obecné konverzace v angličtině Deep SouthNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 99, muž 31, neznámý 0
ŘečEnglish Deep South_MA_16Angličtina Deep SouthAngličtina Deep Southcs16 kHzMédia Audio266Zvuková data Deep South MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 204, muž 356, neznámý 21
ŘečNěmčina_CC_8NěmecNěmecde-De8 kHzCall centrum64Údaje německého call centra Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,MonoDesktop. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 478 Muž 1440 Neznámý 0
Řečněmecky_IVR_8NěmecNěmecde-De8 kHz IVR200Německá data IVRČlověk ke stroji. Typ toku IVR, kde je výzva TTS (např. „Jak vám mohu pomoci“) následovaná spontánní lidskou reakcíMonoDesktop. Wav .JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování Žena 10115 Muž 8750 Neznámý 0
ŘečGudžarátština_CC_8gujaratigudžarátština (v potrubí) gu_INCall centrum60Data call-centra Gujarati (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečGudžarátština_GCgujaratigudžarátština (v potrubí) gu_INObecná konverzace100Gujarati (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečGudžarátština_MAgujaratigudžarátština (v potrubí) gu_INMédia Audio40Gujarati (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečHebrejština_Obecná konverzace_8hebrejštinahebrejštinaon_IL8 kHzObecná konverzace399Údaje o hebrejské obecné konverzaciNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, hebrejština v IzraeliDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 414 , Muž 399 , Neznámý 1
ŘečHebrejština_MA_16hebrejštinahebrejštinaon_IL16 kHzMédia Audio427Zvuková data hebrejských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 361, muž 513, neznámý 13
ŘečHindština_MA_16hindštinahindštinaahoj_IN16 kHzMédia Audio219Zvuková data Hindi MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 83, muž 309, neznámý 0
ŘečHindština_SM_48hindštinahindštinahi-IN48 kHzSkriptovaný monolog2,867Hindsky napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1977 Muž 1864 Neznámý 147
ŘečHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall centrum208HINGLISH Data call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 822, muž 1262, neznámý 0
ŘečHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMédia Audio216HINGLISH Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 75, muž 380, neznámý 0
ŘečHispanic_CC_8hispánská angličtinahispánská angličtinacs8 kHzCall centrum212Data hispánského call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 822, muž 1262, neznámý 0
ŘečHispanic_MA_16hispánská angličtinahispánská angličtinacs16 kHzMédia Audio155Hispanic Call Media audioLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 140, muž 219, neznámý 5
ŘečIndonéština_GC_8indonéskýindonéskýudělal jsem8 kHzObecná konverzace496Údaje z indonéské obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, bahasa indonéštinaDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 524, muž 454, neznámý 2
ŘečIndonéština_MA_16indonéskýindonéskýudělal jsem16 kHzMédia Audio643Zvuková data indonéských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 746, muž 1507, neznámý 129
ŘečIrish_GC_8irskýirskýen_IE8 kHzObecná konverzace192Údaje o obecné konverzaci v IrskuNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 213 , Muž 153 , Neznámý 0
Řečjaponština_SM_48japonskýjaponskýja-JP48 kHzSkriptovaný monolog2,335Japonský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1460 Muž 1221 Neznámý 194
ŘečKannada_CC_8kannadaKannada (in Pipeline) kn_INCall centrum60Data call-centra Kannada (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKannada_GCkannadaKannada (in Pipeline) kn_INObecná konverzace100Kannada (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKannada_MAkannadaKannada (in Pipeline) kn_INMédia Audio40Kannada (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKorean_CC_8korejskýkorejskýko_KR8 kHzCall centrum107Korejská data call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1086, muž 210, neznámý 4
ŘečKorean_MA_16korejskýkorejskýko_KR16 kHzMédia Audio204Korejská mediální audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 70 Muž 303, neznámý 25
ŘečKorean_SM_48korejskýkorejskýko-KR48 kHzSkriptovaný monolog1,955Korejský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1195 Muž 1134 Neznámý 122
ŘečMalay_GC_8malajskymalajskyms_MY8 kHzObecná konverzace266Malajská data obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, malajština v MalajsiiDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 316, muž 176, neznámý 0
ŘečMalay_MA_16malajskymalajskyms_MY16 kHzMédia Audio344Malay Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 236, muž 626, neznámý 47
Řečmalajálamština_CC_8malabarštinamalajálamština (v potrubí) ml_INCall centrum60Data call-centra Malayalam (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMalayalam_GCmalabarštinamalajálamština (v potrubí) ml_INObecná konverzace100Malajálamština (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMalayalam_MAmalabarštinamalajálamština (v potrubí) ml_INMédia Audio40Malajálamština (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMaráthština_CC_8maráthštinamaráthština (v potrubí) pan_INCall centrum60Data call-centra Marathi (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMarathi_GCmaráthštinamaráthština (v potrubí) pan_INObecná konverzace100Data obecné konverzace v maráthštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMarathi_MAmaráthštinamaráthština (v potrubí) pan_INMédia Audio40Maráthština (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMexican_SM_48Španělština (Mexiko)Španělština (Mexiko)es-MX48 kHzSkriptovaný monolog1,492Mexický španělský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1016 Muž 1069 Neznámý 95
ŘečNizozemsko_SM_48holandskýholandskýnl-NL48 kHzSkriptovaný monolog1,205Nizozemský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1285 Muž 531 Neznámý 3
ŘečNew York English_CC_8New York EnglishNew York Englishcs8 kHzCall centrum103Data call centra v New Yorku v angličtiněNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 610, muž 532, neznámý 0
ŘečNew York English_GC_8New York EnglishNew York Englishcs8 kHzObecná konverzace107Data obecné konverzace v New Yorku v angličtiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 118, muž 114, neznámý 0
ŘečNew York English_MA_16New York EnglishNew York Englishcs16 kHzMédia Audio140New York English Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 66, muž 230, neznámý 11
ŘečNový Zéland_GC_8Novozélandská angličtina Novozélandská angličtina en_NZ8 kHzObecná konverzace148Údaje o obecné konverzaci v novozélandské angličtiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 167, muž 121, neznámý 4
ŘečNový Zéland_MA_16Novozélandská angličtina Novozélandská angličtina en_NZ16 kHzMédia Audio400Nový Zéland English Media audioLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 367, muž 678, neznámý 26
ŘečOriya_CC_8OriyaOriya (v potrubí) nebo_INCall centrum60Data call-centra Oriya (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya_GCOriyaOriya (v potrubí) nebo_INObecná konverzace100Oriya (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya_MAOriyaOriya (v potrubí) nebo_INMédia Audio40Oriya (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPolish_MA_16polskýpolskýpl_PL16 kHzMédia Audio269Zvuk polských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 173 Muž 354 Neznámý 6
Řečpolské Polsko_SM_48Polština (Polsko)Polština (Polsko)pl-PL48 kHzSkriptovaný monolog1,482Polské Polsko – napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1324 Muž 701 Neznámý 24
ŘečPandžábština_CC_8pandžábskýpandžábština (in Pipeline) pandžábskýCall centrum60Data call-centra Punjabi (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPandžábština_GCpandžábskýpandžábština (in Pipeline) pandžábskýObecná konverzace100Údaje o obecné konverzaci v pandžábštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPandžábština_MApandžábskýpandžábština (in Pipeline) pandžábský Média Audio40Punjabi (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečrusky_SM_48ruskýruskýru-RU48 kHzSkriptovaný monolog2,398Monolog s ruským scénářemNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1689 Muž 1937 Neznámý 214
ŘečScottish_GC_8skotština (anglický přízvuk)skotština (anglický přízvuk)en_AB8 kHzObecná konverzace292Data skotské obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 285, muž 260, neznámý 3
ŘečSingapur_CC_8Singapurská angličtinaSingapurská angličtinacs_SG8 kHzCall centrum218Data singapurského call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 2139, muž 884, neznámý 21
ŘečSingapur_MA_16Singapurská angličtinaSingapurská angličtinacs_SG16 kHzMédia Audio247Singapur Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 160, muž 455, neznámý 37
ŘečJihoafrická angličtina_CC_8Jihoafrická angličtinaJihoafrická angličtinaen_ZA8 kHzCall centrum261Data call-centra v jihoafrické angličtiněNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1274 , Muž 935 , Neznámý 1
ŘečJihoafrická republika English_MA_16Jihoafrická angličtinaJihoafrická angličtinaen_ZA16 kHzMédia Audio251Jihoafrická anglická mediální audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 235, muž 432, neznámý 36
Řečsvahilština_CC_8svahilštinasvahilštinasw_KE8 kHzCall centrum230Údaje svahilského call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 611, muž 833, neznámý 0
Řečsvahilština_MA_16svahilštinasvahilštinasw_KE16 kHzMédia Audio265Zvuková data svahilských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 118, muž 493, neznámý 25
Řečšvédština_CC_8švédskýšvédskýsv_SE8 kHzCall centrum250Údaje švédského call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1581, muž 727, neznámý 2
Řečšvédština_MA_16švédskýšvédskýsv_SE16 kHzMédia Audio278Zvuková data švédských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 195, muž 500, neznámý 21
ŘečTamil_CC_8tamilštinatamilština (v potrubí) ta_INCall centrum60Data call-centra tamilštiny (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTamil_GCtamilštinatamilština (v potrubí) ta_INObecná konverzace100Tamilská (In Pipeline) data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTamil_MAtamilština tamilština (v potrubí) ta_INMédia Audio40Tamilská (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_GC_8telugštinatelugštinate_IN8 kHzObecná konverzace553Údaje o obecné konverzaci v telugštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 574, muž 564, neznámý 0
Řečtelugština_MA_16telugštinatelugštinate_IN16 kHzMédia Audio648Zvuková data Telugu MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 207, muž 963, neznámý 2
Řečtelugština_CC_8telugštinatelugština (v potrubí) te_INCall centrum30Data call-centra Telugu (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_GCtelugštinatelugština (v potrubí) te_INObecná konverzace50Telugu (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_MAtelugštinatelugština (v potrubí) te_INMédia Audio20Telugu (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečThai_GC_8thajštinathajštinačt_TH8 kHzObecná konverzace183Thajská obecná konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, Neformální registr používaný mezi přáteliDvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 338, muž 96, neznámý 8
ŘečThai_MA_8thajštinathajštinačt_TH16 kHzMédia Audio173Zvuk thajských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 143, muž 502, neznámý 26
ŘečTurecké Turecko_SM_48Turecké TureckoTurecké TureckoTR-TR48 kHzSkriptovaný monolog2,027Turecké TureckoNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1561 Muž 1241 Neznámý 31
ŘečVietnamština_GC_8VietnamecVietnamecvi_VN8 kHzObecná konverzace295Údaje o vietnamské obecné konverzaciNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5-15 minut, severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město).DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 400, muž 380, neznámí 2
ŘečVietnamese_MA_16VietnamecVietnamecvi_VN16 kHzMédia Audio257Zvuková data Vietnamese MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 249, muž 200, neznámí 45
ŘečWelsh_GC_8velština (anglický přízvuk)velština (anglický přízvuk)en_WL8 kHzObecná konverzace278Údaje o velšské obecné konverzaciNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 270, muž 324, neznámý 0
ŘečVelká Británie English_WW_16Britská angličtinaBritská angličtinaen_uk16 kHzWake WordReproduktory 200Wake Word UK angličtinaklíčové fráze sběr dat
  • 200 reproduktory
  • 4 unikátní klíčové fráze na reproduktor
  • 25-30 opakovaných nahrávek klíčových frází na jedinečnou klíčovou frázi
  • 25–30 zvukových souborů na jedinečnou klíčovou frázi
  • Celkem 120 nahraných promluv na řečníka
1 kanálMobile App5.0. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníPohlaví: 50 % muži, 50 % ženy, +/- 10 %.

Nabízené služby

Expertní sběr zvukových dat není pro komplexní nastavení umělé inteligence praktický. Ve společnosti Shaip můžete dokonce zvážit následující služby, díky nimž budou modely mnohem rozšířenější než obvykle:

Sběr textových dat

Sběr textových dat
Služby

Skutečnou hodnotou služeb sběru kognitivních dat Shaip je, že dává organizacím klíč k odemčení důležitých informací nacházejících se v nestrukturovaných datech

Sběr obrazových dat

Služby sběru obrazových dat

Zajistěte, aby váš model počítačového vidění přesně identifikoval každý obrázek, abyste mohli bezproblémově trénovat modely AI příští generace budoucnosti

Sběr video dat

Služby sběru video dat

Nyní se zaměřte na počítačové vidění spolu s NLP pro nácvik vašich modelů k dokonalé identifikaci objektů, jednotlivců, odstrašujících prostředků a dalších vizuálních prvků

Shaip nás kontaktujte

Chcete si vytvořit vlastní zvukovou datovou sadu?

Spojte se s naším interním odborníkem na sběr dat řeči a nastavte audio úložiště, které nejlépe vyhovuje vašim požadavkům

  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.

Sběr dat řeči pro model ML se týká procesu shromažďování zvukových nahrávek mluveného jazyka. Tato kolekce pomáhá při trénování a zdokonalování algoritmů strojového učení, zejména těch, které jsou zaměřeny na porozumění a zpracování lidských hlasů.

Při shromažďování zvukových dat pro automatické rozpoznávání řeči (ASR) byste měli začít definováním specifických potřeb vašeho projektu, včetně požadovaného jazyka, přízvuku a typu řeči. Po nastavení těchto parametrů se ujistěte, že získáte všechna potřebná oprávnění k respektování soukromí uživatele. Poté použijte vhodná záznamová zařízení nebo software k zachycení čistých zvukových vzorků. Každá nahrávka by měla být pečlivě anotována svým přepisem nebo jinými relevantními metadaty a měla by být systematicky uložena pro snadný přístup.

Datová sada řeči ve strojovém učení je klíčová pro trénování, testování a ověřování modelů přizpůsobených k rozpoznání, přepisu nebo interpretaci mluveného jazyka. Takové datové sady dláždí cestu pro nesčetné množství aplikací, od hlasových asistentů a přepisovacích služeb až po hlasovou biometrii.

Pro shromažďování přesných dat z různých jazyků a přízvuků je nezbytná spolupráce s rodilými mluvčími požadovaného jazykového zázemí. Zaměřte se na pestrý a reprezentativní vzorek, který pokryje široké spektrum demografických nuancí. Používejte standardizované nahrávací zařízení v jednotných prostředích, abyste zajistili konzistenci zvuku. A co je důležité, označte každý datový kus podrobnými přepisy a metadaty, označujícími konkrétní jazyk a přízvuk.