Nejdůvěryhodnější služby sběru dat řeči pro vaši AI

Trénujte své modely NLP, VA, prototypy TTS a další pomocí kvalitních konverzačních dat s našimi službami shromažďování zvukových a řečových dat

Objevte audio datové kanály bez překážek

Kontaktujte nás

Vybraní klienti

Předchozí

další

Profesionální služby sběru audio / hlasových dat

Jakýkoli předmět. Jakýkoli scénář.

Ve společnosti Shaip spočívá naše odbornost ve vytváření vysoce kvalitních datových sad řeči navržených pro různé požadavky AI/ML. Nabízíme širokou škálu jazyků a záznamů v různých nastaveních, díky čemuž jsou naše datové sady komplexní a přizpůsobitelné. Ózaměřujete se na krmení modelů s nejvyšším objemem vlastních řečových dat v co nejkratším čase. S námi na palubě můžete očekávat:

Spravovaná vysoce kvalitní vícejazyčná zvuková / hlasová data pro zvýšení přesnosti
Nejvyšší možná úroveň specifičnosti domény k tvytvořit různorodý scénář Nastavení

Přizpůsobte svůj model ML tak, aby vyhovoval různým demografickým skupinám a vertikálám
Nahrávací prostředí: Studiová kvalita, s křišťálově čistým zvukem s minimálním šumem na pozadí a Přírodní prostředí, kde nahrávky obsahují okolní zvuky, které napodobují skutečné situace.

100+

země

55K +

Údaje o hodinách řeči

250+

Projekty

60+

Jazyky (100+ dialektů)

8 / 16 / 44 / 48 kHz

Vzorkovací frekvence

Naše odbornost

Zarovnejte zvuková data s pro chytřejší modely NLP

Shaip nabízí služby sběru dat řeči/zvukových dat od konce do konce ve více než 100 jazycích, aby technologie podporující hlas mohly uspokojit různorodou skupinu publika na celém světě. Můžeme pracovat na projektech jakéhokoli rozsahu a velikosti; počínaje licencováním stávajících běžně dostupných zvukových datových sad, přes správu vlastního shromažďování zvukových dat až po zvukový přepis a poznámky. Bez ohledu na to, jak velký je váš projekt sběru dat řeči, můžeme služby sběru zvuku přizpůsobit tak, aby vyhovovaly vašim potřebám, a vytvářet tak vysoce kvalitní datové sady NLP, které cílí na dialekty, tóny a jazyky. Vyberte si z naší široké škály datových sad řeči a zdrojů shromažďování zvukových dat pro inteligentní nastavení podporující hlas.

Příběhy o úspěchu

Konverzační datové sady AI s více než 3 8 hodinami dat v XNUMX jazycích

Při snaze vybudovat vícejazyčnou platformu pro indické jazyky se klient spojil se společností Shaip za účelem shromažďování, segmentování a přepisu velkých datových sad v několika indických jazycích. To by pomohlo vyvinout efektivní modely řeči, které by mohly pohánět novou inovativní platformu klienta.

Problém: Více než 3,000 8 hodin zvukových dat shromážděných v XNUMX indických jazycích, segmentovaných a přepsaných za účelem vyvinutí automatického rozpoznávání řeči.

Řešení: Zajistili jsme sběr dat, segmentaci, přepis a dodali JSON soubory s metadaty. Pro klientský projekt technologie řeči jsme shromáždili 3000 hodin zvukových dat v 8 indických jazycích v měřítku.

Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči

Lidé

Specializované a vyškolené týmy:

Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
Tým pověřeného řízení projektů
Zkušený tým vývoje produktů
Tým získávání a přihlašování talentů

Proces

Nejvyšší účinnost procesu je zajištěna pomocí:

Robustní 6stupňový proces sigma-gate
Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
Neustálé zlepšování a zpětná vazba

Plošina

Patentovaná platforma nabízí výhody:

Webová platforma typu end-to-end
Bezvadná kvalita
Rychlejší TAT
Bezproblémové doručení

Lidé

Specializované a vyškolené týmy:

Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
Tým pověřeného řízení projektů
Zkušený tým vývoje produktů
Tým získávání a přihlašování talentů

Proces

Nejvyšší účinnost procesu je zajištěna pomocí:

Robustní 6stupňový proces sigma-gate
Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
Neustálé zlepšování a zpětná vazba

Plošina

Patentovaná platforma nabízí výhody:

Webová platforma typu end-to-end
Bezvadná kvalita
Rychlejší TAT
Bezproblémové doručení

Běžné datové sady řeči / zvuku

Corpus ID (jedinečné)	Klíčové slovo	Jazyková datová sada	Kód jazyka	Vzorkovací frekvence	Typ datové sady	Celkový počet hodin zvuku	Stručný popis	Popis datové sady	Audio Channel	Nahrávací platforma	MY JSME (%)	Audio Format	Formát přepisu	Použijte pouzdro	Počet reproduktorů	CTA
cs_US_CC_8	Afroamerická lidová mluva	Afroamerická lidová mluva	cs	8 kHz	Call centrum	211	Data call-centra afroamerické lidové řeči	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 612, muž: 1242 a neznámý: 12	Kontakt
cs_US_MA_16	Afroamerická lidová mluva	Afroamerická lidová mluva	cs	16 kHz	Média Audio	154	Údaje o afroamerických lidových médiích	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 151, muž: 150 a neznámý: 10	Kontakt
afrikánština_GC_8	afrikánština	afrikánština	af_ZA	8 kHz	Obecná konverzace	368	Údaje o obecné konverzaci v afrikánštině	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, afrikánština mluvená v Africe	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 502, muž: 390 a neznámý: 2	Kontakt
afrikánština_MA_16	afrikánština	afrikánština	af_ZA	16 kHz	Média Audio	658	Africké mediální soubory	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 750, muž: 1278 a neznámý: 52	Kontakt
Arabština_GC_8	arabština	arabština	ar_AE	8 kHz	Obecná konverzace	292	Údaje o obecné konverzaci v arabštině	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, arabština ze zemí Perského zálivu	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 171, muž: 534 a neznámý: 1	Kontakt
Arabština_SM_48	arabština	arabština	ar-SA	48 kHz	Skriptovaný monolog	1,947	Arabsky napsaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 838 Muž 1209 Neznámý 78	Kontakt
Assamese_CC_8	Assamese	ásámština (v potrubí)	jako v		Call centrum	60	Data call-centra Assamese (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Assamese_GC	Assamese	ásámština (v potrubí)	jako v		Obecná konverzace	100	Assamese (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Assamese_MA	Assamese	ásámština (v potrubí)	jako v		Média Audio	40	Assamese (In Pipeline) Audio data médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Bengali_CC_8	bengálský	bengálština (v potrubí)	bn_IN		Call centrum	60	Data call-centra v bengálštině (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Bengálsko_GC	bengálský	bengálština (v potrubí)	bn_IN		Obecná konverzace	100	Údaje o obecné konverzaci v bengálštině (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Bengálština_MA	bengálský	bengálština (v potrubí)	bn_IN		Média Audio	40	Bengálština (In Pipeline) Zvuková data médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Boston_CC_8	bostonská angličtina	bostonská angličtina	cs	8 kHz	Call centrum	177	Data bostonského call centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 605, muž: 711 a neznámý: 0	Kontakt
Boston_GC_8	bostonská angličtina	bostonská angličtina	cs	8 kHz	Obecná konverzace	32	Boston General Conversation data	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 53, muž: 83 a neznámý: 0	Kontakt
Boston_MA_16	bostonská angličtina	bostonská angličtina	cs	16 kHz	Média Audio	93	Zvuková data Boston Media	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 43, muž: 181 a neznámý: 2	Kontakt
Canadian_SM_48	Kanadské francouzštině	Kanadské francouzštině	fr-CA	48 kHz	Skriptovaný monolog	1,222	Kanadské francouzštině	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 974 Muž 631 Neznámý 1	Kontakt
Chinese_CC_8	Čínština anglicky	Čínština anglicky	cs	8 kHz	Call centrum	169	Čínská data call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 1790, muž: 523 a neznámý: 13	Kontakt
Chinese_MA_16	Čínština anglicky	Čínština anglicky	cs	16 kHz	Média Audio	249	Zvuková data čínských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 126, muž: 346 a neznámý: 6	Kontakt
Zjednodušená čínština_SM_48	Zjednodušená čínština	Zjednodušená čínština	zh-CN	48 kHz	Skriptovaný monolog	2,762	Zjednodušená čínština	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1920 Muž 1535 Neznámý 270	Kontakt
Tradiční čínština_SM_48	Tradiční čínština	Tradiční čínština	zh-TW	48 kHz	Skriptovaný monolog	1,028	Tradiční čínština	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1069 Muž 262 Neznámý 3	Kontakt
dánština_GC_8	dánský	dánský	da_DK	8 kHz	Obecná konverzace	372	Údaje o dánské obecné konverzaci	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 311, muž: 417, neznámý: 0	Kontakt
dánština_MA_16	dánský	dánský	da_DK	16 kHz	Média Audio	664	Zvuková data dánských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena: 369, muž: 864, neznámý: 27	Kontakt
dánština_SM_48	dánský	dánský	da-DK	48 kHz	Skriptovaný monolog	2,579	Dánský skriptovaný monolog	Nahrávky s jednou promluvou, které se obvykle pohybují v rozmezí 5 až 30 sekund, dánština z Dánska	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1551 Muž 1233 Neznámý 42	Kontakt
English Deep South_CC_8	Angličtina Deep South	Angličtina Deep South	cs	8 kHz	Call centrum	151	Data call centra v angličtině Deep South	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 221 , Muž 1004 , Neznámý 7	Kontakt
English Deep South_GC_8	Angličtina Deep South	Angličtina Deep South	cs	8 kHz	Obecná konverzace	56	Data obecné konverzace v angličtině Deep South	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 99, muž 31, neznámý 0	Kontakt
English Deep South_MA_16	Angličtina Deep South	Angličtina Deep South	cs	16 kHz	Média Audio	266	Zvuková data Deep South Media	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 204, muž 356, neznámý 21	Kontakt
Němčina_CC_8	Němec	Němec	de-De	8 kHz	Call centrum	64	Údaje německého call centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Mono	Desktop		. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 478 Muž 1440 Neznámý 0	Kontakt
německy_IVR_8	Němec	Němec	de-De	8 kHz	IVR	200	Německá data IVR	Člověk ke stroji. Typ toku IVR, kde je výzva TTS (např. „Jak vám mohu pomoci“) následovaná spontánní lidskou reakcí	Mono	Desktop		. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 10115 Muž 8750 Neznámý 0	Kontakt
Gudžarátština_CC_8	gujarati	gudžarátština (v potrubí)	gu_IN		Call centrum	60	Data call-centra Gujarati (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Gudžarátština_GC	gujarati	gudžarátština (v potrubí)	gu_IN		Obecná konverzace	100	Gujarati (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Gudžarátština_MA	gujarati	gudžarátština (v potrubí)	gu_IN		Média Audio	40	Gujarati (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Hebrejština_Obecná konverzace_8	hebrejština	hebrejština	on_IL	8 kHz	Obecná konverzace	399	Údaje o hebrejské obecné konverzaci	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, hebrejština v Izraeli	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 414 , Muž 399 , Neznámý 1	Kontakt
Hebrejština_MA_16	hebrejština	hebrejština	on_IL	16 kHz	Média Audio	427	Zvuková data hebrejských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 361, muž 513, neznámý 13	Kontakt
Hindština_MA_16	hindština	hindština	ahoj_IN	16 kHz	Média Audio	219	Zvuková data Hindi Media	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 83, muž 309, neznámý 0	Kontakt
Hindština_SM_48	hindština	hindština	hi-IN	48 kHz	Skriptovaný monolog	2,867	Hindsky napsaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1977 Muž 1864 Neznámý 147	Kontakt
HINGLISH_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Call centrum	208	HINGLISH Data call centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 822, muž 1262, neznámý 0	Kontakt
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Média Audio	216	HINGLISH Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 75, muž 380, neznámý 0	Kontakt
Hispanic_CC_8	hispánská angličtina	hispánská angličtina	cs	8 kHz	Call centrum	212	Data hispánského call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 822, muž 1262, neznámý 0	Kontakt
Hispanic_MA_16	hispánská angličtina	hispánská angličtina	cs	16 kHz	Média Audio	155	Hispanic Call Media audio	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 140, muž 219, neznámý 5	Kontakt
Indonéština_GC_8	indonéský	indonéský	udělal jsem	8 kHz	Obecná konverzace	496	Údaje z indonéské obecné konverzace	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, bahasa indonéština	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 524, muž 454, neznámý 2	Kontakt
Indonéština_MA_16	indonéský	indonéský	udělal jsem	16 kHz	Média Audio	643	Zvuková data indonéských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 746, muž 1507, neznámý 129	Kontakt
Irish_GC_8	irský	irský	en_IE	8 kHz	Obecná konverzace	192	Údaje o obecné konverzaci v Irsku	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 213 , Muž 153 , Neznámý 0	Kontakt
japonština_SM_48	japonský	japonský	ja-JP	48 kHz	Skriptovaný monolog	2,335	Japonský skriptovaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1460 Muž 1221 Neznámý 194	Kontakt
Kannada_CC_8	kannada	Kannada (in Pipeline)	kn_IN		Call centrum	60	Data call-centra Kannada (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Kannada_GC	kannada	Kannada (in Pipeline)	kn_IN		Obecná konverzace	100	Kannada (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Kannada_MA	kannada	Kannada (in Pipeline)	kn_IN		Média Audio	40	Kannada (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Korean_CC_8	korejský	korejský	ko_KR	8 kHz	Call centrum	107	Korejská data call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1086, muž 210, neznámý 4	Kontakt
Korean_MA_16	korejský	korejský	ko_KR	16 kHz	Média Audio	204	Korejská mediální audio data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 70 Muž 303, neznámý 25	Kontakt
Korean_SM_48	korejský	korejský	ko-KR	48 kHz	Skriptovaný monolog	1,955	Korejský skriptovaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1195 Muž 1134 Neznámý 122	Kontakt
Malay_GC_8	malajsky	malajsky	ms_MY	8 kHz	Obecná konverzace	266	Malajská data obecné konverzace	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, malajština v Malajsii	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 316, muž 176, neznámý 0	Kontakt
Malay_MA_16	malajsky	malajsky	ms_MY	16 kHz	Média Audio	344	Malay Media audio data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 236, muž 626, neznámý 47	Kontakt
malajálamština_CC_8	malabarština	malajálamština (v potrubí)	ml_IN		Call centrum	60	Data call-centra Malayalam (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Malayalam_GC	malabarština	malajálamština (v potrubí)	ml_IN		Obecná konverzace	100	Malajálamština (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Malayalam_MA	malabarština	malajálamština (v potrubí)	ml_IN		Média Audio	40	Malajálamština (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Maráthština_CC_8	maráthština	maráthština (v potrubí)	pan_IN		Call centrum	60	Data call-centra Marathi (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Marathi_GC	maráthština	maráthština (v potrubí)	pan_IN		Obecná konverzace	100	Data obecné konverzace v maráthštině (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Marathi_MA	maráthština	maráthština (v potrubí)	pan_IN		Média Audio	40	Maráthština (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Mexican_SM_48	Španělština (Mexiko)	Španělština (Mexiko)	es-MX	48 kHz	Skriptovaný monolog	1,492	Mexický španělský skriptovaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1016 Muž 1069 Neznámý 95	Kontakt
Nizozemsko_SM_48	holandský	holandský	nl-NL	48 kHz	Skriptovaný monolog	1,205	Nizozemský skriptovaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1285 Muž 531 Neznámý 3	Kontakt
New York English_CC_8	New York English	New York English	cs	8 kHz	Call centrum	103	Data call centra v New Yorku v angličtině	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 610, muž 532, neznámý 0	Kontakt
New York English_GC_8	New York English	New York English	cs	8 kHz	Obecná konverzace	107	Data obecné konverzace v New Yorku v angličtině	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 118, muž 114, neznámý 0	Kontakt
New York English_MA_16	New York English	New York English	cs	16 kHz	Média Audio	140	New York English Media audio data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 66, muž 230, neznámý 11	Kontakt
Nový Zéland_GC_8	Novozélandská angličtina	Novozélandská angličtina	en_NZ	8 kHz	Obecná konverzace	148	Údaje o obecné konverzaci v novozélandské angličtině	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 167, muž 121, neznámý 4	Kontakt
Nový Zéland_MA_16	Novozélandská angličtina	Novozélandská angličtina	en_NZ	16 kHz	Média Audio	400	Nový Zéland English Media audio	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 367, muž 678, neznámý 26	Kontakt
Oriya_CC_8	Oriya	Oriya (v potrubí)	nebo_IN		Call centrum	60	Data call-centra Oriya (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Oriya_GC	Oriya	Oriya (v potrubí)	nebo_IN		Obecná konverzace	100	Oriya (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Oriya_MA	Oriya	Oriya (v potrubí)	nebo_IN		Média Audio	40	Oriya (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Polish_MA_16	polský	polský	pl_PL	16 kHz	Média Audio	269	Zvuk polských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 173 Muž 354 Neznámý 6	Kontakt
polské Polsko_SM_48	Polština (Polsko)	Polština (Polsko)	pl-PL	48 kHz	Skriptovaný monolog	1,482	Polské Polsko – napsaný monolog	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1324 Muž 701 Neznámý 24	Kontakt
Pandžábština_CC_8	pandžábský	pandžábština (in Pipeline)	pandžábský		Call centrum	60	Data call-centra Punjabi (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Pandžábština_GC	pandžábský	pandžábština (in Pipeline)	pandžábský		Obecná konverzace	100	Údaje o obecné konverzaci v pandžábštině (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Pandžábština_MA	pandžábský	pandžábština (in Pipeline)	pandžábský		Média Audio	40	Punjabi (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
rusky_SM_48	ruský	ruský	ru-RU	48 kHz	Skriptovaný monolog	2,398	Monolog s ruským scénářem	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1689 Muž 1937 Neznámý 214	Kontakt
Scottish_GC_8	skotština (anglický přízvuk)	skotština (anglický přízvuk)	en_AB	8 kHz	Obecná konverzace	292	Data skotské obecné konverzace	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 285, muž 260, neznámý 3	Kontakt
Singapur_CC_8	Singapurská angličtina	Singapurská angličtina	cs_SG	8 kHz	Call centrum	218	Data singapurského call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 2139, muž 884, neznámý 21	Kontakt
Singapur_MA_16	Singapurská angličtina	Singapurská angličtina	cs_SG	16 kHz	Média Audio	247	Singapur Media audio data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 160, muž 455, neznámý 37	Kontakt
Jihoafrická angličtina_CC_8	Jihoafrická angličtina	Jihoafrická angličtina	en_ZA	8 kHz	Call centrum	261	Data call-centra v jihoafrické angličtině	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1274 , Muž 935 , Neznámý 1	Kontakt
Jihoafrická republika English_MA_16	Jihoafrická angličtina	Jihoafrická angličtina	en_ZA	16 kHz	Média Audio	251	Jihoafrická anglická mediální audio data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 235, muž 432, neznámý 36	Kontakt
svahilština_CC_8	svahilština	svahilština	sw_KE	8 kHz	Call centrum	230	Údaje svahilského call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 611, muž 833, neznámý 0	Kontakt
svahilština_MA_16	svahilština	svahilština	sw_KE	16 kHz	Média Audio	265	Zvuková data svahilských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 118, muž 493, neznámý 25	Kontakt
švédština_CC_8	švédský	švédský	sv_SE	8 kHz	Call centrum	250	Údaje švédského call-centra	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1581, muž 727, neznámý 2	Kontakt
švédština_MA_16	švédský	švédský	sv_SE	16 kHz	Média Audio	278	Zvuková data švédských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 195, muž 500, neznámý 21	Kontakt
Tamil_CC_8	tamilština	tamilština (v potrubí)	ta_IN		Call centrum	60	Data call-centra tamilštiny (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Tamil_GC	tamilština	tamilština (v potrubí)	ta_IN		Obecná konverzace	100	Tamilská (In Pipeline) data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Tamil_MA	tamilština	tamilština (v potrubí)	ta_IN		Média Audio	40	Tamilská (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
telugština_GC_8	telugština	telugština	te_IN	8 kHz	Obecná konverzace	553	Údaje o obecné konverzaci v telugštině	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 574, muž 564, neznámý 0	Kontakt
telugština_MA_16	telugština	telugština	te_IN	16 kHz	Média Audio	648	Zvuková data Telugu Media	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 207, muž 963, neznámý 2	Kontakt
telugština_CC_8	telugština	telugština (v potrubí)	te_IN		Call centrum	30	Data call-centra Telugu (In Pipeline).	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
telugština_GC	telugština	telugština (v potrubí)	te_IN		Obecná konverzace	50	Telugu (In Pipeline) Data obecné konverzace	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,		Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
telugština_MA	telugština	telugština (v potrubí)	te_IN		Média Audio	20	Telugu (In Pipeline) Mediální zvuková data	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut		Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování		Kontakt
Thai_GC_8	thajština	thajština	čt_TH	8 kHz	Obecná konverzace	183	Thajská obecná konverzace	Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, Neformální registr používaný mezi přáteli	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 338, muž 96, neznámý 8	Kontakt
Thai_MA_8	thajština	thajština	čt_TH	16 kHz	Média Audio	173	Zvuk thajských médií	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 143, muž 502, neznámý 26	Kontakt
Turecké Turecko_SM_48	Turecké Turecko	Turecké Turecko	TR-TR	48 kHz	Skriptovaný monolog	2,027	Turecké Turecko	Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund	Mono	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 1561 Muž 1241 Neznámý 31	Kontakt
Vietnamština_GC_8	Vietnamec	Vietnamec	vi_VN	8 kHz	Obecná konverzace	295	Údaje o vietnamské obecné konverzaci	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5-15 minut, severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město).	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 400, muž 380, neznámí 2	Kontakt
Vietnamese_MA_16	Vietnamec	Vietnamec	vi_VN	16 kHz	Média Audio	257	Zvuková data Vietnamese Media	Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut	Mono	Web Sourcing	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 249, muž 200, neznámí 45	Kontakt
Welsh_GC_8	velština (anglický přízvuk)	velština (anglický přízvuk)	en_WL	8 kHz	Obecná konverzace	278	Údaje o velšské obecné konverzaci	Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,	Dvojí	Desktop	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Žena 270, muž 324, neznámý 0	Kontakt
Velká Británie English_WW_16	Britská angličtina	Britská angličtina	en_uk	16 kHz	Wake Word	Reproduktory 200	Wake Word UK angličtina	klíčové fráze sběr dat 200 reproduktory 4 unikátní klíčové fráze na reproduktor 25-30 opakovaných nahrávek klíčových frází na jedinečnou klíčovou frázi 25–30 zvukových souborů na jedinečnou klíčovou frázi Celkem 120 nahraných promluv na řečníka	1 kanál	Mobile App	5.0	. Wav	.Json	ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování	Pohlaví: 50 % muži, 50 % ženy, +/- 10 %.	Kontakt

Nabízené služby

Expertní sběr zvukových dat není pro komplexní nastavení umělé inteligence praktický. Ve společnosti Shaip můžete dokonce zvážit následující služby, díky nimž budou modely mnohem rozšířenější než obvykle:

Doporučené zdroje

Nabízí

Zvuková anotace pro inteligentní AI

Zvukové anotační služby jsou silnou stránkou Shaip od počátku. Vyvíjejte, trénujte a vylepšujte konverzační umělou inteligenci, chatboty a nástroje pro rozpoznávání řeči pomocí našich nejmodernějších služeb zvukových poznámek.

Průvodce kupujícím

Průvodce kupujícího: Kompletní průvodce konverzační umělou inteligencí

Chatbot, se kterým jste mluvili, běží na pokročilém konverzačním systému umělé inteligence, který je trénovaný, testovaný a vytvořený pomocí spousty datových sad pro rozpoznávání řeči.

Katalog dat

Běžný katalog dat řeči a licencování

V projektech AI existuje široká škála běžných aplikací pro data řeči. Nabízíme vám obrovské množství vysoce kvalitních dat připravených pro vaše rozpoznávání hlasu.

Chcete si vytvořit vlastní zvukovou datovou sadu?

Spojte se s naším interním odborníkem na sběr dat řeči a nastavte audio úložiště, které nejlépe vyhovuje vašim požadavkům

Jméno*
Příjmení*
email*
Telefon*
O nás*
Země*
Země
Komentáře*
Registrací souhlasím se Shaipem Zásady ochrany osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.
CAPTCHA

Často kladené otázky (FAQ)

1. Co je sběr dat řeči?

Sběr dat řeči pro model ML se týká procesu shromažďování zvukových nahrávek mluveného jazyka. Tato kolekce pomáhá při trénování a zdokonalování algoritmů strojového učení, zejména těch, které jsou zaměřeny na porozumění a zpracování lidských hlasů.

2. Jak sbírat zvuková data pro ASR (automatické rozpoznávání řeči)?

Při shromažďování zvukových dat pro automatické rozpoznávání řeči (ASR) byste měli začít definováním specifických potřeb vašeho projektu, včetně požadovaného jazyka, přízvuku a typu řeči. Po nastavení těchto parametrů se ujistěte, že získáte všechna potřebná oprávnění k respektování soukromí uživatele. Poté použijte vhodná záznamová zařízení nebo software k zachycení čistých zvukových vzorků. Každá nahrávka by měla být pečlivě anotována svým přepisem nebo jinými relevantními metadaty a měla by být systematicky uložena pro snadný přístup.

3. Použití datové sady řeči pro strojové učení

Datová sada řeči ve strojovém učení je klíčová pro trénování, testování a ověřování modelů přizpůsobených k rozpoznání, přepisu nebo interpretaci mluveného jazyka. Takové datové sady dláždí cestu pro nesčetné množství aplikací, od hlasových asistentů a přepisovacích služeb až po hlasovou biometrii.

4. Jak sbírat přesná data z více jazyků a akcentů

Pro shromažďování přesných dat z různých jazyků a přízvuků je nezbytná spolupráce s rodilými mluvčími požadovaného jazykového zázemí. Zaměřte se na pestrý a reprezentativní vzorek, který pokryje široké spektrum demografických nuancí. Používejte standardizované nahrávací zařízení v jednotných prostředích, abyste zajistili konzistenci zvuku. A co je důležité, označte každý datový kus podrobnými přepisy a metadaty, označujícími konkrétní jazyk a přízvuk.

Nejdůvěryhodnější služby sběru dat řeči pro vaši AI

Objevte audio datové kanály bez překážek

Vybraní klienti

Profesionální služby sběru audio / hlasových dat

Jakýkoli předmět. Jakýkoli scénář.

100+

55K +

250+

60+

8 / 16 / 44 / 48 kHz

Naše odbornost

Zarovnejte zvuková data s pro chytřejší modely NLP

Monologická sbírka řeči

Projev dialogu Sbírka

Skupina / Muti-party Konverzace

Sbírka promluvy v přirozeném jazyce

Akustická data Sbírka

Automatické rozpoznávání řeči (ASR)

Vícejazyčná data školení řeči/zvuku

Text na řeč (TTS)

Call Center Nahrávky

Příběhy o úspěchu

Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči

Lidé

Proces

Plošina

Lidé

Proces

Plošina

Běžné datové sady řeči / zvuku

Nabízené služby

Sběr textových dat Služby

Služby sběru obrazových dat

Služby sběru video dat

Doporučené zdroje

Nabízí

Zvuková anotace pro inteligentní AI

Průvodce kupujícím

Průvodce kupujícího: Kompletní průvodce konverzační umělou inteligencí

Katalog dat

Běžný katalog dat řeči a licencování

Chcete si vytvořit vlastní zvukovou datovou sadu?

Často kladené otázky (FAQ)

Datové služby AI

Speciality

Průmysl

Produkty

O nás

Zdroje

Kontaktujte nás

Projev dialogu
Sbírka

Skupina / Muti-party
Konverzace

Akustická data
Sbírka

Text na řeč
(TTS)

Call Center
Nahrávky

Sběr textových dat
Služby