Nejdůvěryhodnější služby sběru dat řeči pro vaše AI

Trénujte své modely NLP, VA, prototypy TTS a další pomocí kvalitních konverzačních dat s našimi službami shromažďování zvukových a řečových dat

Sběr zvukových dat

Objevte audio datové kanály bez překážek.

Vybraní klienti

Proč je pro zpracování přirozeného jazyka zapotřebí datová sada školení řeči?

Všimli jste si někdy interakce svého chytrého telefonu VA, tj. Siri, Bixby nebo čehokoli jiného? Způsob, jakým odpovídají na každou otázku a analyzují a prezentují výsledky podle vašich požadavků!

Jakkoli nás tyto VA fascinují, je třeba tyto inteligentní zdroje a programy postupně trénovat, aby byly schopny reagovat co nejpřesněji. To je důvod, proč byste měli uvažovat o outsourcingu sběru řeči/audia a hlasových dat specializovaným společnostem pro sběr dat s ověřením odborných znalostí.

Investice do shromažďování zvukových dat připraví vaše údajné NLP tak, aby uspokojilo vícejazyčné publikum. Nejen to, shromažďování dat řeči pro NLP, jak a kdy je zpracováváno odborníkem, dokonce bere v úvahu sběr dat v terénu, sémantickou analýzu a přepis zvuku. S profesionálními řešeními pro sběr dat řeči můžete:

  • Pořiďte si vysoce kvalitní zvukové datové sady pro zvýšení přesnosti
  • Zaměřte se na nastavení různých scénářů
  • Sbírejte vícejazyčná tréninková data AI
  • Přizpůsobte svůj model ML tak, aby vyhovoval různým demografickým skupinám a vertikálám

Profesionální služby shromažďování audio / hlasových dat pro NLP

Jakýkoli předmět. Jakýkoli scénář.

Inteligentní systémy NLP nejsou nic jiného než generické. V závislosti na funkčnosti programu se možná budete muset zaměřit na služby prostorových a vícejazyčných zvukových dat, které mohou nabízet pouze renomované společnosti pro sběr hlasových/zvukových dat. Zde Shaip vstupuje do schématu věcí jako vysoce spolehlivý poskytovatel služeb datového připojení, který je hrdý na to, že dělá těžkou práci pro vaše údajně inteligentní AI.

Ve společnosti Shaip se primárně zaměřujeme na podávání modelů s nejvyšším možným objemem vlastních ukázek řeči v co nejkratším čase. S námi na palubě můžete očekávat:

Sbírka řeči
  • Vytváření vybraných zvukových / hlasových dat pro NLP
  • Programy šité na míru, které reagují podle konkrétních případů použití
  • Připravuje se těžba zvukové datové sady
  • Automatizované zpracování dat specifické pro vzor
  • Nejvyšší možná úroveň specifičnosti domény
  • Rychlejší uvedení na trh díky zrychleným modelům AI

Naše odbornost

Zarovnejte zvuková data a připravte inteligentní modely NLP

Shaip nabízí služby sběru dat řeči/zvukových dat od konce do konce ve více než 100 jazycích, aby technologie podporující hlas mohly uspokojit různorodou skupinu publika na celém světě. Můžeme pracovat na projektech jakéhokoli rozsahu a velikosti; počínaje licencováním stávajících běžně dostupných zvukových datových sad, přes správu vlastního shromažďování zvukových dat až po zvukový přepis a poznámky. Bez ohledu na to, jak velký je váš projekt sběru dat řeči, můžeme služby sběru zvuku přizpůsobit tak, aby vyhovovaly vašim potřebám, a vytvářet tak vysoce kvalitní datové sady NLP, které cílí na dialekty, tóny a jazyky. Vyberte si z naší široké škály datových sad řeči a zdrojů shromažďování zvukových dat pro inteligentní nastavení podporující hlas.

Monologický projev

Monologická sbírka řeči

Zpracovávejte požadavky na řeč týkající se samostatného reproduktoru pro vaše prototypy Text-to-Speed ​​a požadavky specifické pro přepisy pomocí skriptovaného rychlého podávání prostřednictvím jednokanálových souborů.

Projev dialogu

Projev dialogu
Sbírka

Nastavte inteligentní virtuální asistenty, chatboty specifické pro rychlost a modely automatického rozpoznávání řeči s vícejazyčnou expozicí prostřednictvím dvoukanálových souborů a přepsaných zdrojů.

Akustická řeč

Akustická data
Sbírka

Můžeme profesionálně zaznamenávat zvuková data studiové kvality, ať už jde o restaurace, kanceláře nebo domácnosti nebo z různých prostředí a jazyků, prostřednictvím naší globální sítě spolupracovníků, přičemž pokrýváme širší akustický rozsah

Přirozený jazyk

Sbírka promluvy v přirozeném jazyce

Trénujte chytrá komerční nastavení, abyste identifikovali různě vyslovované zákaznické fráze s podobným významem, aby byly AI časově samostatnější

Digitální virtuální asistenti

Digitální / virtuální
Asistenti

Soustřeďte se na budování svého nadcházejícího virtuálního asistenta trénováním modelů s upozorněním na lidskou řeč, vícejazyčnou expozici, kontextovou analýzu a NLU.

Automatické rozpoznávání řeči

Automatické rozpoznávání řeči (ASR)

Zlepšete přesnost svých systémů automatického rozpoznávání řeči (ASR) tím, že budete mít přístup k nejmodernějším diverzifikovaným řečovým/audio datovým sadám z celé řady demografických skupin.

Přirozený jazyk

Vícejazyčná data školení řeči/zvuku

Naši vysoce kvalifikovaní jazykoví profesionálové po celém světě nabízejí vícejazyčná audio/řečová školení v různých jazycích a dialektech včetně arabštiny, dánštiny, čínštiny, afrikánštiny, Singapuru, Nového Zélandu, hebrejštiny, indonéštiny, irštiny, korejštiny, malajštiny, polštiny, skotštiny, švédštiny , francouzština, němčina, vietnamština, thajština, italština, španělština a další.

Digitální virtuální asistenti

Text na řeč
(TTS)

Chcete-li nabídnout lepší uživatelský zážitek s TTS, je zásadní vyvinout systém, aby zněl přirozeně. Sestavte si vícejazyčný model převodu textu na řeč (TTS) s pomocí naší globální pracovní síly, která vám pomůže shromažďovat data řeči ve více než 150 jazycích a dialektech, abyste vylepšili své modely umělé inteligence od ovládání v autě po chatboty a výuková řešení s vysokou kvalitní audio data.

Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči

Lidé

Lidé

Specializované a vyškolené týmy:

  • Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
  • Tým pověřeného řízení projektů
  • Zkušený tým vývoje produktů
  • Tým získávání a přihlašování talentů
Proces

Proces

Nejvyšší účinnost procesu je zajištěna pomocí:

  • Robustní 6stupňový proces sigma-gate
  • Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
  • Neustálé zlepšování a zpětná vazba
Plošina

Plošina

Patentovaná platforma nabízí výhody:

  • Webová platforma typu end-to-end
  • Bezvadná kvalita
  • Rychlejší TAT
  • Bezproblémové doručení

Jazyk: Shromážděné zvukové datové sady

Běžné datové sady řeči / zvuku

DetailyJazyková datová sadaVzorkovací frekvenceTyp datové sadyCelkový počet hodin zvukuStručný popisPopis datové sadyAudio ChannelNahrávací platformaMY JSME (%)Audio FormatFormát přepisuPoužijte pouzdroPočet reproduktorůCTA
Řečcs_US_CC_8Afroamerická lidová mluvaAfroamerická lidová mluvacs8 kHzCall centrum211Data call-centra afroamerické lidové řečiNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 612, muž: 1242 a neznámý: 12
Řečcs_US_MA_16Afroamerická lidová mluvaAfroamerická lidová mluvacs16 kHzMédia Audio154Údaje o afroamerických lidových médiíchLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 151, muž: 150 a neznámý: 10
Řečafrikánština_GC_8afrikánštinaafrikánštinaaf_ZA8 kHzObecná konverzace368Údaje o obecné konverzaci v afrikánštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, afrikánština mluvená v AfriceDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 502, muž: 390 a neznámý: 2
Řečafrikánština_MA_16afrikánštinaafrikánštinaaf_ZA16 kHzMédia Audio658Africké mediální souboryLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 750, muž: 1278 a neznámý: 52
ŘečArabština_GC_8arabštinaarabštinaar_AE8 kHzObecná konverzace292Údaje o obecné konverzaci v arabštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, arabština ze zemí Perského zálivuDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 171, muž: 534 a neznámý: 1
ŘečArabština_SM_48arabštinaarabštinaar-SA48 kHzSkriptovaný monolog1,947Arabsky napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 838 Muž 1209 Neznámý 78
ŘečAssamese_CC_8Assameseásámština (v potrubí) jako vCall centrum60Data call-centra Assamese (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese_GCAssameseásámština (v potrubí) jako vObecná konverzace100Assamese (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese_MAAssameseásámština (v potrubí) jako vMédia Audio40Assamese (In Pipeline) Audio data médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengali_CC_8bengálskýbengálština (v potrubí) bn_INCall centrum60Data call-centra v bengálštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengálsko_GCbengálskýbengálština (v potrubí) bn_INObecná konverzace100Údaje o obecné konverzaci v bengálštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBengálština_MAbengálskýbengálština (v potrubí) bn_INMédia Audio40Bengálština (In Pipeline) Zvuková data médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBoston_CC_8bostonská angličtinabostonská angličtinacs8 kHzCall centrum177Data bostonského call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 605, muž: 711 a neznámý: 0
ŘečBoston_GC_8bostonská angličtinabostonská angličtinacs8 kHzObecná konverzace32Boston General Conversation dataNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 53, muž: 83 a neznámý: 0
ŘečBoston_MA_16bostonská angličtinabostonská angličtinacs16 kHzMédia Audio93Zvuková data Boston MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 43, muž: 181 a neznámý: 2
ŘečCanadian_SM_48Kanadské francouzštiněKanadské francouzštiněfr-CA48 kHzSkriptovaný monolog1,222Kanadské francouzštiněNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 974 Muž 631 Neznámý 1
ŘečChinese_CC_8Čínština anglickyČínština anglickycs8 kHzCall centrum169Čínská data call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 1790, muž: 523 a neznámý: 13
ŘečChinese_MA_16Čínština anglickyČínština anglickycs16 kHzMédia Audio249Zvuková data čínských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 126, muž: 346 a neznámý: 6
ŘečZjednodušená čínština_SM_48Zjednodušená čínštinaZjednodušená čínštinazh-CN48 kHzSkriptovaný monolog2,762Zjednodušená čínštinaNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1920 Muž 1535 Neznámý 270
ŘečTradiční čínština_SM_48Tradiční čínštinaTradiční čínštinazh-TW48 kHzSkriptovaný monolog1,028Tradiční čínštinaNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1069 Muž 262 Neznámý 3
Řečdánština_GC_8dánskýdánskýda_DK8 kHzObecná konverzace372Údaje o dánské obecné konverzaciNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 311, muž: 417, neznámý: 0
Řečdánština_MA_16dánskýdánskýda_DK16 kHzMédia Audio664Zvuková data dánských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena: 369, muž: 864, neznámý: 27
Řečdánština_SM_48dánskýdánskýda-DK48 kHzSkriptovaný monolog2,579Dánský skriptovaný monologNahrávky s jednou promluvou, které se obvykle pohybují v rozmezí 5 až 30 sekund, dánština z DánskaMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1551 Muž 1233 Neznámý 42
ŘečEnglish Deep South_CC_8Angličtina Deep SouthAngličtina Deep Southcs8 kHzCall centrum151Data call centra v angličtině Deep SouthNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 221 , Muž 1004 , Neznámý 7
ŘečEnglish Deep South_GC_8Angličtina Deep SouthAngličtina Deep Southcs8 kHzObecná konverzace56Data obecné konverzace v angličtině Deep SouthNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 99, muž 31, neznámý 0
ŘečEnglish Deep South_MA_16Angličtina Deep SouthAngličtina Deep Southcs16 kHzMédia Audio266Zvuková data Deep South MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 204, muž 356, neznámý 21
ŘečNěmčina_CC_8NěmecNěmecde-De8 kHzCall centrum64Údaje německého call centra Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,MonoDesktop. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 478 Muž 1440 Neznámý 0
Řečněmecky_IVR_8NěmecNěmecde-De8 kHz IVR200Německá data IVRČlověk ke stroji. Typ toku IVR, kde je výzva TTS (např. „Jak vám mohu pomoci“) následovaná spontánní lidskou reakcíMonoDesktop. Wav .jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování Žena 10115 Muž 8750 Neznámý 0
ŘečGudžarátština_CC_8gujaratigudžarátština (v potrubí) gu_INCall centrum60Data call-centra Gujarati (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečGudžarátština_GCgujaratigudžarátština (v potrubí) gu_INObecná konverzace100Gujarati (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečGudžarátština_MAgujaratigudžarátština (v potrubí) gu_INMédia Audio40Gujarati (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečHebrejština_Obecná konverzace_8hebrejštinahebrejštinaon_IL8 kHzObecná konverzace399Údaje o hebrejské obecné konverzaciNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, hebrejština v IzraeliDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 414 , Muž 399 , Neznámý 1
ŘečHebrejština_MA_16hebrejštinahebrejštinaon_IL16 kHzMédia Audio427Zvuková data hebrejských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 361, muž 513, neznámý 13
ŘečHindština_MA_16hindštinahindštinaahoj_IN16 kHzMédia Audio219Zvuková data Hindi MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 83, muž 309, neznámý 0
ŘečHindština_SM_48hindštinahindštinahi-IN48 kHzSkriptovaný monolog2,867Hindsky napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1977 Muž 1864 Neznámý 147
ŘečHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall centrum208HINGLISH Data call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 822, muž 1262, neznámý 0
ŘečHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMédia Audio216HINGLISH Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 75, muž 380, neznámý 0
ŘečHispanic_CC_8hispánská angličtinahispánská angličtinacs8 kHzCall centrum212Data hispánského call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 822, muž 1262, neznámý 0
ŘečHispanic_MA_16hispánská angličtinahispánská angličtinacs16 kHzMédia Audio155Hispanic Call Media audioLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 140, muž 219, neznámý 5
ŘečIndonéština_GC_8indonéskýindonéskýudělal jsem8 kHzObecná konverzace496Údaje z indonéské obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, bahasa indonéštinaDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 524, muž 454, neznámý 2
ŘečIndonéština_MA_16indonéskýindonéskýudělal jsem16 kHzMédia Audio643Zvuková data indonéských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 746, muž 1507, neznámý 129
ŘečIrish_GC_8irskýirskýen_IE8 kHzObecná konverzace192Údaje o obecné konverzaci v IrskuNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 213 , Muž 153 , Neznámý 0
Řečjaponština_SM_48japonskýjaponskýja-JP48 kHzSkriptovaný monolog2,335Japonský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1460 Muž 1221 Neznámý 194
ŘečKannada_CC_8kannadaKannada (in Pipeline) kn_INCall centrum60Data call-centra Kannada (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKannada_GCkannadaKannada (in Pipeline) kn_INObecná konverzace100Kannada (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKannada_MAkannadaKannada (in Pipeline) kn_INMédia Audio40Kannada (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečKorean_CC_8korejskýkorejskýko_KR8 kHzCall centrum107Korejská data call-centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1086, muž 210, neznámý 4
ŘečKorean_MA_16korejskýkorejskýko_KR16 kHzMédia Audio204Korejská mediální audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 70 Muž 303, neznámý 25
ŘečKorean_SM_48korejskýkorejskýko-KR48 kHzSkriptovaný monolog1,955Korejský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1195 Muž 1134 Neznámý 122
ŘečMalay_GC_8malajskymalajskyms_MY8 kHzObecná konverzace266Malajská data obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, malajština v MalajsiiDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 316, muž 176, neznámý 0
ŘečMalay_MA_16malajskymalajskyms_MY16 kHzMédia Audio344Malay Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 236, muž 626, neznámý 47
Řečmalajálamština_CC_8malabarštinamalajálamština (v potrubí) ml_INCall centrum60Data call-centra Malayalam (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMalayalam_GCmalabarštinamalajálamština (v potrubí) ml_INObecná konverzace100Malajálamština (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMalayalam_MAmalabarštinamalajálamština (v potrubí) ml_INMédia Audio40Malajálamština (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMaráthština_CC_8maráthštinamaráthština (v potrubí) pan_INCall centrum60Data call-centra Marathi (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMarathi_GCmaráthštinamaráthština (v potrubí) pan_INObecná konverzace100Data obecné konverzace v maráthštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMarathi_MAmaráthštinamaráthština (v potrubí) pan_INMédia Audio40Maráthština (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMexican_SM_48Španělština (Mexiko)Španělština (Mexiko)es-MX48 kHzSkriptovaný monolog1,492Mexický španělský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1016 Muž 1069 Neznámý 95
ŘečNizozemsko_SM_48holandskýholandskýnl-NL48 kHzSkriptovaný monolog1,205Nizozemský skriptovaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1285 Muž 531 Neznámý 3
ŘečNew York English_CC_8New York EnglishNew York Englishcs8 kHzCall centrum103Data call centra v New Yorku v angličtiněNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 610, muž 532, neznámý 0
ŘečNew York English_GC_8New York EnglishNew York Englishcs8 kHzObecná konverzace107New York English General Conversation dataNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 118, muž 114, neznámý 0
ŘečNew York English_MA_16New York EnglishNew York Englishcs16 kHzMédia Audio140New York English Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 66, muž 230, neznámý 11
ŘečNový Zéland_GC_8Novozélandská angličtina Novozélandská angličtina en_NZ8 kHzObecná konverzace148Údaje o obecné konverzaci v novozélandské angličtiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 167, muž 121, neznámý 4
ŘečNový Zéland_MA_16Novozélandská angličtina Novozélandská angličtina en_NZ16 kHzMédia Audio400Nový Zéland English Media audioLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 367, muž 678, neznámý 26
ŘečOriya_CC_8OriyaOriya (v potrubí) nebo_INCall centrum60Data call-centra Oriya (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya_GCOriyaOriya (v potrubí) nebo_INObecná konverzace100Oriya (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya_MAOriyaOriya (v potrubí) nebo_INMédia Audio40Oriya (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPolish_MA_16polskýpolskýpl_PL16 kHzMédia Audio269Zvuk polských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 173 Muž 354 Neznámý 6
Řečpolské Polsko_SM_48Polština (Polsko)Polština (Polsko)pl-PL48 kHzSkriptovaný monolog1,482Polské Polsko – napsaný monologNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1324 Muž 701 Neznámý 24
ŘečPandžábština_CC_8pandžábskýpandžábština (in Pipeline) pandžábskýCall centrum60Data call-centra Punjabi (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPandžábština_GCpandžábskýpandžábština (in Pipeline) pandžábskýObecná konverzace100Údaje o obecné konverzaci v pandžábštině (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečPandžábština_MApandžábskýpandžábština (in Pipeline) pandžábský Média Audio40Punjabi (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečrusky_SM_48ruskýruskýru-RU48 kHzSkriptovaný monolog2,398Monolog s ruským scénářemNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1689 Muž 1937 Neznámý 214
ŘečScottish_GC_8skotština (anglický přízvuk)skotština (anglický přízvuk)en_AB8 kHzObecná konverzace292Data skotské obecné konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 285, muž 260, neznámý 3
ŘečSingapur_CC_8Singapurská angličtinaSingapurská angličtinacs_SG8 kHzCall centrum218Data call centra v SingapuruNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 2139, muž 884, neznámý 21
ŘečSingapur_MA_16Singapurská angličtinaSingapurská angličtinacs_SG16 kHzMédia Audio247Singapur Media audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 160, muž 455, neznámý 37
ŘečJihoafrická angličtina_CC_8Jihoafrická angličtinaJihoafrická angličtinaen_ZA8 kHzCall centrum261Data call-centra v jihoafrické angličtiněNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1274 , Muž 935 , Neznámý 1
ŘečJihoafrická republika English_MA_16Jihoafrická angličtinaJihoafrická angličtinaen_ZA16 kHzMédia Audio251Jihoafrická anglická mediální audio dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 235, muž 432, neznámý 36
Řečsvahilština_CC_8svahilštinasvahilštinasw_KE8 kHzCall centrum230Svahilská data call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 611, muž 833, neznámý 0
Řečsvahilština_MA_16svahilštinasvahilštinasw_KE16 kHzMédia Audio265Zvuková data svahilských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 118, muž 493, neznámý 25
Řečšvédština_CC_8švédskýšvédskýsv_SE8 kHzCall centrum250Údaje švédského call centraNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1581, muž 727, neznámý 2
Řečšvédština_MA_16švédskýšvédskýsv_SE16 kHzMédia Audio278Zvuková data švédských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 195, muž 500, neznámý 21
ŘečTamil_CC_8tamiltamilština (v potrubí) ta_INCall centrum60Data call-centra tamilštiny (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTamil_GCtamiltamilština (v potrubí) ta_INObecná konverzace100Tamilská (In Pipeline) data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTamil_MAtamil tamilština (v potrubí) ta_INMédia Audio40Tamilská (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_GC_8telugutelugute_IN8 kHzObecná konverzace553Údaje o obecné konverzaci v telugštiněNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 574, muž 564, neznámý 0
Řečtelugština_MA_16telugutelugute_IN16 kHzMédia Audio648Zvuková data Telugu MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 207, muž 963, neznámý 2
Řečtelugština_CC_8telugutelugština (v potrubí) te_INCall centrum30Data call-centra Telugu (In Pipeline).Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_GCtelugutelugština (v potrubí) te_INObecná konverzace50Telugu (In Pipeline) Data obecné konverzaceNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,Desktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugština_MAtelugutelugština (v potrubí) te_INMédia Audio20Telugu (In Pipeline) Mediální zvuková dataLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečThai_GC_8thaithaičt_TH8 kHzObecná konverzace183Thajská obecná konverzaceNeskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, Neformální registr používaný mezi přáteliDvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 338, muž 96, neznámý 8
ŘečThai_MA_8thaithaičt_TH16 kHzMédia Audio173Zvuk thajských médiíLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 143, muž 502, neznámý 26
ŘečTurecké Turecko_SM_48Turecké TureckoTurecké TureckoTR-TR48 kHzSkriptovaný monolog2,027Turecké TureckoNahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 1561 Muž 1241 Neznámý 31
ŘečVietnamština_GC_8VietnamecVietnamecvi_VN8 kHzObecná konverzace295Údaje o vietnamské obecné konverzaciNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5-15 minut, severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město).DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 400, muž 380, neznámí 2
ŘečVietnamese_MA_16VietnamecVietnamecvi_VN16 kHzMédia Audio257Zvuková data Vietnamese MediaLicencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoWeb Sourcing5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 249, muž 200, neznámí 45
ŘečWelsh_GC_8velština (anglický přízvuk)velština (anglický přízvuk)en_WL8 kHzObecná konverzace278Údaje o velšské obecné konverzaciNeskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníŽena 270, muž 324, neznámý 0
ŘečVelká Británie English_WW_16Britská angličtinaBritská angličtinaen_uk16 kHzWake Word200Wake Word UK angličtinaklíčové fráze sběr dat
  • 200 reproduktory
  • 4 unikátní klíčové fráze na reproduktor
  • 25-30 opakovaných nahrávek klíčových frází na jedinečnou klíčovou frázi
  • 25–30 zvukových souborů na jedinečnou klíčovou frázi
  • Celkem 120 nahraných promluv na řečníka
1 kanálMobile App5.0. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníPohlaví: 50 % muži, 50 % ženy, +/- 10 %.

Nabízené služby

Expertní sběr zvukových dat není pro komplexní nastavení umělé inteligence praktický. Ve společnosti Shaip můžete dokonce zvážit následující služby, díky nimž budou modely mnohem rozšířenější než obvykle:

Sběr textových dat

Sběr textových dat
Služby

Skutečnou hodnotou služeb sběru kognitivních dat Shaip je, že dává organizacím klíč k odemčení důležitých informací nacházejících se v nestrukturovaných datech

Sběr obrazových dat

Služby sběru obrazových dat

Zajistěte, aby váš model počítačového vidění přesně identifikoval každý obrázek, abyste mohli bezproblémově trénovat modely AI příští generace budoucnosti

Sběr video dat

Služby sběru video dat

Nyní se zaměřte na počítačové vidění spolu s NLP pro nácvik vašich modelů k dokonalé identifikaci objektů, jednotlivců, odstrašujících prostředků a dalších vizuálních prvků

Shaip Kontaktujte nás

Chcete si vytvořit vlastní zvukovou datovou sadu?

Spojte se s naším interním odborníkem na sběr dat řeči a nastavte audio úložiště, které nejlépe vyhovuje vašim požadavkům

  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.