Nejdůvěryhodnější služby sběru dat řeči pro vaši AI
Trénujte své modely NLP, VA, prototypy TTS a další pomocí kvalitních konverzačních dat s našimi službami shromažďování zvukových a řečových dat
Objevte audio datové kanály bez překážek.
Vybraní klienti
Proč je pro zpracování přirozeného jazyka zapotřebí datová sada školení řeči?
Všimli jste si někdy interakce svého chytrého telefonu VA, tj. Siri, Bixby nebo čehokoli jiného? Způsob, jakým odpovídají na každou otázku a analyzují a prezentují výsledky podle vašich požadavků!
Jakkoli nás tyto VA fascinují, je třeba tyto inteligentní zdroje a programy postupně trénovat, aby byly schopny reagovat co nejpřesněji. To je důvod, proč byste měli uvažovat o outsourcingu sběru řeči/audia a hlasových dat specializovaným společnostem pro sběr dat s ověřením odborných znalostí.
Investice do shromažďování zvukových dat připraví vaše údajné NLP tak, aby uspokojilo vícejazyčné publikum. Nejen to, shromažďování dat řeči pro NLP, jak a kdy je zpracováváno odborníkem, dokonce bere v úvahu sběr dat v terénu, sémantickou analýzu a přepis zvuku. S profesionálními řešeními pro sběr dat řeči můžete:
- Pořiďte si vysoce kvalitní zvukové datové sady pro zvýšení přesnosti
- Zaměřte se na nastavení různých scénářů
- Sbírejte vícejazyčná tréninková data AI
- Přizpůsobte svůj model ML tak, aby vyhovoval různým demografickým skupinám a vertikálám
Profesionální služby shromažďování audio / hlasových dat pro NLP
Jakýkoli předmět. Jakýkoli scénář.
Inteligentní systémy NLP nejsou nic jiného než generické. V závislosti na funkčnosti programu se možná budete muset zaměřit na služby prostorových a vícejazyčných zvukových dat, které mohou nabízet pouze renomované společnosti pro sběr hlasových/zvukových dat. Zde Shaip vstupuje do schématu věcí jako vysoce spolehlivý poskytovatel služeb datového připojení, který je hrdý na to, že dělá těžkou práci pro vaše údajně inteligentní AI.
Ve společnosti Shaip se primárně zaměřujeme na podávání modelů s nejvyšším možným objemem vlastních ukázek řeči v co nejkratším čase. S námi na palubě můžete očekávat:
- Vytváření vybraných zvukových / hlasových dat pro NLP
- Programy šité na míru, které reagují podle konkrétních případů použití
- Připravuje se těžba zvukové datové sady
- Automatizované zpracování dat specifické pro vzor
- Nejvyšší možná úroveň specifičnosti domény
- Rychlejší uvedení na trh díky zrychleným modelům AI
Naše odbornost
Zarovnejte zvuková data a připravte inteligentní modely NLP
Shaip nabízí služby sběru dat řeči/zvukových dat od konce do konce ve více než 100 jazycích, aby technologie podporující hlas mohly uspokojit různorodou skupinu publika na celém světě. Můžeme pracovat na projektech jakéhokoli rozsahu a velikosti; počínaje licencováním stávajících běžně dostupných zvukových datových sad, přes správu vlastního shromažďování zvukových dat až po zvukový přepis a poznámky. Bez ohledu na to, jak velký je váš projekt sběru dat řeči, můžeme služby sběru zvuku přizpůsobit tak, aby vyhovovaly vašim potřebám, a vytvářet tak vysoce kvalitní datové sady NLP, které cílí na dialekty, tóny a jazyky. Vyberte si z naší široké škály datových sad řeči a zdrojů shromažďování zvukových dat pro inteligentní nastavení podporující hlas.
Monologická sbírka řeči
Zpracovávejte požadavky na řeč týkající se samostatného reproduktoru pro vaše prototypy Text-to-Speed a požadavky specifické pro přepisy pomocí skriptovaného rychlého podávání prostřednictvím jednokanálových souborů.
Projev dialogu
Sbírka
Nastavte inteligentní virtuální asistenty, chatboty specifické pro rychlost a modely automatického rozpoznávání řeči s vícejazyčnou expozicí prostřednictvím dvoukanálových souborů a přepsaných zdrojů.
Akustická data
Sbírka
Můžeme profesionálně zaznamenávat zvuková data studiové kvality, ať už jde o restaurace, kanceláře nebo domácnosti nebo z různých prostředí a jazyků, prostřednictvím naší globální sítě spolupracovníků, přičemž pokrýváme širší akustický rozsah
Sbírka promluvy v přirozeném jazyce
Trénujte chytrá komerční nastavení, abyste identifikovali různě vyslovované zákaznické fráze s podobným významem, aby byly AI časově samostatnější
Digitální / virtuální
Asistenti
Soustřeďte se na budování svého nadcházejícího virtuálního asistenta trénováním modelů s upozorněním na lidskou řeč, vícejazyčnou expozici, kontextovou analýzu a NLU.
Automatické rozpoznávání řeči (ASR)
Zlepšete přesnost svých systémů automatického rozpoznávání řeči (ASR) tím, že budete mít přístup k nejmodernějším diverzifikovaným řečovým/audio datovým sadám z celé řady demografických skupin.
Vícejazyčná data školení řeči/zvuku
Naši vysoce kvalifikovaní jazykoví profesionálové po celém světě nabízejí vícejazyčná audio/řečová školení v různých jazycích a dialektech včetně arabštiny, dánštiny, čínštiny, afrikánštiny, Singapuru, Nového Zélandu, hebrejštiny, indonéštiny, irštiny, korejštiny, malajštiny, polštiny, skotštiny, švédštiny , francouzština, němčina, vietnamština, thajština, italština, španělština a další.
Text na řeč
(TTS)
Chcete-li nabídnout lepší uživatelský zážitek s TTS, je zásadní vyvinout systém, aby zněl přirozeně. Sestavte si vícejazyčný model převodu textu na řeč (TTS) s pomocí naší globální pracovní síly, která vám pomůže shromažďovat data řeči ve více než 150 jazycích a dialektech, abyste vylepšili své modely umělé inteligence od ovládání v autě po chatboty a výuková řešení s vysokou kvalitní audio data.
Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči
Lidé
Specializované a vyškolené týmy:
- Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
- Tým pověřeného řízení projektů
- Zkušený tým vývoje produktů
- Tým získávání a přihlašování talentů
Proces
Nejvyšší účinnost procesu je zajištěna pomocí:
- Robustní 6stupňový proces sigma-gate
- Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
- Neustálé zlepšování a zpětná vazba
Plošina
Patentovaná platforma nabízí výhody:
- Webová platforma typu end-to-end
- Bezvadná kvalita
- Rychlejší TAT
- Bezproblémové doručení
Lidé
Specializované a vyškolené týmy:
- Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
- Tým pověřeného řízení projektů
- Zkušený tým vývoje produktů
- Tým získávání a přihlašování talentů
Proces
Nejvyšší účinnost procesu je zajištěna pomocí:
- Robustní 6stupňový proces sigma-gate
- Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
- Neustálé zlepšování a zpětná vazba
Plošina
Patentovaná platforma nabízí výhody:
- Webová platforma typu end-to-end
- Bezvadná kvalita
- Rychlejší TAT
- Bezproblémové doručení
Jazyk: Shromážděné zvukové datové sady
Běžné datové sady řeči / zvuku
Detaily | Corpus ID (jedinečné) | Klíčové slovo | Jazyková datová sada | Kód jazyka | Vzorkovací frekvence | Typ datové sady | Celkový počet hodin zvuku | Stručný popis | Popis datové sady | Audio Channel | Nahrávací platforma | MY JSME (%) | Audio Format | Formát přepisu | Použijte pouzdro | Počet reproduktorů | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cs_US_CC_8 | Afroamerická lidová mluva | Afroamerická lidová mluva | cs | 8 kHz | Call centrum | 211 | Data call-centra afroamerické lidové řeči | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 612, muž: 1242 a neznámý: 12 | Kontakt | |
cs_US_MA_16 | Afroamerická lidová mluva | Afroamerická lidová mluva | cs | 16 kHz | Média Audio | 154 | Údaje o afroamerických lidových médiích | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 151, muž: 150 a neznámý: 10 | Kontakt | |
afrikánština_GC_8 | afrikánština | afrikánština | af_ZA | 8 kHz | Obecná konverzace | 368 | Údaje o obecné konverzaci v afrikánštině | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, afrikánština mluvená v Africe | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 502, muž: 390 a neznámý: 2 | Kontakt | |
afrikánština_MA_16 | afrikánština | afrikánština | af_ZA | 16 kHz | Média Audio | 658 | Africké mediální soubory | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 750, muž: 1278 a neznámý: 52 | Kontakt | |
Arabština_GC_8 | arabština | arabština | ar_AE | 8 kHz | Obecná konverzace | 292 | Údaje o obecné konverzaci v arabštině | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, arabština ze zemí Perského zálivu | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 171, muž: 534 a neznámý: 1 | Kontakt | |
Arabština_SM_48 | arabština | arabština | ar-SA | 48 kHz | Skriptovaný monolog | 1,947 | Arabsky napsaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 838 Muž 1209 Neznámý 78 | Kontakt | |
Assamese_CC_8 | Assamese | ásámština (v potrubí) | jako v | Call centrum | 60 | Data call-centra Assamese (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Assamese_GC | Assamese | ásámština (v potrubí) | jako v | Obecná konverzace | 100 | Assamese (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Assamese_MA | Assamese | ásámština (v potrubí) | jako v | Média Audio | 40 | Assamese (In Pipeline) Audio data médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Bengali_CC_8 | bengálský | bengálština (v potrubí) | bn_IN | Call centrum | 60 | Data call-centra v bengálštině (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Bengálsko_GC | bengálský | bengálština (v potrubí) | bn_IN | Obecná konverzace | 100 | Údaje o obecné konverzaci v bengálštině (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Bengálština_MA | bengálský | bengálština (v potrubí) | bn_IN | Média Audio | 40 | Bengálština (In Pipeline) Zvuková data médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Boston_CC_8 | bostonská angličtina | bostonská angličtina | cs | 8 kHz | Call centrum | 177 | Data bostonského call centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 605, muž: 711 a neznámý: 0 | Kontakt | |
Boston_GC_8 | bostonská angličtina | bostonská angličtina | cs | 8 kHz | Obecná konverzace | 32 | Boston General Conversation data | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 53, muž: 83 a neznámý: 0 | Kontakt | |
Boston_MA_16 | bostonská angličtina | bostonská angličtina | cs | 16 kHz | Média Audio | 93 | Zvuková data Boston Media | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 43, muž: 181 a neznámý: 2 | Kontakt | |
Canadian_SM_48 | Kanadské francouzštině | Kanadské francouzštině | fr-CA | 48 kHz | Skriptovaný monolog | 1,222 | Kanadské francouzštině | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 974 Muž 631 Neznámý 1 | Kontakt | |
Chinese_CC_8 | Čínština anglicky | Čínština anglicky | cs | 8 kHz | Call centrum | 169 | Čínská data call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 1790, muž: 523 a neznámý: 13 | Kontakt | |
Chinese_MA_16 | Čínština anglicky | Čínština anglicky | cs | 16 kHz | Média Audio | 249 | Zvuková data čínských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 126, muž: 346 a neznámý: 6 | Kontakt | |
Zjednodušená čínština_SM_48 | Zjednodušená čínština | Zjednodušená čínština | zh-CN | 48 kHz | Skriptovaný monolog | 2,762 | Zjednodušená čínština | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1920 Muž 1535 Neznámý 270 | Kontakt | |
Tradiční čínština_SM_48 | Tradiční čínština | Tradiční čínština | zh-TW | 48 kHz | Skriptovaný monolog | 1,028 | Tradiční čínština | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1069 Muž 262 Neznámý 3 | Kontakt | |
dánština_GC_8 | dánský | dánský | da_DK | 8 kHz | Obecná konverzace | 372 | Údaje o dánské obecné konverzaci | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 311, muž: 417, neznámý: 0 | Kontakt | |
dánština_MA_16 | dánský | dánský | da_DK | 16 kHz | Média Audio | 664 | Zvuková data dánských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena: 369, muž: 864, neznámý: 27 | Kontakt | |
dánština_SM_48 | dánský | dánský | da-DK | 48 kHz | Skriptovaný monolog | 2,579 | Dánský skriptovaný monolog | Nahrávky s jednou promluvou, které se obvykle pohybují v rozmezí 5 až 30 sekund, dánština z Dánska | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1551 Muž 1233 Neznámý 42 | Kontakt | |
English Deep South_CC_8 | Angličtina Deep South | Angličtina Deep South | cs | 8 kHz | Call centrum | 151 | Data call centra v angličtině Deep South | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 221 , Muž 1004 , Neznámý 7 | Kontakt | |
English Deep South_GC_8 | Angličtina Deep South | Angličtina Deep South | cs | 8 kHz | Obecná konverzace | 56 | Data obecné konverzace v angličtině Deep South | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 99, muž 31, neznámý 0 | Kontakt | |
English Deep South_MA_16 | Angličtina Deep South | Angličtina Deep South | cs | 16 kHz | Média Audio | 266 | Zvuková data Deep South Media | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 204, muž 356, neznámý 21 | Kontakt | |
Němčina_CC_8 | Němec | Němec | de-De | 8 kHz | Call centrum | 64 | Údaje německého call centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Mono | Desktop | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 478 Muž 1440 Neznámý 0 | Kontakt | ||
německy_IVR_8 | Němec | Němec | de-De | 8 kHz | IVR | 200 | Německá data IVR | Člověk ke stroji. Typ toku IVR, kde je výzva TTS (např. „Jak vám mohu pomoci“) následovaná spontánní lidskou reakcí | Mono | Desktop | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 10115 Muž 8750 Neznámý 0 | Kontakt | ||
Gudžarátština_CC_8 | gujarati | gudžarátština (v potrubí) | gu_IN | Call centrum | 60 | Data call-centra Gujarati (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Gudžarátština_GC | gujarati | gudžarátština (v potrubí) | gu_IN | Obecná konverzace | 100 | Gujarati (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Gudžarátština_MA | gujarati | gudžarátština (v potrubí) | gu_IN | Média Audio | 40 | Gujarati (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Hebrejština_Obecná konverzace_8 | hebrejština | hebrejština | on_IL | 8 kHz | Obecná konverzace | 399 | Údaje o hebrejské obecné konverzaci | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, hebrejština v Izraeli | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 414 , Muž 399 , Neznámý 1 | Kontakt | |
Hebrejština_MA_16 | hebrejština | hebrejština | on_IL | 16 kHz | Média Audio | 427 | Zvuková data hebrejských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 361, muž 513, neznámý 13 | Kontakt | |
Hindština_MA_16 | hindština | hindština | ahoj_IN | 16 kHz | Média Audio | 219 | Zvuková data Hindi Media | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 83, muž 309, neznámý 0 | Kontakt | |
Hindština_SM_48 | hindština | hindština | hi-IN | 48 kHz | Skriptovaný monolog | 2,867 | Hindsky napsaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1977 Muž 1864 Neznámý 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Call centrum | 208 | HINGLISH Data call centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 822, muž 1262, neznámý 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Média Audio | 216 | HINGLISH Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 75, muž 380, neznámý 0 | Kontakt | |
Hispanic_CC_8 | hispánská angličtina | hispánská angličtina | cs | 8 kHz | Call centrum | 212 | Data hispánského call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 822, muž 1262, neznámý 0 | Kontakt | |
Hispanic_MA_16 | hispánská angličtina | hispánská angličtina | cs | 16 kHz | Média Audio | 155 | Hispanic Call Media audio | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 140, muž 219, neznámý 5 | Kontakt | |
Indonéština_GC_8 | indonéský | indonéský | udělal jsem | 8 kHz | Obecná konverzace | 496 | Údaje z indonéské obecné konverzace | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, bahasa indonéština | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 524, muž 454, neznámý 2 | Kontakt | |
Indonéština_MA_16 | indonéský | indonéský | udělal jsem | 16 kHz | Média Audio | 643 | Zvuková data indonéských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 746, muž 1507, neznámý 129 | Kontakt | |
Irish_GC_8 | irský | irský | en_IE | 8 kHz | Obecná konverzace | 192 | Údaje o obecné konverzaci v Irsku | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 213 , Muž 153 , Neznámý 0 | Kontakt | |
japonština_SM_48 | japonský | japonský | ja-JP | 48 kHz | Skriptovaný monolog | 2,335 | Japonský skriptovaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1460 Muž 1221 Neznámý 194 | Kontakt | |
Kannada_CC_8 | kannada | Kannada (in Pipeline) | kn_IN | Call centrum | 60 | Data call-centra Kannada (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Kannada_GC | kannada | Kannada (in Pipeline) | kn_IN | Obecná konverzace | 100 | Kannada (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Kannada_MA | kannada | Kannada (in Pipeline) | kn_IN | Média Audio | 40 | Kannada (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Korean_CC_8 | korejský | korejský | ko_KR | 8 kHz | Call centrum | 107 | Korejská data call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1086, muž 210, neznámý 4 | Kontakt | |
Korean_MA_16 | korejský | korejský | ko_KR | 16 kHz | Média Audio | 204 | Korejská mediální audio data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 70 Muž 303, neznámý 25 | Kontakt | |
Korean_SM_48 | korejský | korejský | ko-KR | 48 kHz | Skriptovaný monolog | 1,955 | Korejský skriptovaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1195 Muž 1134 Neznámý 122 | Kontakt | |
Malay_GC_8 | malajsky | malajsky | ms_MY | 8 kHz | Obecná konverzace | 266 | Malajská data obecné konverzace | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, malajština v Malajsii | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 316, muž 176, neznámý 0 | Kontakt | |
Malay_MA_16 | malajsky | malajsky | ms_MY | 16 kHz | Média Audio | 344 | Malay Media audio data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 236, muž 626, neznámý 47 | Kontakt | |
malajálamština_CC_8 | malabarština | malajálamština (v potrubí) | ml_IN | Call centrum | 60 | Data call-centra Malayalam (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Malayalam_GC | malabarština | malajálamština (v potrubí) | ml_IN | Obecná konverzace | 100 | Malajálamština (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Malayalam_MA | malabarština | malajálamština (v potrubí) | ml_IN | Média Audio | 40 | Malajálamština (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Maráthština_CC_8 | maráthština | maráthština (v potrubí) | pan_IN | Call centrum | 60 | Data call-centra Marathi (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Marathi_GC | maráthština | maráthština (v potrubí) | pan_IN | Obecná konverzace | 100 | Data obecné konverzace v maráthštině (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Marathi_MA | maráthština | maráthština (v potrubí) | pan_IN | Média Audio | 40 | Maráthština (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Mexican_SM_48 | Španělština (Mexiko) | Španělština (Mexiko) | es-MX | 48 kHz | Skriptovaný monolog | 1,492 | Mexický španělský skriptovaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1016 Muž 1069 Neznámý 95 | Kontakt | |
Nizozemsko_SM_48 | holandský | holandský | nl-NL | 48 kHz | Skriptovaný monolog | 1,205 | Nizozemský skriptovaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1285 Muž 531 Neznámý 3 | Kontakt | |
New York English_CC_8 | New York English | New York English | cs | 8 kHz | Call centrum | 103 | Data call centra v New Yorku v angličtině | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 610, muž 532, neznámý 0 | Kontakt | |
New York English_GC_8 | New York English | New York English | cs | 8 kHz | Obecná konverzace | 107 | Data obecné konverzace v New Yorku v angličtině | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 118, muž 114, neznámý 0 | Kontakt | |
New York English_MA_16 | New York English | New York English | cs | 16 kHz | Média Audio | 140 | New York English Media audio data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 66, muž 230, neznámý 11 | Kontakt | |
Nový Zéland_GC_8 | Novozélandská angličtina | Novozélandská angličtina | en_NZ | 8 kHz | Obecná konverzace | 148 | Údaje o obecné konverzaci v novozélandské angličtině | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 167, muž 121, neznámý 4 | Kontakt | |
Nový Zéland_MA_16 | Novozélandská angličtina | Novozélandská angličtina | en_NZ | 16 kHz | Média Audio | 400 | Nový Zéland English Media audio | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 367, muž 678, neznámý 26 | Kontakt | |
Oriya_CC_8 | Oriya | Oriya (v potrubí) | nebo_IN | Call centrum | 60 | Data call-centra Oriya (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Oriya_GC | Oriya | Oriya (v potrubí) | nebo_IN | Obecná konverzace | 100 | Oriya (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Oriya_MA | Oriya | Oriya (v potrubí) | nebo_IN | Média Audio | 40 | Oriya (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Polish_MA_16 | polský | polský | pl_PL | 16 kHz | Média Audio | 269 | Zvuk polských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 173 Muž 354 Neznámý 6 | Kontakt | |
polské Polsko_SM_48 | Polština (Polsko) | Polština (Polsko) | pl-PL | 48 kHz | Skriptovaný monolog | 1,482 | Polské Polsko – napsaný monolog | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1324 Muž 701 Neznámý 24 | Kontakt | |
Pandžábština_CC_8 | pandžábský | pandžábština (in Pipeline) | pandžábský | Call centrum | 60 | Data call-centra Punjabi (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Pandžábština_GC | pandžábský | pandžábština (in Pipeline) | pandžábský | Obecná konverzace | 100 | Údaje o obecné konverzaci v pandžábštině (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Pandžábština_MA | pandžábský | pandžábština (in Pipeline) | pandžábský | Média Audio | 40 | Punjabi (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
rusky_SM_48 | ruský | ruský | ru-RU | 48 kHz | Skriptovaný monolog | 2,398 | Monolog s ruským scénářem | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1689 Muž 1937 Neznámý 214 | Kontakt | |
Scottish_GC_8 | skotština (anglický přízvuk) | skotština (anglický přízvuk) | en_AB | 8 kHz | Obecná konverzace | 292 | Data skotské obecné konverzace | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 285, muž 260, neznámý 3 | Kontakt | |
Singapur_CC_8 | Singapurská angličtina | Singapurská angličtina | cs_SG | 8 kHz | Call centrum | 218 | Data singapurského call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 2139, muž 884, neznámý 21 | Kontakt | |
Singapur_MA_16 | Singapurská angličtina | Singapurská angličtina | cs_SG | 16 kHz | Média Audio | 247 | Singapur Media audio data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 160, muž 455, neznámý 37 | Kontakt | |
Jihoafrická angličtina_CC_8 | Jihoafrická angličtina | Jihoafrická angličtina | en_ZA | 8 kHz | Call centrum | 261 | Data call-centra v jihoafrické angličtině | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1274 , Muž 935 , Neznámý 1 | Kontakt | |
Jihoafrická republika English_MA_16 | Jihoafrická angličtina | Jihoafrická angličtina | en_ZA | 16 kHz | Média Audio | 251 | Jihoafrická anglická mediální audio data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 235, muž 432, neznámý 36 | Kontakt | |
svahilština_CC_8 | svahilština | svahilština | sw_KE | 8 kHz | Call centrum | 230 | Údaje svahilského call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 611, muž 833, neznámý 0 | Kontakt | |
svahilština_MA_16 | svahilština | svahilština | sw_KE | 16 kHz | Média Audio | 265 | Zvuková data svahilských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 118, muž 493, neznámý 25 | Kontakt | |
švédština_CC_8 | švédský | švédský | sv_SE | 8 kHz | Call centrum | 250 | Údaje švédského call-centra | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1581, muž 727, neznámý 2 | Kontakt | |
švédština_MA_16 | švédský | švédský | sv_SE | 16 kHz | Média Audio | 278 | Zvuková data švédských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 195, muž 500, neznámý 21 | Kontakt | |
Tamil_CC_8 | tamilština | tamilština (v potrubí) | ta_IN | Call centrum | 60 | Data call-centra tamilštiny (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Tamil_GC | tamilština | tamilština (v potrubí) | ta_IN | Obecná konverzace | 100 | Tamilská (In Pipeline) data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Tamil_MA | tamilština | tamilština (v potrubí) | ta_IN | Média Audio | 40 | Tamilská (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
telugština_GC_8 | telugština | telugština | te_IN | 8 kHz | Obecná konverzace | 553 | Údaje o obecné konverzaci v telugštině | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 574, muž 564, neznámý 0 | Kontakt | |
telugština_MA_16 | telugština | telugština | te_IN | 16 kHz | Média Audio | 648 | Zvuková data Telugu Media | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 207, muž 963, neznámý 2 | Kontakt | |
telugština_CC_8 | telugština | telugština (v potrubí) | te_IN | Call centrum | 30 | Data call-centra Telugu (In Pipeline). | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
telugština_GC | telugština | telugština (v potrubí) | te_IN | Obecná konverzace | 50 | Telugu (In Pipeline) Data obecné konverzace | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
telugština_MA | telugština | telugština (v potrubí) | te_IN | Média Audio | 20 | Telugu (In Pipeline) Mediální zvuková data | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Kontakt | ||||
Thai_GC_8 | thajština | thajština | čt_TH | 8 kHz | Obecná konverzace | 183 | Thajská obecná konverzace | Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, Neformální registr používaný mezi přáteli | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 338, muž 96, neznámý 8 | Kontakt | |
Thai_MA_8 | thajština | thajština | čt_TH | 16 kHz | Média Audio | 173 | Zvuk thajských médií | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 143, muž 502, neznámý 26 | Kontakt | |
Turecké Turecko_SM_48 | Turecké Turecko | Turecké Turecko | TR-TR | 48 kHz | Skriptovaný monolog | 2,027 | Turecké Turecko | Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekund | Mono | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 1561 Muž 1241 Neznámý 31 | Kontakt | |
Vietnamština_GC_8 | Vietnamec | Vietnamec | vi_VN | 8 kHz | Obecná konverzace | 295 | Údaje o vietnamské obecné konverzaci | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5-15 minut, severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město). | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 400, muž 380, neznámí 2 | Kontakt | |
Vietnamese_MA_16 | Vietnamec | Vietnamec | vi_VN | 16 kHz | Média Audio | 257 | Zvuková data Vietnamese Media | Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minut | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 249, muž 200, neznámí 45 | Kontakt | |
Welsh_GC_8 | velština (anglický přízvuk) | velština (anglický přízvuk) | en_WL | 8 kHz | Obecná konverzace | 278 | Údaje o velšské obecné konverzaci | Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut, | Dvojí | Desktop | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Žena 270, muž 324, neznámý 0 | Kontakt | |
Velká Británie English_WW_16 | Britská angličtina | Britská angličtina | en_uk | 16 kHz | Wake Word | Reproduktory 200 | Wake Word UK angličtina | klíčové fráze sběr dat
| 1 kanál | Mobile App | 5.0 | . Wav | .json | ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování | Pohlaví: 50 % muži, 50 % ženy, +/- 10 %. | Kontakt |
Nabízené služby
Expertní sběr zvukových dat není pro komplexní nastavení umělé inteligence praktický. Ve společnosti Shaip můžete dokonce zvážit následující služby, díky nimž budou modely mnohem rozšířenější než obvykle:
Sběr textových dat
Služby
Skutečnou hodnotou služeb sběru kognitivních dat Shaip je, že dává organizacím klíč k odemčení důležitých informací nacházejících se v nestrukturovaných datech
Služby sběru obrazových dat
Zajistěte, aby váš model počítačového vidění přesně identifikoval každý obrázek, abyste mohli bezproblémově trénovat modely AI příští generace budoucnosti
Služby sběru video dat
Nyní se zaměřte na počítačové vidění spolu s NLP pro nácvik vašich modelů k dokonalé identifikaci objektů, jednotlivců, odstrašujících prostředků a dalších vizuálních prvků
Doporučené zdroje
Nabízí
Zvuková anotace pro inteligentní AI
Zvukové anotační služby jsou silnou stránkou Shaip od počátku. Vyvíjejte, trénujte a vylepšujte konverzační umělou inteligenci, chatboty a nástroje pro rozpoznávání řeči pomocí našich nejmodernějších služeb zvukových poznámek.
Průvodce kupujícím
Průvodce kupujícího: Kompletní průvodce konverzační umělou inteligencí
Chatbot, se kterým jste mluvili, běží na pokročilém konverzačním systému umělé inteligence, který je trénovaný, testovaný a vytvořený pomocí spousty datových sad pro rozpoznávání řeči.
Katalog dat
Běžný katalog dat řeči a licencování
V projektech AI existuje široká škála běžných aplikací pro data řeči. Nabízíme vám obrovské množství vysoce kvalitních dat připravených pro vaše rozpoznávání hlasu.
Chcete si vytvořit vlastní zvukovou datovou sadu?
Spojte se s naším interním odborníkem na sběr dat řeči a nastavte audio úložiště, které nejlépe vyhovuje vašim požadavkům
Často kladené otázky (FAQ)
Sběr dat řeči pro model ML se týká procesu shromažďování zvukových nahrávek mluveného jazyka. Tato kolekce pomáhá při trénování a zdokonalování algoritmů strojového učení, zejména těch, které jsou zaměřeny na porozumění a zpracování lidských hlasů.
Při shromažďování zvukových dat pro automatické rozpoznávání řeči (ASR) byste měli začít definováním specifických potřeb vašeho projektu, včetně požadovaného jazyka, přízvuku a typu řeči. Po nastavení těchto parametrů se ujistěte, že získáte všechna potřebná oprávnění k respektování soukromí uživatele. Poté použijte vhodná záznamová zařízení nebo software k zachycení čistých zvukových vzorků. Každá nahrávka by měla být pečlivě anotována svým přepisem nebo jinými relevantními metadaty a měla by být systematicky uložena pro snadný přístup.
Datová sada řeči ve strojovém učení je klíčová pro trénování, testování a ověřování modelů přizpůsobených k rozpoznání, přepisu nebo interpretaci mluveného jazyka. Takové datové sady dláždí cestu pro nesčetné množství aplikací, od hlasových asistentů a přepisovacích služeb až po hlasovou biometrii.
Pro shromažďování přesných dat z různých jazyků a přízvuků je nezbytná spolupráce s rodilými mluvčími požadovaného jazykového zázemí. Zaměřte se na pestrý a reprezentativní vzorek, který pokryje široké spektrum demografických nuancí. Používejte standardizované nahrávací zařízení v jednotných prostředích, abyste zajistili konzistenci zvuku. A co je důležité, označte každý datový kus podrobnými přepisy a metadaty, označujícími konkrétní jazyk a přízvuk.