Vlastní shromažďování řečových/audio dat pro chytré AI

Trénujte své modely NLP, VA, prototypy TTS a další pomocí kvalitních konverzačních dat s našimi službami shromažďování zvukových a řečových dat

Sběr zvukových dat

Objevte audio datové kanály bez překážek.

Vybraní klienti

Proč je pro zpracování přirozeného jazyka zapotřebí datová sada školení řeči?

Všimli jste si někdy interakce svého chytrého telefonu VA, tj. Siri, Bixby nebo čehokoli jiného? Způsob, jakým odpovídají na každou otázku a analyzují a prezentují výsledky podle vašich požadavků!

Jakkoli nás tyto VA fascinují, je třeba tyto inteligentní zdroje a programy postupně trénovat, aby byly schopny reagovat co nejpřesněji. To je důvod, proč byste měli uvažovat o outsourcingu sběru řeči/audia a hlasových dat specializovaným společnostem pro sběr dat s ověřením odborných znalostí.

Investice do shromažďování zvukových dat připraví vaše údajné NLP tak, aby uspokojilo vícejazyčné publikum. Nejen to, shromažďování dat řeči pro NLP, jak a kdy je zpracováváno odborníkem, dokonce bere v úvahu sběr dat v terénu, sémantickou analýzu a přepis zvuku. S profesionálními řešeními pro sběr dat řeči můžete:

  • Pořiďte si vysoce kvalitní zvukové datové sady pro zvýšení přesnosti
  • Zaměřte se na nastavení různých scénářů
  • Sbírejte vícejazyčná tréninková data AI
  • Přizpůsobte svůj model ML tak, aby vyhovoval různým demografickým skupinám a vertikálám

Profesionální služby shromažďování audio / hlasových dat pro NLP

Jakýkoli předmět. Jakýkoli scénář.

Inteligentní systémy NLP nejsou nic jiného než generické. V závislosti na funkčnosti programu se možná budete muset zaměřit na služby prostorových a vícejazyčných zvukových dat, které mohou nabízet pouze renomované společnosti pro sběr hlasových/zvukových dat. Zde Shaip vstupuje do schématu věcí jako vysoce spolehlivý poskytovatel služeb datového připojení, který je hrdý na to, že dělá těžkou práci pro vaše údajně inteligentní AI.

Ve společnosti Shaip se primárně zaměřujeme na podávání modelů s nejvyšším možným objemem vlastních ukázek řeči v co nejkratším čase. S námi na palubě můžete očekávat:

Sbírka řeči
  • Vytváření vybraných zvukových / hlasových dat pro NLP
  • Programy šité na míru, které reagují podle konkrétních případů použití
  • Připravuje se těžba zvukové datové sady
  • Automatizované zpracování dat specifické pro vzor
  • Nejvyšší možná úroveň specifičnosti domény
  • Rychlejší uvedení na trh díky zrychleným modelům AI

Naše odbornost

Zarovnejte zvuková data a připravte inteligentní modely NLP

Shaip nabízí služby sběru dat řeči/zvukových dat od konce do konce ve více než 100 jazycích, aby technologie podporující hlas mohly uspokojit různorodou skupinu publika na celém světě. Můžeme pracovat na projektech jakéhokoli rozsahu a velikosti; počínaje licencováním stávajících běžně dostupných zvukových datových sad, přes správu vlastního shromažďování zvukových dat až po zvukový přepis a poznámky. Bez ohledu na to, jak velký je váš projekt sběru dat řeči, můžeme služby sběru zvuku přizpůsobit tak, aby vyhovovaly vašim potřebám, a vytvářet tak vysoce kvalitní datové sady NLP, které cílí na dialekty, tóny a jazyky. Vyberte si z naší široké škály datových sad řeči a zdrojů shromažďování zvukových dat pro inteligentní nastavení podporující hlas.

Monologický projev

Monologická sbírka řeči

Zpracovávejte požadavky na řeč týkající se samostatného reproduktoru pro vaše prototypy Text-to-Speed ​​a požadavky specifické pro přepisy pomocí skriptovaného rychlého podávání prostřednictvím jednokanálových souborů.

Projev dialogu

Projev dialogu
Sbírka

Nastavte inteligentní virtuální asistenty, chatboty specifické pro rychlost a modely automatického rozpoznávání řeči s vícejazyčnou expozicí prostřednictvím dvoukanálových souborů a přepsaných zdrojů.

Akustická řeč

Akustická data
Sbírka

Můžeme profesionálně zaznamenávat zvuková data studiové kvality, ať už jde o restaurace, kanceláře nebo domácnosti nebo z různých prostředí a jazyků, prostřednictvím naší globální sítě spolupracovníků, přičemž pokrýváme širší akustický rozsah

Přirozený jazyk

Sbírka promluvy v přirozeném jazyce

Trénujte chytrá komerční nastavení, abyste identifikovali různě vyslovované zákaznické fráze s podobným významem, aby byly AI časově samostatnější

Digitální virtuální asistenti

Digitální / virtuální
Asistenti

Soustřeďte se na budování svého nadcházejícího virtuálního asistenta trénováním modelů s upozorněním na lidskou řeč, vícejazyčnou expozici, kontextovou analýzu a NLU.

Automatické rozpoznávání řeči

Automatické rozpoznávání řeči (ASR)

Zlepšete přesnost svých systémů automatického rozpoznávání řeči (ASR) tím, že budete mít přístup k nejmodernějším diverzifikovaným řečovým/audio datovým sadám z celé řady demografických skupin.

Přirozený jazyk

Vícejazyčná data školení řeči/zvuku

Naši vysoce kvalifikovaní jazykoví profesionálové po celém světě nabízejí vícejazyčná audio/řečová školení v různých jazycích a dialektech včetně arabštiny, dánštiny, čínštiny, afrikánštiny, Singapuru, Nového Zélandu, hebrejštiny, indonéštiny, irštiny, korejštiny, malajštiny, polštiny, skotštiny, švédštiny , francouzština, němčina, vietnamština, thajština, italština, španělština a další.

Digitální virtuální asistenti

Text na řeč
(TTS)

Chcete-li nabídnout lepší uživatelský zážitek s TTS, je zásadní vyvinout systém, aby zněl přirozeně. Sestavte si vícejazyčný model převodu textu na řeč (TTS) s pomocí naší globální pracovní síly, která vám pomůže shromažďovat data řeči ve více než 150 jazycích a dialektech, abyste vylepšili své modely umělé inteligence od ovládání v autě po chatboty a výuková řešení s vysokou kvalitní audio data.

Důvody, proč si vybrat Shaip jako svého partnera pro důvěryhodné sběr dat o řeči

Lidé

Lidé

Specializované a vyškolené týmy:

  • Více než 30,000 XNUMX spolupracovníků pro vytváření, označování a kontrolu dat
  • Tým pověřeného řízení projektů
  • Zkušený tým vývoje produktů
  • Tým získávání a přihlašování talentů
Proces

Proces

Nejvyšší účinnost procesu je zajištěna pomocí:

  • Robustní 6stupňový proces sigma-gate
  • Specializovaný tým 6 černých pásů Sigma - klíčoví vlastníci procesů a dodržování kvality
  • Neustálé zlepšování a zpětná vazba
Plošina

Plošina

Patentovaná platforma nabízí výhody:

  • Webová platforma typu end-to-end
  • Bezvadná kvalita
  • Rychlejší TAT
  • Bezproblémové doručení

Jazyk: Shromážděné zvukové datové sady

Běžné datové sady řeči / zvuku

DetailyJazyková datová sadaVzorkovací frekvenceTyp datové sadyCelkový počet hodin zvukuCelkový počet hodin řečiPopis datové sadyAudio ChannelNahrávací platformaMY JSME (%)Audio FormatFormát přepisuPoužijte pouzdroCTA
ŘečAfro-AmeričanAfroamerická lidová mluva8 kHzCall centrum214211Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAfro-AmeričanAfroamerická lidová mluva16 kHzMédia Audio159149Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečafrikánštinaafrikánština8 kHzObecná konverzace368404Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, afrikánština mluvená v AfriceDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečafrikánštinaafrikánština16 kHzMédia Audio658615Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečarabštinaarabština8 kHzObecná konverzace293297Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, arabština ze zemí Perského zálivuDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBostonBoston8 kHzCall centrum177175Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBostonBoston8 kHzObecná konverzace3232Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečBostonBoston16 kHzMédia Audio9393Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečČínština anglickyČínština anglicky8 kHzCall centrum169130Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečČínština anglickyČínština anglicky16 kHzMédia Audio249236Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečdánskýdánský8 kHzObecná konverzace372395Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečdánskýdánský16 kHzMédia Audio664603Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAngličtinaAngličtina16 kHzMédia Audio109Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAngličtina Deep SouthAngličtina Deep South8 kHzCall centrum151149Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAngličtina Deep SouthAngličtina Deep South8 kHzObecná konverzace5656Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAngličtina Deep SouthAngličtina Deep South16 kHzMédia Audio266248Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhebrejštinahebrejština8 kHzObecná konverzace399397Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, hebrejština v IzraeliDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhebrejštinahebrejština16 kHzMédia Audio427400Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečHinglishHinglish8 kHzCall centrum208185Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečHinglishHinglish16 kHzMédia Audio216219Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhispánská angličtinahispánská angličtina8 kHzCall centrum212209Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhispánská angličtinahispánská angličtina16 kHzMédia Audio155150Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečIndická angličtinaIndická angličtina16 kHzMédia Audio13787Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečindonéskýindonéský8 kHzObecná konverzace496598Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, bahasa indonéštinaDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečindonéskýindonéský16 kHzMédia Audio643610Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečirskýirský8 kHzObecná konverzace192180Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkorejskýkorejský8 kHzCall centrum107103Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkorejskýkorejský16 kHzMédia Audio204197Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmalajskymalajsky8 kHzObecná konverzace266302Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) – 15–60 minut, malajština v MalajsiiDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmalajskymalajsky16 kHzMédia Audio344305Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNovozélandská angličtina Novozélandská angličtina 8 kHzObecná konverzace148142Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNovozélandská angličtina Novozélandská angličtina 16 kHzMédia Audio400400Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNew York EnglishNew York English8 kHzCall centrum103103Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNew York EnglishNew York English8 kHzObecná konverzace107106Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNew York EnglishNew York English16 kHzMédia Audio140140Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečpolskýpolský16 kHzMédia Audio269255Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečskotskýskotský8 kHzObecná konverzace292267Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečSingapurská angličtinaSingapurská angličtina8 kHzCall centrum218194Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečSingapurská angličtinaSingapurská angličtina16 kHzMédia Audio247240Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečJihoafrická angličtinaJihoafrická angličtina8 kHzCall centrum261204Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečJihoafrická angličtinaJihoafrická angličtina16 kHzMédia Audio251245Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečšpanělskýšpanělský16 kHzMédia Audio32Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečsvahilštinasvahilština8 kHzCall centrum184165Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečsvahilštinasvahilština8 kHzCall centrum4644Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečsvahilštinasvahilština16 kHzMédia Audio203191Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečsvahilštinasvahilština16 kHzMédia Audio6258Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečšvédskýšvédský8 kHzCall centrum250224Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečšvédskýšvédský16 kHzMédia Audio278255Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugutelugu8 kHzObecná konverzace553582Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugutelugu16 kHzMédia Audio648599Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečthaithai8 kHzObecná konverzace183201Neskriptovaná telefonická konverzace mezi dvěma lidmi. Cca. Délka zvuku (rozsah) - 15-60 minut, Neformální registr používaný mezi přáteliDvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečthaithai16 kHzMédia Audio173167Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečVietnamecVietnamec8 kHzObecná konverzace295293Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5-15 minut, severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město).DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečVietnamecVietnamec16 kHzMédia Audio257248Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečvelšskývelšský8 kHzObecná konverzace278299Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečIndická angličtinaIndická angličtina8 kHzCall centrum200200Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,MonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugu telugu NACall centrum3030Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtamil tamil NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkannada kannada NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmalabarština malabarština NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečbengálský bengálský NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečgujarati gujarati NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmaráthština maráthština NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese Assamese NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya Oriya NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečpandžábský pandžábský NACall centrum6060Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugu telugu NAObecná konverzace5050Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtamil tamil NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkannada kannada NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmalabarština malabarština NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečbengálský bengálský NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečgujarati gujarati NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmaráthština maráthština NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese Assamese NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya Oriya NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečpandžábský pandžábský NAObecná konverzace100100Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,NADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtelugu telugu NAMédia Audio2020Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečtamil tamil NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkannada kannada NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmalabarština malabarština NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečbengálský bengálský NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečgujarati gujarati NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečmaráthština maráthština NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAssamese Assamese NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečOriya Oriya NAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečpandžábskýpandžábskýNAMédia Audio4040Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutNADesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečAngličtina USAAngličtina USA48 kHzSkriptovaný monolog54Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečŠpanělské ŠpanělskoŠpanělské Španělsko48 kHzSkriptovaný monolog108Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečMexičanMexičan48 kHzSkriptovaný monolog1,4921,228Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkanadskýkanadský48 kHzSkriptovaný monolog1,2221,049Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNizozemíNizozemí48 kHzSkriptovaný monolog1,2051,021Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečpolské Polskopolské Polsko48 kHzSkriptovaný monolog1,4821,266Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTurecké TureckoTurecké Turecko48 kHzSkriptovaný monolog2,0271,735Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečTradiční čínštinaTradiční čínština48 kHzSkriptovaný monolog1,028891Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečarabštinaarabština48 kHzSkriptovaný monolog1,9471,594Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečdánskýdánský48 kHzSkriptovaný monolog2,5792,041Nahrávky s jednou promluvou, které se obvykle pohybují v rozmezí 5 až 30 sekund, dánština z DánskaMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhindštinahindština8 kHzCall centrum122131Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhindštinahindština16 kHzMedia audio219202Licencovatelné veřejné audio/video soubory, jako jsou rozhovory, podcasty atd. – 1 až 5 osob. Cca. Délka zvuku (rozsah) 15-60 minutMonoDesktop5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečhindštinahindština48 kHzSkriptovaný monolog2,8672,105Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečjaponskýjaponský48 kHzSkriptovaný monolog2,3352,029Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečkorejskýkorejský48 kHzSkriptovaný monolog1,9551,548Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Řečruskýruský48 kHzSkriptovaný monolog2,3982,046Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečZjednodušená čínštinaZjednodušená čínština48 kHzSkriptovaný monolog2,7622,181Nahrávky s jedním výrokem, které mají tendenci spadnout do rozsahu 5 až 30 sekundMonoMobile App5. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
ŘečNěmecNěmec8 kHzCall centrum640Neskriptovaná, syntetická telefonická konverzace mezi „agentem“ a „zákazníkem“, Přibl. Délka zvuku (rozsah) 5–15 minut,DvojíDesktop. Wav.jsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Nabízené služby

Expertní sběr zvukových dat není pro komplexní nastavení umělé inteligence praktický. Ve společnosti Shaip můžete dokonce zvážit následující služby, díky nimž budou modely mnohem rozšířenější než obvykle:

Sběr textových dat

Sběr textových dat
Služby

Skutečnou hodnotou služeb sběru kognitivních dat Shaip je, že dává organizacím klíč k odemčení důležitých informací nacházejících se v nestrukturovaných datech

Sběr obrazových dat

Služby sběru obrazových dat

Zajistěte, aby váš model počítačového vidění přesně identifikoval každý obrázek, abyste mohli bezproblémově trénovat modely AI příští generace budoucnosti

Sběr video dat

Služby sběru video dat

Nyní se zaměřte na počítačové vidění spolu s NLP pro nácvik vašich modelů k dokonalé identifikaci objektů, jednotlivců, odstrašujících prostředků a dalších vizuálních prvků

Shaip Kontaktujte nás

Chcete si vytvořit vlastní zvukovou datovou sadu?

Spojte se s naším interním odborníkem na sběr dat řeči a nastavte audio úložiště, které nejlépe vyhovuje vašim požadavkům

  • Registrací souhlasím se Shaipem Ochrana osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.