Nyní Get 50% SLEVA* na standardních datových sadách konverzační umělé inteligence

Datová sada řeči a zvuku pro chatboty, hlasové asistenty a zařízení s podporou řeči.

*Nabídka na omezenou dobu

  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.

Důvěryhodné od lídrů v oboru

DetailyStandardní jazyková datová sadaKonverzace v call centru 8 kHz*Obecné konverzace 8 kHz*Média a podcasty 16 kHz*Promluva/skriptovaný monolog 16 kHz*Celkový objem v hodináchDialekty pokrytyAudio FormatFormát přepisu textuPoužijte pouzdroZdrojCTA
ŘečafrikánštinaSoubor zvukových dat v afrikánštině6009001500Afrikánština mluvená v Africe. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečarabštinaArabská zvuková datová sada80015002300Arabština ze zemí Perského zálivu. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘeččínštinaČínská zvuková datová sada20002000Číňané z Číny. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečdánskýDánský zvukový soubor dat40060020003000Dán z Dánska. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečholandskýHolandský zvukový datový soubor20002000Holanďané z Nizozemí. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - AAVE AccentAngličtina - AAVE (Afroamerická lidová angličtina) Zvuková datová sada5005001000Lidová odrůda (někdy známá jako AAVE, kterou obvykle mluví velká většina Afroameričanů z dělnické a střední třídy) a standardnější odrůda (typicky jimiž mluví Afroameričané střední třídy ve formálních a veřejných situacích), ale se silnějším důrazem v lidovém jazyce.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - Boston/New York AccentAngličtina – Boston/New York Audio Dataset225225350800Toto je sbírka několika regionálních přízvuků, kterými se mluví ve městech Boston, New York a Philadelphia a jejich okolí. Tyto akcenty mohou znít podobně jako nemístní, ale liší se od ostatních amerických akcentů. Navzdory určité místní slovní zásobě, která se liší od jiných částí anglicky mluvícího světa, jsou tyto přízvuky vzájemně srozumitelné s angličtinou, kterou se mluví jinde.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - čínský přízvukAngličtina - čínská zvuková datová sada150300450Mluvčí, kteří mluví čínsky jako svůj první jazyk a kteří se přestěhovali/imigrovali do Spojených států jako teenageři/dospělí a naučili se angličtinu jako svůj druhý jazyk.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - Deep South AccentAngličtina - Deep South Audio Dataset2752754501000Řečníci z (i) Texasu; (ii) Severní Karolína, Jižní Karolína, Georgia; (iii) New Orleans; (iv) floridský pás; (v) Tennessee, Arkansas, Michigan.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - hispánský přízvukAngličtina – soubor zvukových dat s hispánským akcentem400400800Hispánskou angličtinou se rozumí druhy americké angličtiny, kterými mluví hispánští Američané různého národního dědictví. Hlavní důraz byl kladen na mexické Američany, mluvčí různého národního původu (např. Mexiko, Portoriko, Dominikánská republika, Ekvádor, Kuba atd.) a také z různých regionů (např. Kalifornie, New York, Florida). Zahrnuty byly mluvčí, kteří mluví španělsky jako prvním jazykem, stejně jako mluvčí hispánského původu, kteří mluví španělsky, je jazykem dědictví.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - Novozélandský přízvukAngličtina – Nový Zéland Audio Dataset2507501000Reproduktory na obou ostrovech, včetně mixu mladších reproduktorů (<40 let) a starších reproduktorů (>40 let) ve stejném poměru.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - Singapurský přízvukAngličtina - Singapurská audio datová sada4006001000Standardní singapurská angličtina i hovorová singapurská angličtina. Singapurci různého etnického původu (např. Číňané, Malajci, Indové atd.) a různé úrovně vzdělání.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - Jihoafrický přízvukAngličtina – Jižní Afrika Audio Dataset4006001000Zástupci z různých socioekonomických vrstev a etnologického prostředí (např. Jihoafričané evropského, afrického, indického nebo smíšeného původu).. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - irský přízvukAngličtina - irský zvukový datový soubor500500V Irsku se mluví anglicky. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - skotský přízvukAngličtina - skotský zvukový datový soubor800800Angličtina mluvená skotštinou. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAngličtina - velšský přízvukAngličtina – velšský zvukový datový soubor800800velšská angličtina. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečFrancouzský KanaďanFrancouzsko-kanadský zvukový datový soubor10001000Kanadské francouzštině. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečhebrejštinaHebrejský zvukový soubor dat7507501500Hebrejština v Izraeli. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečindonéskýIndonéská zvuková datová sada100010002000Indonéská bahasa. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečjaponskýJaponský zvukový datový soubor20002000Japonci z Japonska. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečkorejskýKorejský zvukový datový soubor10020015001800Řečníci se rozšířili po celé Jižní Koreji.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečmalajskyMalajský zvukový datový soubor5005001000Malajština v Malajsii. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečMexická španělštinaMexická španělská audio datová sada12501250Mexičan z Mexika. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečpolskýPolský zvukový datový soubor25020002250Polština z Polska. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečruskýRuský zvukový datový soubor20002000Rus z Ruska. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečsvahilštinaSvahilský zvukový datový soubor3506501000Jihoafrická a keňská svahilština. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečšvédskýŠvédská audio datová sada3506501000švédština ve Švédsku. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečTchajwanská čínštinaTchajwanská čínská audio datová sada10001000Číňané z Tchaj-wanu. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečthajštinaThajský zvukový soubor dat350450800Neformální registr používaný mezi přáteli,. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečtureckýTurecká audio datová sada20002000Turečtina z Turecka. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečVietnamecVietnamský zvukový datový soubor6004001000Severní (např. Hanoj), střední a jižní (např. Ho Či Minovo město).. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečhindštinaHindská zvuková datová sada80020002800Hindština v Indii konkrétně v severní, východní a západní oblasti. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečHinglishIndická anglická zvuková datová sada300500800Shromážděno z městských indických měst, která jsou finančními centry země kvůli rostoucím ekonomickým příležitostem. Taková místa mohou být Noida, Dillí, Dehradun, Chandigarh, Bombaj, Kalkata, Bangalore, Pune, Chennai, Hyderabad atd.. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečangličtinaAnglický zvukový datový soubor700700. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečkannadaKannadský zvukový datový soubor6010040200Kannada z Karnataky v Indii. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečmalabarštinaMalajálamská zvuková datová sada6010040200Malayalam z Keraly, Lakshadweep a Puducherry. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečOriyaOrijský zvukový datový soubor6010040200Oriya z částí Urísa, Západní Bengálsko, Jharkhand a Chhattisgarh. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečpandžábskýPaňdžábský zvukový datový soubor6010040200Pandžábština z Paňdžábu v Indii. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečtamilštinaTamil Audio Dataset60100240400Tamil z Tamil Nadu, Indie. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečtelugštinaTelugu Audio Dataset1009509502000Telugu z Andhra Pradesh, Indie. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečbengálskýBengálský zvukový soubor dat6010040200Bengálský ze Západního Bengálska, Indie. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečgujaratiGujarati Audio Dataset6010040200Gudžarátština z Gudžarátu, Indie. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečmaráthštinaMarathi Audio Dataset6010040200Marathi z Maháráštry v Indii. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip
ŘečAssameseAsámský zvukový datový soubor6010040200Assamese z Assam, Indie. Wav.JsonASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelováníSaip

Hluboká odbornost v konverzační AI

Konverzační umělá inteligence nebo chatboti nebo virtuální / digitální asistenti jsou jen tak chytří, jako technologie a data za nimi. Ve společnosti Shaip vám nabízíme širokou sadu diverzifikovaných zvukových datových souborů pro zpracování přirozeného jazyka (NLP), které napodobují konverzace se skutečnými lidmi, což vám umožní oživit vaši AI. Díky našemu hlubokému porozumění vám pomůžeme vytvořit a lokalizovat modely řeči s podporou umělé inteligence s maximální přesností díky bohatým a strukturovaným datovým sadám ve více jazycích z celého světa. Nabízíme vícejazyčné shromažďování zvuku, přepis zvuku a služby zvukových anotací na základě vašeho požadavku, přičemž plně přizpůsobíme požadovaný záměr, výroky a demografickou distribuci.

Skriptovaná sbírka řeči

Sbírka spontánní řeči

Přepis zvukových dat

Označování a anotace dat

Shaip vám umožňuje přesně trénovat vaši platformu konverzační umělé inteligence, aby mohla:

  • Bezproblémově mluvte, pište a chatujte na více kanálech.
  • Učte se ze stávajících interakcí ve formě chatu, hlasových přepisů, transakcí atd. a na základě těchto poznatků navrhujte a konverzujte.
  • Pochopte záměr lidské řeči a odstraňte nejednoznačnost v porozumění lidské řeči.
  • Komunikujte s vámi individuálně a lze je vycvičit k identifikaci uživatelů a zapamatování si minulých konverzací.

Světový lídr v oblasti konverzačních dat o školení AI

Hodiny zvukových dat ve více než 100 jazycích - zdrojové, přepisované a anotované

Licencování dat řeči

20k + hodiny dat řeči ve více než 40 jazycích a dialektech pokrývajících více než 55 témat z různých domén, tj. Call-centrum, debaty, obecné konverzace, řeči, podcasty atd.

Sběr dat řeči

Sbírejte zvuková a řečová data (monolog, konverzace pro 2 osoby, chat mezi lidmi) ve více než 100 jazycích z celého světa, přizpůsobených vašim požadavkům AI.

Přepis dat řeči

Nákladově efektivní přepis zvuku nebo zvukové poznámky prostřednictvím silné pracovní síly 30,000 XNUMX spolupracovníků se zaručenou TAT, přesností a úsporami

Zrychlete vývoj svých konverzačních aplikací AI pomocí služby Audio Collection & Audio Annotation Services

Výhoda Shaip

Měřítko

Můžeme na základě vašich požadavků získávat, škálovat a doručovat zvuková data z celého světa ve více jazycích a dialektech.

Odbornost

Máme správné znalosti týkající se přesného a nezaujatého sběru dat, přepisu a anotací podle zlatého standardu.

Síť

Síť 30,000 XNUMX+ kvalifikovaných přispěvatelů, kterým lze rychle přiřadit úkoly sběru dat k vytvoření modelu školení AI a rozšiřování služeb.

Technika

Máme plně založenou platformu založenou na AI s proprietárními nástroji a procesy, abychom mohli nepřetržitě využívat správu pracovního toku.

Hbitost

Velmi rychle se přizpůsobujeme změnám v požadavcích zákazníků a pomáháme urychlit vývoj AI s kvalitními řečovými daty 5–10krát rychleji než u konkurence.

Bezpečnost

Zabezpečení a soukromí dat přikládáme maximální důležitost a jsme také certifikováni pro zpracování vysoce regulovaných citlivých údajů.

Co umíme nejlépe

Údaje o školení

Získejte nejkvalitnější označená data za zlomek času. Je to zlatý standard, spolehlivé a připravené trénovat vaše modely AI a ML k dosažení nejvyšší úrovně výkonu.

Více informací

Sběr dat, označování a anotace

Se Shaipem získáte více než 15 let prověřené odborné znalosti v oblasti shromažďování, přepisu a anotací kvalitních dat. S naší globální pracovní silou můžeme shromažďovat data z celého světa a poté poskytovat služby označování a anotací s perfektní úrovní dovedností a odborných znalostí, které jsou pro vaše data zapotřebí.

Více informací

Datové katalogy a licence

S naším rozsáhlým inventářem milionů datových sad můžete shromažďovat a organizovat podle potřeby. Poté můžeme licencovat data o kvalitě pro vaše specifické požadavky na používání AI a ML. Navíc jsou tato data k dispozici za zlomek nákladů, pokud byste je vytvořili sami.

Více informací

Chcete si vytvořit vlastní datovou sadu?

Kontaktujte nás nyní a zjistěte, jak můžeme shromáždit vlastní sadu dat pro vaše jedinečné řešení AI.