Gudžarátská datová sada

ગુજરાતી ડેટાસેટ

Vysoce kvalitní gudžarátské call-centrum, obecná konverzace a datová sada podcastů pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Gudžarátština jazyková datová sada

Typy datových sad

Call centrum, obecná konverzace, mediální data (data podcastů)

Země

Indie

Popis

K dispozici jsou nepsané, syntetické telefonické rozhovory mezi agentem a zákazníkem v délce 5 až 15 minut, zatímco licencované veřejně dostupné audio nebo video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky, obvykle trvají 15 až 60 minut.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 54:22:40 410
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 149:15:19 308
Mediální data 16 kHz Více reproduktorů Mono 26:04:30 102

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.