Hindská datová sada

हिंदी डेटासेट

Vysoce kvalitní datová sada pro hindské call centra, obecnou konverzaci a podcasty pro modely AI a ASR

Přehled

Název (jazyk)

Datová sada hindštiny

Typy datových sad

Call centrum, Obecná konverzace, Média (Podcast), Scénářový monolog

Země

Indie

Popis

K dispozici jsou nepsané telefonické rozhovory mezi dvěma lidmi v délce 15 až 60 minut, spolu s licencovanými veřejně dostupnými audio nebo video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky ve stejném rozsahu. Kromě toho nahrávky jednotlivých výroků obvykle trvají 5 až 30 sekund a k dispozici jsou také naskriptované monology.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 70:45:51 Na vyžádání
Call Center 8 kHz Reproduktory 2 Mono 20,000:00:00 Na vyžádání
Call Center 16 kHz Reproduktory 2 Mono 29:17:20 261
Call Center 16 kHz Reproduktory 2 Dvojí 400:27:10 1200
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 47:48:40 224
Mediální data 16 kHz Více reproduktorů Mono 227:57:43 438
Skriptovaný monolog 48 kHz Jeden reproduktor Mono 2,866:00:00 3,988
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 29,000:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.