Hindská datová sada
हिंदी डेटासेट
Vysoce kvalitní datová sada pro hindské call centra, obecnou konverzaci a podcasty pro modely AI a ASR
Přehled
Název (jazyk)
Datová sada hindštiny
Typy datových sad
Call centrum, Obecná konverzace, Média (Podcast), Scénářový monolog
Země
Indie
Popis
K dispozici jsou nepsané telefonické rozhovory mezi dvěma lidmi v délce 15 až 60 minut, spolu s licencovanými veřejně dostupnými audio nebo video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky ve stejném rozsahu. Kromě toho nahrávky jednotlivých výroků obvykle trvají 5 až 30 sekund a k dispozici jsou také naskriptované monology.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 70:45:51 | Na vyžádání |
| Call Center | 8 kHz | Reproduktory 2 | Mono | 20,000:00:00 | Na vyžádání |
| Call Center | 16 kHz | Reproduktory 2 | Mono | 29:17:20 | 261 |
| Call Center | 16 kHz | Reproduktory 2 | Dvojí | 400:27:10 | 1200 |
| Obecná konverzace | 8 kHz | Reproduktory 2 | Dvojí | 47:48:40 | 224 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 227:57:43 | 438 |
| Skriptovaný monolog | 48 kHz | Jeden reproduktor | Mono | 2,866:00:00 | 3,988 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 29,000:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku