Kannadská datová sada
ಕನ್ನಡ ಡೇಟಾಸೆಟ್
Vysoce kvalitní datová sada pro call centra v kannadštině, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči
Přehled
Název (jazyk)
Datová sada kannadského jazyka
Typy datových sad
Call centrum, obecná konverzace, mediální data, scénářový monolog
Země
Indie
Popis
Tato datová sada obsahuje neskriptované telefonické rozhovory mezi syntetickými agenty a zákazníky (5–15 minut), licencované veřejně dostupné zvukové nebo video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky (15–60 minut), a skriptované monology, kde jeden mluvčí poskytuje předdefinovaný obsah pro trénování a vyhodnocování řečových a jazykových modelů.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 59:57:02 | 494 |
| Call Center | 16 kHz | Reproduktory 2 | Mono | 195:26:56 | 9,504 |
| Obecná konverzace | 8 kHz | Reproduktory 2 | Dvojí | 141:27:15 | 424 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 14:19:52 | 124 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 500:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku