Telugský datový soubor
తెలుగు డేటాసెట్లు
Vysoce kvalitní datová sada pro telugské call centrum, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči
Přehled
Název (jazyk)
Datová sada jazyka Telgu
Typy datových sad
Call centrum, Obecná konverzace, Hudba, Scénářový monolog
Země
Indie
Popis
Tato datová sada obsahuje nepsané syntetické konverzace mezi agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a mediální data s transkripcemi, která nabízejí rozmanitá řečová data pro trénování a hodnocení řečových a jazykových technologií.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 62:32:27 | 496 |
| Obecná konverzace | 8 kHz | Reproduktory 2 | Dvojí | 654:08:03 | 1,601 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 666:24:29 | 1,230 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 1,700:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku