Tamilská datová sada
தமிழ் தரவுத்தொகுப்பு
Odemkněte sílu tamilských řečových datových sad pro ASR, TTS a konverzační umělou inteligenci. Shaip nabízí prémiové tamilské zvukové datové sady pro trénování chytřejších jazykových modelů.
Přehled
Název (jazyk)
Datová sada tamilského jazyka
Typy datových sad
Call centrum, obecná konverzace, mediální data, scénářový monolog
Země
Indie
Popis
Tato datová sada obsahuje nepsané syntetické konverzace mezi agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a mediální data s transkripcemi, která nabízejí rozmanitá řečová data pro trénování a hodnocení řečových a jazykových technologií.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 124:23:52 | 484 |
| Call Center | 16 kHz | Reproduktory 2 | Mono | 199:44:21 | 1,986 |
| Obecná konverzace | 8 kHz | Reproduktory 2 | Dvojí | 101:42:05 | 440 |
| Obecná konverzace | 48 kHz | Reproduktory 2 | Mono | 80:21:16 | 141 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 43:07:01 | 32 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 500:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku