Tamilská datová sada

தமிழ் தரவுத்தொகுப்பு

Odemkněte sílu tamilských řečových datových sad pro ASR, TTS a konverzační umělou inteligenci. Shaip nabízí prémiové tamilské zvukové datové sady pro trénování chytřejších jazykových modelů.

Přehled

Název (jazyk)

Datová sada tamilského jazyka

Typy datových sad

Call centrum, obecná konverzace, mediální data, scénářový monolog

Země

Indie

Popis

Tato datová sada obsahuje nepsané syntetické konverzace mezi agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a mediální data s transkripcemi, která nabízejí rozmanitá řečová data pro trénování a hodnocení řečových a jazykových technologií.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 124:23:52 484
Call Center 16 kHz Reproduktory 2 Mono 199:44:21 1,986
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 101:42:05 440
Obecná konverzace 48 kHz Reproduktory 2 Mono 80:21:16 141
Mediální data 16 kHz Více reproduktorů Mono 43:07:01 32
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 500:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.