Telugský datový soubor

తెలుగు డేటాసెట్‌లు

Vysoce kvalitní datová sada pro telugské call centrum, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Datová sada jazyka Telgu

Typy datových sad

Call centrum, Obecná konverzace, Hudba, Scénářový monolog

Země

Indie

Popis

Tato datová sada obsahuje nepsané syntetické konverzace mezi agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a mediální data s transkripcemi, která nabízejí rozmanitá řečová data pro trénování a hodnocení řečových a jazykových technologií.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 62:32:27 496
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 654:08:03 1,601
Mediální data 16 kHz Více reproduktorů Mono 666:24:29 1,230
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 1,700:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.