Maráthský datový soubor

मराठी डेटासेट

Vysoce kvalitní datová sada pro maráthské call centrum, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Maráthština jazyková datová sada

Typy datových sad

Call centrum, Obecná konverzace, Média (Podcast), Scénářový monolog

Země

Indie

Popis

Tato datová sada obsahuje neskriptované telefonické konverzace mezi syntetickými agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a zvukové záznamy zpěvu s transkripcemi, což poskytuje rozmanitá řečová data pro trénování a vyhodnocování řečových a jazykových technologií.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 70:28:58 634
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 159:21:13 298
Mediální data 16 kHz Více reproduktorů Mono 24:09:24 94
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 3,900:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.