Maráthský datový soubor
मराठी डेटासेट
Vysoce kvalitní datová sada pro maráthské call centrum, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči
Přehled
Název (jazyk)
Maráthština jazyková datová sada
Typy datových sad
Call centrum, Obecná konverzace, Média (Podcast), Scénářový monolog
Země
Indie
Popis
Tato datová sada obsahuje neskriptované telefonické konverzace mezi syntetickými agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a zvukové záznamy zpěvu s transkripcemi, což poskytuje rozmanitá řečová data pro trénování a vyhodnocování řečových a jazykových technologií.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 70:28:58 | 634 |
| Obecná konverzace | 8 kHz | Reproduktory 2 | Dvojí | 159:21:13 | 298 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 24:09:24 | 94 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 3,900:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku