Kannadská datová sada

ಕನ್ನಡ ಡೇಟಾಸೆಟ್

Vysoce kvalitní datová sada pro call centra v kannadštině, obecnou konverzaci, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Datová sada kannadského jazyka

Typy datových sad

Call centrum, obecná konverzace, mediální data, scénářový monolog

Země

Indie

Popis

Tato datová sada obsahuje neskriptované telefonické rozhovory mezi syntetickými agenty a zákazníky (5–15 minut), licencované veřejně dostupné zvukové nebo video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky (15–60 minut), a skriptované monology, kde jeden mluvčí poskytuje předdefinovaný obsah pro trénování a vyhodnocování řečových a jazykových modelů.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 59:57:02 494
Call Center 16 kHz Reproduktory 2 Mono 195:26:56 9,504
Obecná konverzace 8 kHz Reproduktory 2 Dvojí 141:27:15 424
Mediální data 16 kHz Více reproduktorů Mono 14:19:52 124
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 500:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.