Korejský datový soubor

한국어 데이터셋

Vysoce kvalitní korejská datová sada pro call centra, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Datová sada korejského jazyka

Typy datových sad

Call centrum, mediální data, scénářový monolog

Země

Korea

Popis

Tato datová sada obsahuje neskriptované telefonické rozhovory mezi syntetickými agenty a zákazníky (5–15 minut), licencované veřejně dostupné audio/video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky (15–60 minut), a skriptované monology s jedním mluvčím, v nichž jeden mluvčí přednáší předdefinovaný obsah pro trénování řečových a jazykových modelů.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Call Center 8 kHz Reproduktory 2 Dvojí 102:27:55 1,244
Mediální data 16 kHz Více reproduktorů Mono 203:46:54 397
Skriptovaný monolog 24 kHz Jeden reproduktor Mono 500:00:00 Na vyžádání
Skriptovaný monolog 48 kHz Jeden reproduktor Mono 1,955:00:00 Na vyžádání

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Amazon
Google
Microsoft
Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.