Korejský datový soubor
한국어 데이터셋
Vysoce kvalitní korejská datová sada pro call centra, skriptované monology a média (podcasty) pro modely umělé inteligence a řeči
Přehled
Název (jazyk)
Datová sada korejského jazyka
Typy datových sad
Call centrum, mediální data, scénářový monolog
Země
Korea
Popis
Tato datová sada obsahuje neskriptované telefonické rozhovory mezi syntetickými agenty a zákazníky (5–15 minut), licencované veřejně dostupné audio/video soubory, jako jsou rozhovory a podcasty s 1 až 5 účastníky (15–60 minut), a skriptované monology s jedním mluvčím, v nichž jeden mluvčí přednáší předdefinovaný obsah pro trénování řečových a jazykových modelů.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Reproduktory 2 | Dvojí | 102:27:55 | 1,244 |
| Mediální data | 16 kHz | Více reproduktorů | Mono | 203:46:54 | 397 |
| Skriptovaný monolog | 24 kHz | Jeden reproduktor | Mono | 500:00:00 | Na vyžádání |
| Skriptovaný monolog | 48 kHz | Jeden reproduktor | Mono | 1,955:00:00 | Na vyžádání |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku