Čínská datová sada
简体中文数据集
Vysoce kvalitní čínská datová sada pro modely umělé inteligence a řeči
Přehled
Název (jazyk)
Čínská jazyková datová sada
Typy datových sad
Call centrum, hudba, scénář monologu, mediální data (data podcastů)
Země
Čína
Popis
Tato datová sada obsahuje neskriptované telefonické konverzace mezi syntetickými agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a zvukové záznamy zpěvu s transkripcemi, což poskytuje rozmanitá řečová data pro trénování a vyhodnocování řečových a jazykových technologií.
Použijte pouzdro
ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování
Podrobnosti souboru dat
| Jazyk | Typ datové sady | Sampling Rate | Mluvčí | Kanál | Celkem hodin | Celkový počet reproduktorů |
|---|---|---|---|---|---|---|
| Čínský zpěv | Hudba | 48 kHz | Jeden reproduktor | Mono | 06:11:32 | 10 |
| Čínština (tradiční) | Skriptovaný monolog | 48 kHz | Jeden reproduktor | Mono | 1,499:00:00 | 1,805 |
| Angličtina s čínským přízvukem | Mediální data | 16 kHz | Více reproduktorů | Mono | 306:04:58 | 2,130 |
| Zjednodušená čínština | Skriptovaný monolog | 48 kHz | Jeden reproduktor | Mono | 2,761:00:00 | 3,725 |
| Čínská angličtina s americkým přízvukem | Call Center | 8 kHz | Reproduktory 2 | Dvojí | 152:18:33 | 2,058 |
| Čínská angličtina s americkým přízvukem | Mediální data | 16 kHz | Více reproduktorů | Mono | 245:55:15 | 468 |
Vybraní klienti
Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové standardní datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku