Čínská datová sada

简体中文数据集

Vysoce kvalitní čínská datová sada pro modely umělé inteligence a řeči

Přehled

Název (jazyk)

Čínská jazyková datová sada

Typy datových sad

Call centrum, hudba, scénář monologu, mediální data (data podcastů)

Země

Čína

Popis

Tato datová sada obsahuje neskriptované telefonické konverzace mezi syntetickými agenty a zákazníky (5–15 minut), přirozené telefonické konverzace mezi lidmi (15–60 minut) a zvukové záznamy zpěvu s transkripcemi, což poskytuje rozmanitá řečová data pro trénování a vyhodnocování řečových a jazykových technologií.

Použijte pouzdro

ASR, virtuální asistent, chatbot, konverzační umělá inteligence, analýza řeči, TTS, jazykové modelování

Podrobnosti souboru dat

Jazyk Typ datové sady Sampling Rate Mluvčí Kanál Celkem hodin Celkový počet reproduktorů
Čínský zpěv Hudba 48 kHz Jeden reproduktor Mono 06:11:32 10
Čínština (tradiční) Skriptovaný monolog 48 kHz Jeden reproduktor Mono 1,499:00:00 1,805
Angličtina s čínským přízvukem Mediální data 16 kHz Více reproduktorů Mono 306:04:58 2,130
Zjednodušená čínština Skriptovaný monolog 48 kHz Jeden reproduktor Mono 2,761:00:00 3,725
Čínská angličtina s americkým přízvukem Call Center 8 kHz Reproduktory 2 Dvojí 152:18:33 2,058
Čínská angličtina s americkým přízvukem Mediální data 16 kHz Více reproduktorů Mono 245:55:15 468

Vybraní klienti

Posílení postavení týmů při vytváření špičkových produktů umělé inteligence na světě.

Shaip nás kontaktujte

Nenašli jste, co jste hledali?

Pro všechny typy dat se shromažďují nové standardní datové sady

Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat v oblasti audio/řečového tréninku

  • Toto pole je pro účely ověření, a která by měla zůstat nezměněna.
  • Registrací souhlasím se Shaipem Zásady ochrany osobních údajů si Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.