Konverzace o syntetické zdravotní péči pro ASR

Umožnění vývoje okolních technologií prostřednictvím rozhovorů o syntetické zdravotní péči

Ambientní technologie

Více než 2000 hodin zvukových dat shromážděných a přepsaných v klinickém prostředí

V rychle se vyvíjející doméně konverzační umělé inteligence je jedna z pozoruhodných aplikací v sektoru zdravotnictví, kde se technologie využívá k zefektivnění interakcí mezi poskytovatelem a pacientem. Náš klient, přední jméno ve zdravotnických technologiích, oslovil společnost Shaip s požadavkem vylepšit svůj model automatického rozpoznávání řeči (ASR) tak, aby lépe porozuměl a přepsal konverzace s více mluvčími v klinickém prostředí. Kvůli předpisům o ochraně soukromí bylo získávání dialogů v reálném světě náročné; myšlenkou tedy bylo vytvořit a přepsat syntetické, avšak realistické interakce mezi poskytovateli zdravotní péče a pacienty.

Hlasitost

2,000 hodiny, nebo přibližně 12,000 na 24,000 jednotlivé syntetické interakce 10 minut průměrnou dobu trvání.

Objektivní

Naším primárním cílem bylo vytvořit přibližně 2,000 12,000 hodin zvukových nahrávek, které převedou na 24,000 XNUMX až XNUMX XNUMX pečlivě vytvořených syntetických interakcí, ztělesňujících rozmanitost pohlaví, věku, přízvuků a lékařských rolí. Tento komplexní a autentický soubor dat, navržený tak, aby napodoboval skutečné klinické dialogy, byl vytvořen za přísného dodržování předpisů o ochraně osobních údajů, jako je HIPAA. Syntetické interakce sloužily jako bohatá datová sada, která byla nápomocná při školení a vylepšování modelu ASR našeho klienta, což výrazně zlepšilo jeho odbornost ve zvládání rozhovorů v reálném světě v rámci klinického prostředí.

 

Cíle

Výzvy

Soulad s předpisy

Zajištění dodržování zákonů na ochranu soukromí, jako je HIPAA, při vytváření realistických, ale syntetických interakcí v oblasti zdravotní péče může být náročné.

Dodržování předpisů

Autenticita a rozmanitost dat

Vytváření syntetických interakcí, které přesně napodobují klinické dialogy v reálném světě a zároveň zahrnují širokou škálu scénářů, akcentů, věku a lékařských rolí, vyžaduje pečlivý přístup a hluboké znalosti oboru.

Autenticita a rozmanitost dat

Quality Assurance

Dosažení vysoké úrovně přesnosti při přepisu, jako je například cílená 95% míra přesnosti slov (WER) a 90% míra přesnosti tagů (TER), vyžaduje přísné procesy zajištění kvality.

Technické schopnosti

Zajistit, aby technická infrastruktura, včetně záznamových a přepisovacích platforem, zvládla objem dat a udržela kvalitu, je významnou výzvou.

Nábor a školení zdrojů

Nábor jednotlivců se zdravotním vzděláním pro hraní rolí a zajištění toho, aby dodržovali realistické scénáře při zachování přirozeného toku konverzace, může být docela náročné. Kromě toho školení transkripčních pracovníků, aby dodržovali přísné pokyny pro kvalitu, vyžaduje značné úsilí a odborné znalosti.

Přístup/Řešení

Sběr a přepis zvuku

  • Vytvoření scénáře: Vyvinuté realistické scénáře odrážející běžné neurgentní stavy, se kterými se setkáváme v praxi rodinné medicíny pro dospělé, jako je hypertenze, diabetes a léčba bolesti.
  • Hraní rolí: Naverbujte jednotlivce s lékařským zázemím k hraní rolí jako poskytovatelé zdravotní péče a pacienti, dodržující poskytnuté scénáře a simulující klinické rozhovory v reálném světě.
  • Záznam: Využila mobilní aplikaci Shaip Work pro zachycení zvuku, což zajistilo různorodé zastoupení z hlediska pohlaví, věku, přízvuku a profesního původu mezi účastníky.

Validace a přepis

  • Provedené ověřovací skripty pro zajištění přesnosti a kvality zvukových souborů.
  • Přepisy byly prováděny na platformě Bhasha, dodržovaly konkrétní poskytnuté pokyny a zajišťovaly doslovný přepis textu s přesnou diarizí.
  • Anotovaná metadata včetně ID mluvčího, věku, pohlaví, rodného jazyka a lékařského školení/zkušenosti, která byla kritická pro účely modelového školení klienta.

Quality Assurance

  • Komplexní kontroly kvality prováděné CQA & PMO zajistily cíl kvality přepisu 95% míru přesnosti slov (WER) a 90% míru přesnosti tagů (TER).

Dodání dat

  • Strukturovali data jasným, organizovaným způsobem a dodávali je v dávkách spolu s podrobnými poznámkami o dávkách a adresáři kultur.
  • Zajistěte, aby všechna data, včetně zvukových souborů, přepisů a metadat, byla přesně označena a naformátována podle specifikací klienta.

Zpětná vazba a iterace

S klientem jsme vytvořili robustní zpětnovazební smyčku k identifikaci případných nedostatků, zajistili provedení oprav a dodání úplné a přesné datové sady.

Klíčové úspěchy

  • Úspěšný sběr a přepis 2000 hodin syntetických zdravotnických interakcí.
  • Rychlý a přesný přepis s pozoruhodnou mírou přesnosti, což významně přispívá k cíli klienta zlepšit jeho model ASR.
  • Prokázala schopnost společnosti Shaip zvládat rozsáhlé a složité projekty s pečlivým přístupem ke kvalitě a přesnosti.

Výsledek

Precizně provedený projekt podporovaný společností Shaip vyústil v bohatý soubor dat, který významně přispěl k vylepšení modelu ASR klienta. Syntetické interakce vytvořily realistickou reprezentaci klinických dialogů a pomohly klientovi dosáhnout robustnější a spolehlivější řečové služby pro zdravotnická prostředí. Prostřednictvím strukturovaného a dobře koordinovaného přístupu společnost Shaip zajistila úspěšné dodání komplexního projektu ve stanoveném časovém rámci a upevnila své odborné znalosti v oblasti řízení rozsáhlých konverzačních projektů umělé inteligence v oblasti zdravotnictví.

Naše spolupráce se společností Shaip výrazně pokročila v našem projektu v oblasti ambientní technologie a konverzační umělé inteligence v rámci zdravotnictví. Jejich odborné znalosti v oblasti vytváření a přepisu syntetických zdravotnických dialogů poskytly pevný základ a ukázaly potenciál syntetických dat při překonávání regulačních problémů. Se společností Shaip jsme tyto překážky překonali a jsme nyní o krok blíže k realizaci naší vize intuitivních řešení zdravotní péče.

Zlatá - 5 hvězdiček

Zrychlete svou AI ve zdravotnictví
vývoj aplikací o 100%