Zlepšení onkologického výzkumu NLP
Přesnost onkologických dat: licencování, de-identifikace a anotace pro inovaci modelu NLP
Revoluce v péči o rakovinu se špičkovými technologiemi NLP
Klient, významný hráč ve zdravotnictví, požadoval pokročilé řešení NLP pro zpracování značného objemu onkologických lékařských záznamů. Jako součást stěžejní iniciativy pro zdokonalení onkologického výzkumu je prvořadá potřeba vyvážit podrobnou analýzu dat s přísnými standardy ochrany soukromí. Tato případová studie nastiňuje naše příspěvky ke zlepšení klientského výzkumného úsilí prostřednictvím vysoce věrných anotací dat, přísných postupů deidentifikace a aplikace technik zpracování přirozeného jazyka (NLP), to vše v rámci regulačního rámce poskytovaného HIPAA.
Hlasitost
Výzvy
Projekt vyžadoval jemné porozumění klinické dokumentaci, přesnou identifikaci lékařských entit a schopnost přesně aplikovat negační štítky, to vše v bezpečném rámci, který chrání soukromí pacientů podle předpisů HIPAA. Tato snaha vyžadovala nejen technickou odbornost při manipulaci s velkými objemy komplexních dat, ale také strategický přístup k začlenění zpětné vazby a udržení kvality ve všech fázích anotačního procesu.
Podrobný popis služeb
Kategorie | Popis |
Komplexní pokrytí klinických dat | Zahrnuje různé typy poznámek, nastavení péče a onkologické podoblasti, což zajišťuje robustní soubor dat odrážející různé klinické scénáře. |
Přísná deidentifikace | Zajištění, že všechny označené záznamy jsou zbaveny identifikace v souladu s metodou HIPAA Safe Harbor, což zajišťuje důvěru klienta v soukromí a bezpečnost dat. |
Pokyny pro anotace | Vytvoření a implementace standardních pokynů pro anotaci dat pro přípravu označených záznamů v souladu se standardy HIPAA. |
Pokročilé anotační strategie | Byla provedena manuální anotace 10,000 XNUMX stran onkologických záznamů s detailním zaměřením na identifikaci negačních stavů a dalších souvisejících informací v souladu se zavedenými směrnicemi. |
Přísné zajištění kvality | Dosáhněte specifikovaného standardu kvality uvedeného v pokynech |
Řešení
Náš přístup zahrnoval následující klíčové strategie:
Přizpůsobená kompilace onkologických datových souborů
Z rozsáhlého archivu více než 5 MN EHR byla extrahována pečlivě vybraná podmnožina dat zaměřená na řešení specializovaných požadavků klienta na onkologická data se zaměřením na genomické entity. Proces shromažďování zahrnoval vytvoření vyčerpávajícího seznamu nádorových markerů, genů, variant a stádií TNM, přičemž bylo použito vyhledávání klíčových slov k určení dokumentů hojně obsažených v těchto datech. Regulární výrazy byly použity k identifikaci řady genetických variací a stádií rakoviny. Tento přístup v kombinaci se širokým pokrytím dat zahrnujícím různé typy dokumentů, specializace, nastavení péče a data od více lékařů zajistil komplexní a relevantní onkologický datový soubor.
Přísná deidentifikace
Proces přísně dodržoval metodu bezpečného přístavu HIPAA pro deidentifikace, která zaručuje důvěru klienta v soukromí a bezpečnost dat. To zahrnuje odstranění všech chráněných zdravotních informací (PHI) a jejich nahrazení označenými zástupnými symboly, čímž se zachová užitečnost dat při současné ochraně důvěrnosti pacienta.
Deidentifikační proměnné
Kategorie | podkategorie |
Příjmení | Jméno pacienta, jméno lékaře, jméno praktického lékaře, jméno člena rodiny, název lékařského centra, název kliniky, název pečovatelského domu, název společnosti, název univerzity |
věk | |
Datum | Vzor data, vzor měsíc rok, vzor den měsíc, vzor den rok, den, měsíc, rok, sezóna |
KDE? | Země, stát, město, ulice, PSČ, číslo pokoje, číslo apartmá, číslo patra |
ID | Číslo sociálního pojištění, Číslo zdravotního záznamu, Číslo příjemce zdravotního plánu, Číslo účtu, Číslo certifikátu/Licenčního průkazu, Biometrické ID, ID záznamu, Přístupové číslo, Identifikační číslo vozidla, SPZ Identifikátory zařízení a sériové číslo |
Kontakt | Telefonní číslo, Faxové číslo, E-mailová adresa, Web URL, IP adresa |
Příklad:
Dne 25. září 2106, v 11:00, byl pan Harry Pace ve věku 90 let přijat do Forrest General Hospital k plánované operaci kyčle, kterou předtím konzultoval jeho lékař primární péče Dr. Jose Martin a zúčastnila se jí Kendra Reith, MUDr. Během svého pobytu byl v péči Mary Hu, NP, a Suzan Ray, RN, s R. Charlesem Melanconem, PA, byl také konzultován. Jeho operace, provedená ve stejný den jako přijetí, byla úspěšná bez hlášených komplikací. Po operaci byl pan Pace převezen do pokoje 202, patro 2, k zotavení. Jeho manželka Emma Paceová byla přítomna po celou dobu a byly jí poskytnuty všechny potřebné aktualizace. Během jeho krátkého pobytu byly jeho lékařské záznamy, včetně MRN MR99062619 a účtu KV000014764, zpracovány podle standardních protokolů pečovatelského domu Gracewood, jeho předchozího bydliště. Později téhož dne byl propuštěn do péče Oaklandské ambulance k další rekonvalescenci. V průběhu celého procesu byly všechny postupy dokumentovány a zabezpečeny s dodržením standardů důvěrnosti.
Příklad: De-identified
On [Vzor data], v 11:00 hodin, Mr. [Jméno pacienta], starý [Stáří], byl přijat do [Název lékařského centra] na plánovanou operaci kyčle, kterou předtím konzultoval jeho lékař primární péče Dr. [Jméno lékaře], a zúčastnil se [Jméno lékaře] MUDr. Během svého pobytu byl v péči [praktická sestra], NP a [praktická sestra], RN, s [Jméno lékaře], PA, je také konzultován. Jeho operace, provedená ve stejný den jako přijetí, byla úspěšná bez hlášených komplikací. Po operaci Mr. [Jméno pacienta] byla přemístěna do pokoje č. [Číslo pokoje], Patro č. [Číslo podlaží], pro zotavení. Jeho manželka [Jméno člena rodiny] byla přítomna a byly jí poskytnuty všechny potřebné aktualizace. Během jeho krátkého pobytu, jeho lékařské záznamy, včetně MRN [Číslo lékařského záznamu] a Účet [Číslo účtu], byly zpracovány podle standardních protokolů [Název pečovatelského domu], jeho předchozí bydliště. Později téhož dne byl propuštěn do péče [Název kliniky] pro další rekuperaci. V průběhu celého procesu byly všechny postupy dokumentovány a zabezpečeny s dodržením standardů důvěrnosti.
Pokyny pro poznámky a pokročilé techniky poznámek
Shaip byl nápomocný při vytváření a implementaci standardních pokynů pro anotaci dat, které zajistily, že všechny označené záznamy byly připraveny konzistentně a v souladu se standardy HIPAA. Kromě toho bylo pečlivě anotováno 10,000 XNUMX stran z různých lékařských záznamů se zaměřením na podrobné označení negačních stavů a dalších klinicky relevantních entit včetně různých onkologických podoborů. Anotace provedl tým odborných anotátorů se specializovanými znalostmi v oblasti onkologie a předpisů o ochraně osobních údajů.
Složitá anotační kritéria
Kategorie | podkategorie |
Datum anotace (onkologie) | Datum diagnózy, datum fáze, začátek, datum postupu, datum zahájení, datum ukončení, datum zahájení záření, datum ukončení záření |
Onemocnění (onkologie) | Problém rakoviny, histologie, klinický stav, místo těla, chování, stupeň, stadium rakoviny, stadium TNM, test nádorových markerů, rozměry, kód |
Léčba (onkologie) | Rakovinová medicína, Dávkování léků, Frekvence, Operace rakoviny, Výsledek operace, Radiační modalita, Dávkování záření |
Genomika | Variační kód, studovaný gen, metoda, vzorek |
negace | Negativní, Možné Negativní, Nejisté, Možné Pozitivní |
Klinický NER | Problém rakoviny – místo těla, histologie – místo těla, chování – místo těla, chirurgie rakoviny – vztahy místo těla, radiační modalita – místo těla, histologie – stupeň, problém rakoviny – dimenze |
Příklad:
Prohlášení o klinické poznámce onkologie
„Pacientce Jane Doeové byla 03. 05. 2023 diagnostikována nemalobuněčná rakovina plic (NSCLC) fáze IIIB, konkrétně adenokarcinom. Rakovina se nachází v pravém dolním laloku plic. Je klasifikován jako T3N2M0 podle stagingového systému TNM, s velikostí nádoru 5 cm x 3 cm. Delece exonu 19 EGFR byla identifikována pomocí PCR analýzy vzorku biopsie nádoru. Chemoterapie karboplatinou AUC 5 a pemetrexedem 500 mg/m² byla zahájena 03. 20. 2023 a má se podávat každé 3 týdny. Externí radiační terapie (EBRT) v dávce 60 Gy ve 30 frakcích zahájena 04. 01. 2023. Léčba pacienta pokračuje a na nedávné MRI nejsou žádné známky mozkových metastáz. Možnost lymfovaskulární invaze ještě nebyla stanovena a tolerance pacienta pro celý režim chemoterapie zůstává nejistá.
Prohlášení o klinické poznámce onkologie
Přísné zajištění kvality
Implementoval flexibilní rámec pro řízení projektů, který usnadnil efektivní integraci zpětné vazby od klientů při dodržování přísných standardů kvality. Byl prosazen komplexní protokol zajištění kvality, který je v souladu s pokyny pro dosažení požadovaných měřítek kvality. Tento protokol obsahoval po sobě jdoucí kola kontroly a ověřování, čímž byla zajištěna přesnost a spolehlivost anotovaných dat. Takový pečlivý dohled nad kvalitou je zásadní při vytváření spolehlivého řešení NLP, které je nezbytné pro informované klinické rozhodování a excelenci ve výzkumu.
Výsledek
Úspěšně dodáno 10,000 XNUMX vysoce kvalitních záznamů bez označení, které poskytují bezpečný a hodnotný soubor dat pro vývoj modelu NLP klienta. Pečlivá aplikace NLP a dodržování standardů pro deidentifikaci HIPAA vedly k vysoce propracovanému souboru dat, který podpoří pokračující a budoucí úsilí klienta v oblasti onkologického výzkumu, jehož cílem je v konečném důsledku zlepšit výsledky onkologických pacientů a efektivitu poskytování péče.
Úspěch projektu ilustruje naši schopnost zpracovávat složitá lékařská data s přesností, což přispívá k cíli klienta zlepšit výsledky péče o pacienty a urychlit tempo inovací ve zdravotnictví.
Naše partnerství se společností Shaip bylo zásadní pro rozvoj našich schopností NLP v oblasti onkologie. Profesionální zpracování 10,000 XNUMX lékařských záznamů, opatřených podrobnými negacemi a dalšími klinickými entitami, prokázalo jejich závazek k dokonalosti a dodržování předpisů. Navíc jejich závazek k dodržování standardů ochrany osobních údajů, jako je HIPAA, nám poskytl neocenitelné zdroje k tomu, abychom posouvali naše iniciativy umělé inteligence při vývoji nejmodernější onkologické léčby a diagnostiky.