Zlepšení onkologického výzkumu NLP

Přesnost onkologických dat: licencování, de-identifikace a anotace pro inovaci modelu NLP

Onkologie nlp

Revoluce v péči o rakovinu se špičkovými technologiemi NLP

Klient, významný hráč ve zdravotnictví, požadoval pokročilé řešení NLP pro zpracování značného objemu onkologických lékařských záznamů. Jako součást stěžejní iniciativy pro zdokonalení onkologického výzkumu je prvořadá potřeba vyvážit podrobnou analýzu dat s přísnými standardy ochrany soukromí. Tato případová studie nastiňuje naše příspěvky ke zlepšení klientského výzkumného úsilí prostřednictvím vysoce věrných anotací dat, přísných postupů deidentifikace a aplikace technik zpracování přirozeného jazyka (NLP), to vše v rámci regulačního rámce poskytovaného HIPAA.

Hlasitost

Licencování dat + Data De-id
10 stránky
Onkologické vztahy
10 stránky
Neonkologická doména
10 stránky
negace
10 stránky
Onkologická doména
10 stránky
NER + mapování vztahů
10 stránky

Výzvy

Projekt vyžadoval jemné porozumění klinické dokumentaci, přesnou identifikaci lékařských entit a schopnost přesně aplikovat negační štítky, to vše v bezpečném rámci, který chrání soukromí pacientů podle předpisů HIPAA. Tato snaha vyžadovala nejen technickou odbornost při manipulaci s velkými objemy komplexních dat, ale také strategický přístup k začlenění zpětné vazby a udržení kvality ve všech fázích anotačního procesu.

Cíle

Podrobný popis služeb

KategoriePopis
Komplexní pokrytí klinických datZahrnuje různé typy poznámek, nastavení péče a onkologické podoblasti, což zajišťuje robustní soubor dat odrážející různé klinické scénáře.
Přísná deidentifikaceZajištění, že všechny označené záznamy jsou zbaveny identifikace v souladu s metodou HIPAA Safe Harbor, což zajišťuje důvěru klienta v soukromí a bezpečnost dat.
Pokyny pro anotaceVytvoření a implementace standardních pokynů pro anotaci dat pro přípravu označených záznamů v souladu se standardy HIPAA.
Pokročilé anotační strategieByla provedena manuální anotace 10,000 XNUMX stran onkologických záznamů s detailním zaměřením na identifikaci negačních stavů a ​​dalších souvisejících informací v souladu se zavedenými směrnicemi.
Přísné zajištění kvalityDosáhněte specifikovaného standardu kvality uvedeného v pokynech

Řešení

Náš přístup zahrnoval následující klíčové strategie:

Přizpůsobená kompilace onkologických datových souborů

Z rozsáhlého archivu více než 5 MN EHR byla extrahována pečlivě vybraná podmnožina dat zaměřená na řešení specializovaných požadavků klienta na onkologická data se zaměřením na genomické entity. Proces shromažďování zahrnoval vytvoření vyčerpávajícího seznamu nádorových markerů, genů, variant a stádií TNM, přičemž bylo použito vyhledávání klíčových slov k určení dokumentů hojně obsažených v těchto datech. Regulární výrazy byly použity k identifikaci řady genetických variací a stádií rakoviny. Tento přístup v kombinaci se širokým pokrytím dat zahrnujícím různé typy dokumentů, specializace, nastavení péče a data od více lékařů zajistil komplexní a relevantní onkologický datový soubor.

Kompilace onkologických datových souborů

Přísná deidentifikace

Proces přísně dodržoval metodu bezpečného přístavu HIPAA pro deidentifikace, která zaručuje důvěru klienta v soukromí a bezpečnost dat. To zahrnuje odstranění všech chráněných zdravotních informací (PHI) a jejich nahrazení označenými zástupnými symboly, čímž se zachová užitečnost dat při současné ochraně důvěrnosti pacienta.

Deidentifikační proměnné

Kategoriepodkategorie
PříjmeníJméno pacienta, jméno lékaře, jméno praktického lékaře, jméno člena rodiny, název lékařského centra, název kliniky, název pečovatelského domu, název společnosti, název univerzity
věk 
DatumVzor data, vzor měsíc rok, vzor den měsíc, vzor den rok, den, měsíc, rok, sezóna
KDE?Země, stát, město, ulice, PSČ, číslo pokoje, číslo apartmá, číslo patra
IDČíslo sociálního pojištění, Číslo zdravotního záznamu, Číslo příjemce zdravotního plánu, Číslo účtu, Číslo certifikátu/Licenčního průkazu, Biometrické ID, ID záznamu, Přístupové číslo, Identifikační číslo vozidla, SPZ Identifikátory zařízení a sériové číslo
KontaktTelefonní číslo, Faxové číslo, E-mailová adresa, Web URL, IP adresa

Příklad:

Dne 25. září 2106, v 11:00, byl pan Harry Pace ve věku 90 let přijat do Forrest General Hospital k plánované operaci kyčle, kterou předtím konzultoval jeho lékař primární péče Dr. Jose Martin a zúčastnila se jí Kendra Reith, MUDr. Během svého pobytu byl v péči Mary Hu, NP, a Suzan Ray, RN, s R. Charlesem Melanconem, PA, byl také konzultován. Jeho operace, provedená ve stejný den jako přijetí, byla úspěšná bez hlášených komplikací. Po operaci byl pan Pace převezen do pokoje 202, patro 2, k zotavení. Jeho manželka Emma Paceová byla přítomna po celou dobu a byly jí poskytnuty všechny potřebné aktualizace. Během jeho krátkého pobytu byly jeho lékařské záznamy, včetně MRN MR99062619 a účtu KV000014764, zpracovány podle standardních protokolů pečovatelského domu Gracewood, jeho předchozího bydliště. Později téhož dne byl propuštěn do péče Oaklandské ambulance k další rekonvalescenci. V průběhu celého procesu byly všechny postupy dokumentovány a zabezpečeny s dodržením standardů důvěrnosti.

Příklad: De-identified

On [Vzor data], v 11:00 hodin, Mr. [Jméno pacienta], starý [Stáří], byl přijat do [Název lékařského centra] na plánovanou operaci kyčle, kterou předtím konzultoval jeho lékař primární péče Dr. [Jméno lékaře], a zúčastnil se [Jméno lékaře] MUDr. Během svého pobytu byl v péči [praktická sestra], NP a [praktická sestra], RN, s [Jméno lékaře], PA, je také konzultován. Jeho operace, provedená ve stejný den jako přijetí, byla úspěšná bez hlášených komplikací. Po operaci Mr. [Jméno pacienta] byla přemístěna do pokoje č. [Číslo pokoje], Patro č. [Číslo podlaží], pro zotavení. Jeho manželka [Jméno člena rodiny] byla přítomna a byly jí poskytnuty všechny potřebné aktualizace. Během jeho krátkého pobytu, jeho lékařské záznamy, včetně MRN [Číslo lékařského záznamu] a Účet [Číslo účtu], byly zpracovány podle standardních protokolů [Název pečovatelského domu], jeho předchozí bydliště. Později téhož dne byl propuštěn do péče [Název kliniky] pro další rekuperaci. V průběhu celého procesu byly všechny postupy dokumentovány a zabezpečeny s dodržením standardů důvěrnosti.

Pokyny pro poznámky a pokročilé techniky poznámek

Shaip byl nápomocný při vytváření a implementaci standardních pokynů pro anotaci dat, které zajistily, že všechny označené záznamy byly připraveny konzistentně a v souladu se standardy HIPAA. Kromě toho bylo pečlivě anotováno 10,000 XNUMX stran z různých lékařských záznamů se zaměřením na podrobné označení negačních stavů a ​​dalších klinicky relevantních entit včetně různých onkologických podoborů. Anotace provedl tým odborných anotátorů se specializovanými znalostmi v oblasti onkologie a předpisů o ochraně osobních údajů.

Složitá anotační kritéria

Kategoriepodkategorie
Datum anotace (onkologie)Datum diagnózy, datum fáze, začátek, datum postupu, datum zahájení, datum ukončení, datum zahájení záření, datum ukončení záření
Onemocnění (onkologie)Problém rakoviny, histologie, klinický stav, místo těla, chování, stupeň, stadium rakoviny, stadium TNM, test nádorových markerů, rozměry, kód
Léčba (onkologie)Rakovinová medicína, Dávkování léků, Frekvence, Operace rakoviny, Výsledek operace, Radiační modalita, Dávkování záření
GenomikaVariační kód, studovaný gen, metoda, vzorek
negaceNegativní, Možné Negativní, Nejisté, Možné Pozitivní
Klinický NERProblém rakoviny – místo těla, histologie – místo těla, chování – místo těla, chirurgie rakoviny – vztahy místo těla, radiační modalita – místo těla, histologie – stupeň, problém rakoviny – dimenze

Příklad:

Prohlášení o klinické poznámce onkologie

Prohlášení o klinické poznámce onkologie

„Pacientce Jane Doeové byla 03. 05. 2023 diagnostikována nemalobuněčná rakovina plic (NSCLC) fáze IIIB, konkrétně adenokarcinom. Rakovina se nachází v pravém dolním laloku plic. Je klasifikován jako T3N2M0 podle stagingového systému TNM, s velikostí nádoru 5 cm x 3 cm. Delece exonu 19 EGFR byla identifikována pomocí PCR analýzy vzorku biopsie nádoru. Chemoterapie karboplatinou AUC 5 a pemetrexedem 500 mg/m² byla zahájena 03. 20. 2023 a má se podávat každé 3 týdny. Externí radiační terapie (EBRT) v dávce 60 Gy ve 30 frakcích zahájena 04. 01. 2023. Léčba pacienta pokračuje a na nedávné MRI nejsou žádné známky mozkových metastáz. Možnost lymfovaskulární invaze ještě nebyla stanovena a tolerance pacienta pro celý režim chemoterapie zůstává nejistá.

Prohlášení o klinické poznámce onkologie

Prohlášení o klinické poznámce onkologie

Přísné zajištění kvality

Implementoval flexibilní rámec pro řízení projektů, který usnadnil efektivní integraci zpětné vazby od klientů při dodržování přísných standardů kvality. Byl prosazen komplexní protokol zajištění kvality, který je v souladu s pokyny pro dosažení požadovaných měřítek kvality. Tento protokol obsahoval po sobě jdoucí kola kontroly a ověřování, čímž byla zajištěna přesnost a spolehlivost anotovaných dat. Takový pečlivý dohled nad kvalitou je zásadní při vytváření spolehlivého řešení NLP, které je nezbytné pro informované klinické rozhodování a excelenci ve výzkumu.

Výsledek

Úspěšně dodáno 10,000 XNUMX vysoce kvalitních záznamů bez označení, které poskytují bezpečný a hodnotný soubor dat pro vývoj modelu NLP klienta. Pečlivá aplikace NLP a dodržování standardů pro deidentifikaci HIPAA vedly k vysoce propracovanému souboru dat, který podpoří pokračující a budoucí úsilí klienta v oblasti onkologického výzkumu, jehož cílem je v konečném důsledku zlepšit výsledky onkologických pacientů a efektivitu poskytování péče.

Úspěch projektu ilustruje naši schopnost zpracovávat složitá lékařská data s přesností, což přispívá k cíli klienta zlepšit výsledky péče o pacienty a urychlit tempo inovací ve zdravotnictví.

Naše partnerství se společností Shaip bylo zásadní pro rozvoj našich schopností NLP v oblasti onkologie. Profesionální zpracování 10,000 XNUMX lékařských záznamů, opatřených podrobnými negacemi a dalšími klinickými entitami, prokázalo jejich závazek k dokonalosti a dodržování předpisů. Navíc jejich závazek k dodržování standardů ochrany osobních údajů, jako je HIPAA, nám poskytl neocenitelné zdroje k tomu, abychom posouvali naše iniciativy umělé inteligence při vývoji nejmodernější onkologické léčby a diagnostiky.

Zlatá - 5 hvězdiček

Zrychlete svou AI ve zdravotnictví
vývoj aplikací o 100%