Sada dat DICOM pro lékařské zobrazování pro pokročilé aplikace umělé inteligence/strojového učení ve zdravotnictví
Anonymizováno Datové sady obrázků DICOM s uchovanými metadaty – a volitelnými zprávami z radiologických studií – pro urychlení trénování modelu, validace a klinického výzkumu.
DICOM obrazová data vytvořená pro umělou inteligenci v reálném světě
Shaip nabízí řešení připravená pro umělou inteligenci DICOM datové sady pro lékařské zobrazování navrženo tak, aby pomohlo týmům s umělou inteligencí ve zdravotnictví vytvářet, trénovat a ověřovat robustní modely pro diagnostiku, třídění a podporu rozhodování – s využitím anonymizovaných dat, která zachovávají klinickou hodnotu.
Snímek datové sady
- Celkový počet studií:10M +
- Nejoblíbenější zeměpisné oblasti (podle studií): USA, Brazílie a Indie
- Zastoupené modality: CR, CT, ultrazvuk, DX, MR, MG, OT, RF, NM, mamografie
- Zastoupené části těla: Hrudník, břicho, hlava, páteř, krk, srdce a další
Běžné případy použití pro obrazové datové sady DICOM
Trénování modelů umělé inteligence pro diagnostické zobrazování
- Detekce abnormalit
- Klasifikace nemocí
- Hodnocení/stanovení stupně závažnosti
- Prioritizace třídění
- Podporuje rozvoj multimodální dopravy
Ověření a porovnání výkonu modelu
- Vyhodnoťte přesnost modelu na širších populacích
- Srovnávací výkon podle modality/oblasti těla
- Spuštění externí validace pro snížení přeplnění
Zlepšení robustnosti modelu napříč zařízeními a weby
- Zobecnění testů napříč skenery/dodavateli
- Snížení poklesu výkonu při nasazování do nových nemocnic
Vytvořte multimodální umělou inteligenci (snímek + radiologická zpráva)
- Odvození slabých popisků z jazyka sestavy
- Trénovací modely v souladu s popisy zpráv
- Vytvořte třídění a podporu rozhodování s ohledem na hlášení
Klinický výzkum a tvorba kohort
- Filtrovat kohorty podle modality/části těla/času
- Podpora retrospektivních studií
- Zrychlete testování hypotéz a zároveň zachujte kontrolu soukromí
Tvorba anotací a základů pro školení strojového učení
- Klasifikační značky
- Ohraničující krabice
- Segmentační masky
Co obdržíte v datové sadě obrazových dat DICOM
1. DICOM pixelová data (obrázky)
Veškeré snímky jsou anonymizovány na úrovni pixelů:
- Text na obrázcích je redigovaný nebo pseudonymizovaný
- Pokud je možná rekonstrukce obličeje (např. CT s vysokým rozlišením), mohou se objevit artefakty „odstraňující obličej“.
3. Zpráva ze studie (volitelné, pokud je k dispozici)
Nestrukturovaný narativní text napsaný radiologem/lékařem s anonymizací dle standardu Safe Harbor a stejným přístupem k posunu data.
2. Metadata DICOM (s protokolem Safe Harbor)
Veškerá standardní metadata DICOM jsou pro účely doručení zachována, zatímco identifikátory HIPAA Safe Harbor jsou anonymizovány, včetně:
- Jméno pacienta nahrazeno ID pacienta
- ID pacienta kryptograficky hašováno
- Název instituce nahrazen alternativním názvem
- Data se posunula v rámci 365 dnů (konzistentní posun na úrovni pacienta).
4. Vlastní metadata (volitelné s přidanou hodnotou)
Volitelná odvozená metadata mohou zahrnovat:
- Analyzovaný věk pacienta
- Tagy SNOMED (z reportu)
- Pozitivní entity (z reportu)
- Země bydliště (z adresy)
- Imputovaná rasa / Imputovaná etnická příslušnost (odvozená pole)
Metody DICOM deidentifikace s ohledem na soukromí
Datová sada používá kryptografické hashování a pseudonymizaci, aby splňovala požadavky HIPAA a zároveň zachovala klinickou užitečnost a chránila citlivá data.
Ochrana na úrovni pixelů
Redakční/pseudonymizační úprava vypáleného textu a v případě potřeby odstranění fasády.
Ochrana metadat
Identifikátory Safe Harbor jsou anonymizovány, zatímco standardní metadata DICOM jsou zachována.
Posun data
Data jsou na úrovni pacienta posunuta v rámci 365denního rozmezí, aby se zachovaly časové vztahy napříč studiemi.
Demografické podlahy
Některá pole jsou omezena/omezena spodní hranicí, aby se snížilo riziko opětovné identifikace (např. věk, hmotnost, velikost a některé údaje o etnické příslušnosti).
Nenašli jste, co jste hledali?
Pro všechny typy dat se shromažďují nové běžně dostupné lékařské datové sady
Kontaktujte nás nyní a zbavte se starostí se shromažďováním dat o zdravotních školeních
Často kladené otázky (FAQ)
1. Co je to obrazová datová sada DICOM?
Datová sada obrázků DICOM je kolekce lékařských zobrazovacích studií uložených ve standardu DICOM, včetně pixelových dat a klinických metadat, běžně používaných k trénování a validaci modelů umělé inteligence ve zdravotnictví.
2. Co je součástí této datové sady obrázků DICOM?
V závislosti na rozsahu licence může zahrnovat pixelová data DICOM, konzervovaná (anonymizovaná) metadata DICOM, volitelné studijní zprávy a volitelná vlastní metadata s přidanou hodnotou.
3. Jsou obrázky anonymizovány?
Ano. Obrázky jsou anonymizovány na úrovni pixelů, včetně redakce/pseudonymizace textu na obrázcích a v případě potřeby odstranění tváře.
4. Jsou zachována metadata DICOM?
Standardní metadata DICOM jsou pro účely doručení zachována, zatímco identifikátory HIPAA Safe Harbor jsou anonymizovány (např. identifikátory a data pacienta/instituce).
5. Jak se zpracovává data?
Data lze posunout v rámci 365 dnů a konzistentně aplikovat na úrovni pacienta, aby se zachovalo relativní načasování napříč studiemi.
6. Jsou zahrnuty radiologické/studijní zprávy?
Pokud jsou k dispozici a licencované, lze zahrnout studijní zprávy (nestrukturovaný narativní text) s pseudonymizovanými identifikátory.
7. Jaká vlastní metadata mohou být k dispozici?
Možnosti mohou zahrnovat analyzovaný věk pacienta, tagy SNOMED, pozitivní entity, zemi bydliště a další odvozená pole.
8. Mohu si vyžádat konkrétní kohortu (modalita, část těla, zeměpisná poloha atd.)?
Ano – sdílejte svůj cílový rozsah a filtry a Shaip navrhne nejvhodnější segment datové sady na základě dostupnosti.
9. Jak mohu licencovat datovou sadu?
Odešlete své požadavky prostřednictvím kontaktního formuláře. Náš tým vám potvrdí dostupnost, rozsah, licenční podmínky a možnosti dodání.