2025/07/30 2

24. DICOM과 AI 의료 영상 분석 – 데이터 준비 요령

의료 영상 AI 모델을 개발할 때, 가장 먼저 마주하는 문제는 DICOM 데이터의 복잡성과 전처리의 어려움이다.일반 이미지 데이터와 달리, DICOM은 의료 목적에 최적화된 특수 포맷이며 이미지뿐 아니라 환자 정보, 검사 정보, 촬영 파라미터 등 메타데이터를 함께 포함하고 있다. 또한 영상 구조는 단일 이미지가 아닌 Study, Series, Instance의 계층 구조로 이루어져 있고, 영상 장비에 따라 포맷이나 압축 방식이 달라지는 경우도 많다.AI 개발자는 모델 설계 이전에 DICOM 데이터를 정제하고 라벨링하며, 익명화하고 필터링하는 작업을 선행해야 한다.이번 글에서는 AI 개발 관점에서 DICOM 데이터를 어떻게 다뤄야 하는지를 단계별로 정리하고, 필수 도구와 실무 팁까지 함께 소개한다. 1..

23. 의료 영상 데이터셋 소개 (NIH Chest X-ray, TCIA 등)

의료 영상 분석 AI 모델을 개발하려면, 대량의 고품질 영상 데이터와 정확한 라벨이 반드시 필요하다.그러나 의료영상은 환자 개인정보와 밀접하게 연관되어 있어, 공공 데이터로 확보하기가 쉽지 않다.이런 이유로 글로벌 기관에서는 익명화된 오픈 의료 영상 데이터셋을 제공하고 있으며, 연구자와 개발자는 이를 기반으로 딥러닝 모델을 개발하거나 성능을 비교 평가할 수 있다. 이번 글에서는 대표적인 오픈 의료 영상 데이터셋인 NIH Chest X-ray, TCIA, RSNA, CheXpert, VinDr 등을 소개하고, 각 데이터셋의 다운로드 방식, 라벨 구조, DICOM 여부, 활용 시 주의점 등을 정리한다.특히 AI 학습에 적합한 데이터셋을 고르는 기준과 주제별 분류도 함께 설명한다. 1. NIH Chest X-..