DICOM 표준에는 수천 개의 태그가 정의되어 있지만, 실제 병원·연구·AI 환경에서 자주 쓰이는 태그는 상대적으로 한정되어 있다.
이 태그들은 환자 정보, 검사 메타데이터, 영상 속성, 파일 구조를 빠르게 파악하는 핵심 단서가 된다. PACS 조회, 데이터 필터링, AI 학습 데이터 전처리 등 실무 업무에서 필수적으로 확인하는 20개의 태그를 선정해, Group/Element·VR·의미와 함께 정리한다.
각 태그는 단순 정의를 넘어, 사용 시 주의점과 실제 응용 사례를 덧붙였다.
1. 환자 정보 관련 태그
(0010,0010) Patient’s Name [PN]
- 의미/형식: 환자의 성명 정보. PN 형식은 성^이름 또는 성^이름^중간이름, 다국어 지원 시 =로 구분.
- 실무 활용: 환자 검색, 동일인 판별, 데이터셋 병합 시 중복 제거, AI 학습 시 비식별화 1순위.
- 주의사항: 국가별 성·이름 순서 차이, 기호(^, =) 처리 불일치, 한글·특수문자 인코딩 문제.
(0010,0020) Patient ID [LO]
- 의미/형식: 병원 내 환자 고유 식별 ID. 영문·숫자 혼합 가능, 재방문 시 동일 ID 사용.
- 실무 활용: PACS–EMR 연동의 키 값, 연구 데이터 병합, 환자 이력 추적.
- 주의사항: 병원별 규칙 불일치, 다기관 데이터 병합 시 매핑 필요, 외부 전송 시 가명 처리 필수.
(0010,0030) Patient’s Birth Date [DA]
- 의미/형식: 환자 생년월일(YYYYMMDD). 날짜만 기록, 구분자 없음.
- 실무 활용: 나이 계산, 연령별 분석, 임상시험 자격 검증.
- 주의사항: 잘못된 날짜 기록, 개인정보 보호를 위한 삭제/연도만 남기기, 형식 유효성 검사 필요.
(0010,0040) Patient’s Sex [CS]
- 의미/형식: 환자 성별. 표준값 M/F/O.
- 실무 활용: 성별별 질병 분석, AI 모델 성별 편향 검증, 해부학적 차이 반영.
- 주의사항: 표준 외 값(Male, 1 등) 발생, 공란 처리 사례, 필요 시 비식별화.
(0008,0020) Study Date [DA]
- 의미/형식: 해당 Study의 촬영 날짜(YYYYMMDD).
- 실무 활용: 검사 이력 정렬, 치료 경과 비교, AI 라벨링 기준.
- 주의사항: 장비 시계 오류로 잘못된 날짜, 다기관 병합 시 날짜 불일치, Series Date와 비교 필요.
2. 검사(Study) 정보 관련 태그
(0008,0030) Study Time [TM]
- 의미/형식: Study 시작 시간(HHMMSS.ffffff). 소수점 이하 마이크로초까지 가능.
- 실무 활용: 같은 날 여러 Study 구분, 시계열 분석 시 정밀 시간 기준.
- 주의사항: 시계 동기화 문제, 시간 포맷 불일치, 일부 장비는 초 단위까지만 기록.
(0008,0050) Accession Number [SH]
- 의미/형식: 병원 내 검사 주문 고유 번호. Short String 형식, 보통 12~16자.
- 실무 활용: PACS/EMR에서 검사 건 단위 조회, 보험 청구 연계.
- 주의사항: 병원 간 중복 가능성, 일부는 장비 단위에서 생성되어 표준 불일치.
(0020,000D) Study Instance UID [UI]
- 의미/형식: 전 세계적으로 유일한 Study 식별자. OID(Object Identifier) 구조, 점(.)으로 구분된 숫자열.
- 실무 활용: Study 병합·식별, 다기관 데이터 통합 시 충돌 방지.
- 주의사항: UID 생성 규칙 위반 사례, 중복 방지 필수, 복사/가명 처리 시 재발급 필요.
(0008,1030) Study Description [LO]
- 의미/형식: Study에 대한 설명(예: "Brain MRI with contrast").
- 실무 활용: 검색·필터링, 보고서 자동 작성, 연구용 데이터셋 태깅.
- 주의사항: 자유 입력 필드라 오타·약어·다국어 혼재, 표준화 어려움.
(0008,0090) Referring Physician’s Name [PN]
- 의미/형식: 검사 의뢰 의사 이름.
- 실무 활용: 진료 연계 분석, 연구 협력 시 의뢰자 추적.
- 주의사항: 개인정보 보호법상 외부 제공 시 삭제 또는 가명 처리.
3. 시리즈(Series) 정보 관련 태그
(0020,000E) Series Instance UID [UI]
- 의미/형식: 각 Series를 구분하는 전 세계 유일 식별자.
- 실무 활용: 동일 Study 내 시리즈 식별, AI 모델 입력 데이터 구분.
- 주의사항: UID 충돌 시 시리즈 혼합 오류 발생 가능.
(0008,0060) Modality [CS]
- 의미/형식: 영상 획득 장비 유형(CT, MR, CR, US 등).
- 실무 활용: 데이터 필터링, 장비별 분석, AI 모델별 입력 구분.
- 주의사항: 혼합 Study에서 다수 Modality 등장 가능.
(0020,0011) Series Number [IS]
- 의미/형식: 시리즈 순서를 나타내는 정수 값.
- 실무 활용: 동일 Study 내 시리즈 정렬, 재구성 순서 지정.
- 주의사항: 일부 장비는 중복·누락 발생.
(0008,103E) Series Description [LO]
- 의미/형식: 시리즈 설명(예: "Axial T1", "Sagittal T2").
- 실무 활용: 시리즈 식별, 연구용 태깅.
- 주의사항: 자유 입력 필드, 표기 일관성 부족.
(0020,1002) Images in Acquisition [IS]
- 의미/형식: 해당 획득 시 포함된 이미지 수.
- 실무 활용: 데이터셋 완전성 검증, 시리즈 불완전 여부 확인.
- 주의사항: 일부 장비는 정확히 기록하지 않음.
4. 이미지(Frame) 정보 관련 태그
(0020,0013) Instance Number [IS]
- 의미/형식: 시리즈 내 이미지 프레임의 순서 번호.
- 실무 활용: 영상 재구성, 시퀀스 분석.
- 주의사항: 번호 중복·누락 시 재구성 오류.
(0028,0010) Rows [US]
- 의미/형식: 이미지 세로 픽셀 수.
- 실무 활용: 해상도 확인, 픽셀 데이터 크기 계산.
- 주의사항: Pixel Data 길이와 불일치 시 오류 가능.
(0028,0011) Columns [US]
- 의미/형식: 이미지 가로 픽셀 수.
- 실무 활용: Rows와 함께 영상 크기 결정.
- 주의사항: 값 불일치 시 데이터 손상 의심.
(0028,0030) Pixel Spacing [DS]
- 의미/형식: 픽셀 간 실제 거리(mm). 두 값(가로, 세로) 저장.
- 실무 활용: 거리·면적·부피 측정 정확도 보정, AI 데이터 정규화.
- 주의사항: 누락 시 정량 분석 오차 발생.
(0028,1050) Window Center [DS] / (0028,1051) Window Width [DS]
- 의미/형식: 영상 표시 시 명암·대비 조정 값.
- 실무 활용: 영상 뷰어의 초기 표시 설정.
- 주의사항: 뷰어별 기본값 차이.
5. 픽셀 데이터 관련 태그
(0028,0100) Bits Allocated [US]
- 의미/형식: 픽셀당 메모리 할당 비트 수(예: 8, 16).
- 실무 활용: 데이터 용량 계산, 처리 알고리즘 선택.
- 주의사항: Bits Stored와 혼동 금지.
(0028,0101) Bits Stored [US]
- 의미/형식: 실제 유효 데이터 비트 수.
- 실무 활용: 유효 비트 범위 기반 정규화.
- 주의사항: 할당 비트보다 작을 수 있음.
(0028,0102) High Bit [US]
- 의미/형식: 픽셀 값 최상위 비트 위치.
- 실무 활용: 픽셀 데이터 해석 정확도 향상.
- 주의사항: 값이 맞지 않으면 영상 왜곡.
(0028,0103) Pixel Representation [US]
- 의미/형식: 부호 여부(0=Unsigned, 1=Signed).
- 실무 활용: CT HU값 해석, AI 모델 입력 변환.
- 주의사항: 부호 정보 잘못되면 데이터 왜곡.
(7FE0,0010) Pixel Data [OB/OW]
- 의미/형식: 실제 영상 픽셀 값 데이터. 수 MB~GB 가능.
- 실무 활용: 영상 재구성, AI 학습 데이터 생성.
- 주의사항: 압축 여부, Endian, Bits 정보와 함께 해석해야 함.
6. DICOM 태그 TOP 20 요약 표
구분 | 태그 번호 (Group,Element) |
VR | 의미 | 주요 실무 활용 분야 | 주의사항 |
환자 정보 | (0010,0010) | PN | 환자 이름 | 환자 검색, 데이터 병합, AI 비식별화 | 국가별 표기·인코딩 차이 |
(0010,0020) | LO | 환자 ID | EMR–PACS 연동, 연구 데이터 매핑 | 병원별 규칙 상이 | |
(0010,0030) | DA | 생년월일 | 나이 계산, 연령별 분석 | 잘못된 날짜 기록, 비식별화 필요 | |
(0010,0040) | CS | 성별 | 성별별 분석, AI 편향 검증 | 코드 표준화 필요 | |
(0008,0020) | DA | Study 날짜 | 이력 정렬, 경과 비교 | 시계 오류, 날짜 불일치 | |
검사(Study) | (0008,0030) | TM | Study 시간 | 같은 날 Study 구분 | 시간 포맷 불일치 |
(0008,0050) | SH | Accession No. | 검사 건 단위 조회 | 병원 간 중복 가능 | |
(0020,000D) | UI | Study UID | Study 병합·식별 | UID 충돌 방지 | |
(0008,1030) | LO | Study 설명 | 검색·보고서 작성 | 자유 입력 필드 | |
(0008,0090) | PN | 의뢰 의사명 | 진료 연계, 연구 협력 | 개인정보 보호 처리 | |
시리즈(Series) | (0020,000E) | UI | Series UID | 시리즈 구분, AI 입력 구분 | UID 충돌 가능 |
(0008,0060) | CS | Modality | 장비 유형 필터링 | 혼합 Study 발생 | |
(0020,0011) | IS | Series 번호 | 순서 정렬 | 중복·누락 가능 | |
(0008,103E) | LO | Series 설명 | 시리즈 식별, 연구 태깅 | 표기 불일치 | |
(0020,1002) | IS | 이미지 수 | 데이터 완전성 검증 | 부정확 기록 사례 | |
이미지(Frame) | (0020,0013) | IS | Instance 번호 | 영상 재구성, 순서 지정 | 중복·누락 가능 |
(0028,0010) | US | Rows | 해상도 확인 | Pixel Data와 불일치 가능 | |
(0028,0011) | US | Columns | 해상도 확인 | Pixel Data와 불일치 가능 | |
(0028,0030) | DS | Pixel Spacing | 측정 정확도 보정 | 누락 시 분석 오차 | |
(0028,1050)/(0028,1051) | DS | Window Center/Width | 초기 표시 설정 | 뷰어별 기본값 차이 | |
픽셀 데이터 | (0028,0100) | US | Bits Allocated | 용량 계산 | Bits Stored와 혼동 주의 |
(0028,0101) | US | Bits Stored | 유효 데이터 범위 | Bits Allocated와 비교 | |
(0028,0102) | US | High Bit | 최상위 비트 위치 | 값 오류 시 왜곡 | |
(0028,0103) | US | Pixel Representation | 부호 여부 | 잘못 설정 시 왜곡 | |
(7FE0,0010) | OB/OW | Pixel Data | 영상 재구성 | 압축·Endian 고려 |
결론
위에서 소개한 20개의 태그는 병원·연구·AI 프로젝트에서 DICOM 파일을 다룰 때 가장 빈번하게 사용된다. 단순히 번호를 외우는 것보다, 해당 태그가 왜 필요한지, 어떤 상황에서 쓰이는지를 이해하는 것이 중요하다. 이 태그들을 이해하면 PACS 분석, AI 데이터셋 전처리, 연구 과제 수행에서 필요한 메타데이터를 신속하게 식별하고, 데이터 정제·비식별화·품질 검증까지 체계적으로 진행할 수 있다. 특히 병원 간 데이터 교류나 대규모 AI 학습용 데이터 구축 시, 각 태그의 특성과 잠재적 오류 패턴을 파악하는 것이 프로젝트 안정성과 정확도를 좌우한다. 이 가이드를 기반으로, DICOM 데이터를 ‘그냥 열어보는 수준’에서 ‘목적에 맞게 분석·활용하는 단계’로 발전시키는 것이 가능하다.
'개발 > DICOM 태그 구조 마스터하기' 카테고리의 다른 글
4. Endian 규칙과 바이트 순서 해석 – Little vs Big Endian (3) | 2025.08.13 |
---|---|
3. DICOM Tag 번호 해석법 – Group/Element 구조 이해하기 (2) | 2025.08.12 |
2. DICOM 데이터 요소의 4가지 구성요소 – Tag, VR, Length, Value (2) | 2025.08.11 |
1. DICOM 태그란 무엇인가 – 태그의 의미와 역할 (2) | 2025.08.10 |