개발/DICOM 태그 구조 마스터하기

5. 자주 쓰이는 DICOM 태그 TOP 20 – 의료 IT 필수 레퍼런스

devbake 2025. 8. 14. 13:20

DICOM 표준에는 수천 개의 태그가 정의되어 있지만, 실제 병원·연구·AI 환경에서 자주 쓰이는 태그는 상대적으로 한정되어 있다.
이 태그들은 환자 정보, 검사 메타데이터, 영상 속성, 파일 구조를 빠르게 파악하는 핵심 단서가 된다. PACS 조회, 데이터 필터링, AI 학습 데이터 전처리 등 실무 업무에서 필수적으로 확인하는 20개의 태그를 선정해, Group/Element·VR·의미와 함께 정리한다.
각 태그는 단순 정의를 넘어, 사용 시 주의점과 실제 응용 사례를 덧붙였다.

 

자주 쓰이는 DICOM 태그 TOP 20 – 의료 IT 필수 레퍼런스

1. 환자 정보 관련 태그

(0010,0010) Patient’s Name [PN]

  • 의미/형식: 환자의 성명 정보. PN 형식은 성^이름 또는 성^이름^중간이름, 다국어 지원 시 =로 구분.
  • 실무 활용: 환자 검색, 동일인 판별, 데이터셋 병합 시 중복 제거, AI 학습 시 비식별화 1순위.
  • 주의사항: 국가별 성·이름 순서 차이, 기호(^, =) 처리 불일치, 한글·특수문자 인코딩 문제.

(0010,0020) Patient ID [LO]

  • 의미/형식: 병원 내 환자 고유 식별 ID. 영문·숫자 혼합 가능, 재방문 시 동일 ID 사용.
  • 실무 활용: PACS–EMR 연동의 키 값, 연구 데이터 병합, 환자 이력 추적.
  • 주의사항: 병원별 규칙 불일치, 다기관 데이터 병합 시 매핑 필요, 외부 전송 시 가명 처리 필수.

(0010,0030) Patient’s Birth Date [DA]

  • 의미/형식: 환자 생년월일(YYYYMMDD). 날짜만 기록, 구분자 없음.
  • 실무 활용: 나이 계산, 연령별 분석, 임상시험 자격 검증.
  • 주의사항: 잘못된 날짜 기록, 개인정보 보호를 위한 삭제/연도만 남기기, 형식 유효성 검사 필요.

(0010,0040) Patient’s Sex [CS]

  • 의미/형식: 환자 성별. 표준값 M/F/O.
  • 실무 활용: 성별별 질병 분석, AI 모델 성별 편향 검증, 해부학적 차이 반영.
  • 주의사항: 표준 외 값(Male, 1 등) 발생, 공란 처리 사례, 필요 시 비식별화.

(0008,0020) Study Date [DA]

  • 의미/형식: 해당 Study의 촬영 날짜(YYYYMMDD).
  • 실무 활용: 검사 이력 정렬, 치료 경과 비교, AI 라벨링 기준.
  • 주의사항: 장비 시계 오류로 잘못된 날짜, 다기관 병합 시 날짜 불일치, Series Date와 비교 필요.

 

 

2. 검사(Study) 정보 관련 태그

(0008,0030) Study Time [TM]

  • 의미/형식: Study 시작 시간(HHMMSS.ffffff). 소수점 이하 마이크로초까지 가능.
  • 실무 활용: 같은 날 여러 Study 구분, 시계열 분석 시 정밀 시간 기준.
  • 주의사항: 시계 동기화 문제, 시간 포맷 불일치, 일부 장비는 초 단위까지만 기록.

(0008,0050) Accession Number [SH]

  • 의미/형식: 병원 내 검사 주문 고유 번호. Short String 형식, 보통 12~16자.
  • 실무 활용: PACS/EMR에서 검사 건 단위 조회, 보험 청구 연계.
  • 주의사항: 병원 간 중복 가능성, 일부는 장비 단위에서 생성되어 표준 불일치.

(0020,000D) Study Instance UID [UI]

  • 의미/형식: 전 세계적으로 유일한 Study 식별자. OID(Object Identifier) 구조, 점(.)으로 구분된 숫자열.
  • 실무 활용: Study 병합·식별, 다기관 데이터 통합 시 충돌 방지.
  • 주의사항: UID 생성 규칙 위반 사례, 중복 방지 필수, 복사/가명 처리 시 재발급 필요.

(0008,1030) Study Description [LO]

  • 의미/형식: Study에 대한 설명(예: "Brain MRI with contrast").
  • 실무 활용: 검색·필터링, 보고서 자동 작성, 연구용 데이터셋 태깅.
  • 주의사항: 자유 입력 필드라 오타·약어·다국어 혼재, 표준화 어려움.

(0008,0090) Referring Physician’s Name [PN]

  • 의미/형식: 검사 의뢰 의사 이름.
  • 실무 활용: 진료 연계 분석, 연구 협력 시 의뢰자 추적.
  • 주의사항: 개인정보 보호법상 외부 제공 시 삭제 또는 가명 처리.

 

 

3. 시리즈(Series) 정보 관련 태그

(0020,000E) Series Instance UID [UI]

  • 의미/형식: 각 Series를 구분하는 전 세계 유일 식별자.
  • 실무 활용: 동일 Study 내 시리즈 식별, AI 모델 입력 데이터 구분.
  • 주의사항: UID 충돌 시 시리즈 혼합 오류 발생 가능.

(0008,0060) Modality [CS]

  • 의미/형식: 영상 획득 장비 유형(CT, MR, CR, US 등).
  • 실무 활용: 데이터 필터링, 장비별 분석, AI 모델별 입력 구분.
  • 주의사항: 혼합 Study에서 다수 Modality 등장 가능.

(0020,0011) Series Number [IS]

  • 의미/형식: 시리즈 순서를 나타내는 정수 값.
  • 실무 활용: 동일 Study 내 시리즈 정렬, 재구성 순서 지정.
  • 주의사항: 일부 장비는 중복·누락 발생.

(0008,103E) Series Description [LO]

  • 의미/형식: 시리즈 설명(예: "Axial T1", "Sagittal T2").
  • 실무 활용: 시리즈 식별, 연구용 태깅.
  • 주의사항: 자유 입력 필드, 표기 일관성 부족.

(0020,1002) Images in Acquisition [IS]

  • 의미/형식: 해당 획득 시 포함된 이미지 수.
  • 실무 활용: 데이터셋 완전성 검증, 시리즈 불완전 여부 확인.
  • 주의사항: 일부 장비는 정확히 기록하지 않음.

 

 

4. 이미지(Frame) 정보 관련 태그

(0020,0013) Instance Number [IS]

  • 의미/형식: 시리즈 내 이미지 프레임의 순서 번호.
  • 실무 활용: 영상 재구성, 시퀀스 분석.
  • 주의사항: 번호 중복·누락 시 재구성 오류.

(0028,0010) Rows [US]

  • 의미/형식: 이미지 세로 픽셀 수.
  • 실무 활용: 해상도 확인, 픽셀 데이터 크기 계산.
  • 주의사항: Pixel Data 길이와 불일치 시 오류 가능.

(0028,0011) Columns [US]

  • 의미/형식: 이미지 가로 픽셀 수.
  • 실무 활용: Rows와 함께 영상 크기 결정.
  • 주의사항: 값 불일치 시 데이터 손상 의심.

(0028,0030) Pixel Spacing [DS]

  • 의미/형식: 픽셀 간 실제 거리(mm). 두 값(가로, 세로) 저장.
  • 실무 활용: 거리·면적·부피 측정 정확도 보정, AI 데이터 정규화.
  • 주의사항: 누락 시 정량 분석 오차 발생.

(0028,1050) Window Center [DS] / (0028,1051) Window Width [DS]

  • 의미/형식: 영상 표시 시 명암·대비 조정 값.
  • 실무 활용: 영상 뷰어의 초기 표시 설정.
  • 주의사항: 뷰어별 기본값 차이.

 

5. 픽셀 데이터 관련 태그

(0028,0100) Bits Allocated [US]

  • 의미/형식: 픽셀당 메모리 할당 비트 수(예: 8, 16).
  • 실무 활용: 데이터 용량 계산, 처리 알고리즘 선택.
  • 주의사항: Bits Stored와 혼동 금지.

(0028,0101) Bits Stored [US]

  • 의미/형식: 실제 유효 데이터 비트 수.
  • 실무 활용: 유효 비트 범위 기반 정규화.
  • 주의사항: 할당 비트보다 작을 수 있음.

(0028,0102) High Bit [US]

  • 의미/형식: 픽셀 값 최상위 비트 위치.
  • 실무 활용: 픽셀 데이터 해석 정확도 향상.
  • 주의사항: 값이 맞지 않으면 영상 왜곡.

(0028,0103) Pixel Representation [US]

  • 의미/형식: 부호 여부(0=Unsigned, 1=Signed).
  • 실무 활용: CT HU값 해석, AI 모델 입력 변환.
  • 주의사항: 부호 정보 잘못되면 데이터 왜곡.

(7FE0,0010) Pixel Data [OB/OW]

  • 의미/형식: 실제 영상 픽셀 값 데이터. 수 MB~GB 가능.
  • 실무 활용: 영상 재구성, AI 학습 데이터 생성.
  • 주의사항: 압축 여부, Endian, Bits 정보와 함께 해석해야 함.

 

6. DICOM 태그 TOP 20 요약 표

구분 태그 번호
(Group,Element)
VR 의미 주요 실무 활용 분야 주의사항
환자 정보 (0010,0010) PN 환자 이름 환자 검색, 데이터 병합, AI 비식별화 국가별 표기·인코딩 차이
  (0010,0020) LO 환자 ID EMR–PACS 연동, 연구 데이터 매핑 병원별 규칙 상이
  (0010,0030) DA 생년월일 나이 계산, 연령별 분석 잘못된 날짜 기록, 비식별화 필요
  (0010,0040) CS 성별 성별별 분석, AI 편향 검증 코드 표준화 필요
  (0008,0020) DA Study 날짜 이력 정렬, 경과 비교 시계 오류, 날짜 불일치
검사(Study) (0008,0030) TM Study 시간 같은 날 Study 구분 시간 포맷 불일치
  (0008,0050) SH Accession No. 검사 건 단위 조회 병원 간 중복 가능
  (0020,000D) UI Study UID Study 병합·식별 UID 충돌 방지
  (0008,1030) LO Study 설명 검색·보고서 작성 자유 입력 필드
  (0008,0090) PN 의뢰 의사명 진료 연계, 연구 협력 개인정보 보호 처리
시리즈(Series) (0020,000E) UI Series UID 시리즈 구분, AI 입력 구분 UID 충돌 가능
  (0008,0060) CS Modality 장비 유형 필터링 혼합 Study 발생
  (0020,0011) IS Series 번호 순서 정렬 중복·누락 가능
  (0008,103E) LO Series 설명 시리즈 식별, 연구 태깅 표기 불일치
  (0020,1002) IS 이미지 수 데이터 완전성 검증 부정확 기록 사례
이미지(Frame) (0020,0013) IS Instance 번호 영상 재구성, 순서 지정 중복·누락 가능
  (0028,0010) US Rows 해상도 확인 Pixel Data와 불일치 가능
  (0028,0011) US Columns 해상도 확인 Pixel Data와 불일치 가능
  (0028,0030) DS Pixel Spacing 측정 정확도 보정 누락 시 분석 오차
  (0028,1050)/(0028,1051) DS Window Center/Width 초기 표시 설정 뷰어별 기본값 차이
픽셀 데이터 (0028,0100) US Bits Allocated 용량 계산 Bits Stored와 혼동 주의
  (0028,0101) US Bits Stored 유효 데이터 범위 Bits Allocated와 비교
  (0028,0102) US High Bit 최상위 비트 위치 값 오류 시 왜곡
  (0028,0103) US Pixel Representation 부호 여부 잘못 설정 시 왜곡
  (7FE0,0010) OB/OW Pixel Data 영상 재구성 압축·Endian 고려

 

 


결론

위에서 소개한 20개의 태그는 병원·연구·AI 프로젝트에서 DICOM 파일을 다룰 때 가장 빈번하게 사용된다. 단순히 번호를 외우는 것보다, 해당 태그가 왜 필요한지, 어떤 상황에서 쓰이는지를 이해하는 것이 중요하다. 이 태그들을 이해하면 PACS 분석, AI 데이터셋 전처리, 연구 과제 수행에서 필요한 메타데이터를 신속하게 식별하고, 데이터 정제·비식별화·품질 검증까지 체계적으로 진행할 수 있다. 특히 병원 간 데이터 교류나 대규모 AI 학습용 데이터 구축 시, 각 태그의 특성과 잠재적 오류 패턴을 파악하는 것이 프로젝트 안정성과 정확도를 좌우한다. 이 가이드를 기반으로, DICOM 데이터를 ‘그냥 열어보는 수준’에서 ‘목적에 맞게 분석·활용하는 단계’로 발전시키는 것이 가능하다.