[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링
Bioinformatics/Biomedical Data Science

[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링

[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링

 

바이오헬스와 데이터 모델링

모델: 의사소통에 대한 기록을 남기는 것

모델링: 일정한 표기법으로 모델을 만들어가는 일 자체

모델링의 특징

  • 추상화(일정한 형식에 맞추어 표현)
  • 단순화(제한된 표기법이나 언어로 표현 -> 쉽게 이해할 수 있도록)
  • 명확화(애매모호함을 제거하고 정확하게 기술)

모델링의 관점

  • 데이터관점(데이터 간의 관계)
  • 프로세스관점(업무가 실제로 하고 있는 일은 무엇인지)
  • 데이터와 프로세스의 상관관점(어떤 관계인지)

 

데이터 모델링: 이터베이스의 골격을 이해하고 그 이해를 바탕으로 SQL 문장을 기능과 성능적인 측면에서 효율적으로 작성하기 위해 꼭 알아야 하는 핵심 요소

중요성: 파급효과, 복잡한 정보 요구사항의 간결한 표현, 데이터 품질의 측면

데이터 모델링 시 유의할 점

  • 중복성(여러 장소에 같은 정보 저장 x)
  • 비유연성(데이터의 정의를 데이터의 사용 프로세스와 분리->유지보수 용이하도록)
  • 비일관성(데이터와 데이터 관계를 명확히 정의->모순 x)

데이터 모델링의 진행 단계

  • 개념적 데이터 모델링(추상화 수준이 높은 상위 수준 형상화, E-R 다이어그램 생성)
  • 논리적 데이터 모델링(가장 핵심, 구체적인 업무의 모습과 흐름에 따른 업무 중심, 정규화)
  • 물리적 데이터 모델링(실제 데이터베이스에 이식할 수 있도록 어떻게 물리적으로 저장할지를 결정)

 

데이터독립성과 이해관계자

데이터독립성의 필요성

어떤 단위에 대해 독립적인 의미를 부여하고 효과적으로 구현하게 되면 자신이 가지는 고유한 특징을 명확하게 할 뿐만 아니라 다른 기능의 변경으로부터 쉽게 변경되지 않고 자신의 고유한 기능을 제공

데이터 독립성을 확보할 시 얻는 효과

  • 각 View의 독립성을 유지하고 계층별 View에 영향을 주지 않고 변경이 가능
  • 단계별 Schema에 따라 데이터 정의어(DDL)와 데이터 조작어(DML)가 다름을 제공

데이터독립성의 구성요소

  • 외부스키마: 사용자가 보는 개인적 DB 스키마, 사용자나 프로그래머가 접근하는 DB 정의
  • 개념스키마: DB에 저장되는 데이터와 그들간의 관계를 표현
  • 내부스키마: DB가 물리적 장치에서 실제적으로 저장되는 방법을 표현

데이터 모델링의 이해관계자

  • 정보시스템을 구축하는 모든 사람
  • IT 기술에 종사하거나 전공하지 않았떠라도 해당 업무에서 정보화를 추진하는 위치에 있는 사람
  • 프로젝트 개발자(가장 중요), 전문 모델러, DBA, 현업 업무 전문가(이해할 수 있는 수준)

 

데이터 모델 표기법-ERD의 이해

ERD

각 업무분석에서 도출된 엔터티와 엔터티간의 관계를 이해하기 쉽게 도식화된 다이어그램으로 표시하는 방법
  • 일정한 규칙을 지정하여 그림으로써 데이터 모델을 누구나 공통된 시각으로 파악할 수 있게 해줌
  • 의사소통을 원활하게 해줌

작업순서

  1. 엔터티를 그린다
  2. 엔터티를 적절하게 배치한다
  3. 엔터티간 관계를 설정한다
  4. 관계명을 기술한다
  5. 관계의 참여도를 기술한다
  6. 관계의 필수여부를 기술한다
728x90