Bioinformatics

바이오마커 유전자 분석

JOFTWARE 2021. 8. 24. 15:42

RNA-seq 데이터 생성 예시

유전자 발현량 데이터 예시

  • 가로축: TCGA 환자 ID
  • 세로축: 유전자 ID
  • ?|8225 -> 과발현(Up-DEG)
  • ?|90288 -> 저발현(Down-DEG)
  • DEG(Differentially Expressed Gene): 정상인에 비해 양의 차이가 있는 Gene
  • 문자화된이름|숫자화된이름 :
    • 문자: 유전자의 기능을 발견한 사람이 그 기능을 바탕으로 이름을 붙인 Fullname의 축약어
    • 숫자: 문자 이름만으로는 명확히 구분하기 어렵기 때문에 숫자로 numbering을 한 것

 

TCGA 환자 ID 명명 규칙

Sample: 암세포인지 정상세포인지

  • 01: Primary Solid Tumor
  • 02: Recurrent Solid Tumor
  • 10: Blood Derived Normal
  • 11: Solid Tissue Normal

 

DEGs(Differentially Expressed Genes) 검출 분석

Heat map Example

  • 가로축: 사람(Control-정상인, Case-폐암환자)
  • 세로축: 유전자
  • 왼쪽 토너먼트 모양: 계층적 클러스터링(발현된 유전자 패턴->기능이 비슷한 애들을 묶는 것)
  • 147 -> 과발현 유전자(Up-regulated DEG)
  • 52 -> 저발현 유전자(Down-regulated DEG)
  • DEG들이 바이오마커일 확률이 높음

 

Three methods to define DEGs

  • Fold change
  • P-value (statistics)
  • Machine learning
728x90