바이오마커 유전자 분석
Bioinformatics

바이오마커 유전자 분석

RNA-seq 데이터 생성 예시

유전자 발현량 데이터 예시

  • 가로축: TCGA 환자 ID
  • 세로축: 유전자 ID
  • ?|8225 -> 과발현(Up-DEG)
  • ?|90288 -> 저발현(Down-DEG)
  • DEG(Differentially Expressed Gene): 정상인에 비해 양의 차이가 있는 Gene
  • 문자화된이름|숫자화된이름 :
    • 문자: 유전자의 기능을 발견한 사람이 그 기능을 바탕으로 이름을 붙인 Fullname의 축약어
    • 숫자: 문자 이름만으로는 명확히 구분하기 어렵기 때문에 숫자로 numbering을 한 것

 

TCGA 환자 ID 명명 규칙

Sample: 암세포인지 정상세포인지

  • 01: Primary Solid Tumor
  • 02: Recurrent Solid Tumor
  • 10: Blood Derived Normal
  • 11: Solid Tissue Normal

 

DEGs(Differentially Expressed Genes) 검출 분석

Heat map Example

  • 가로축: 사람(Control-정상인, Case-폐암환자)
  • 세로축: 유전자
  • 왼쪽 토너먼트 모양: 계층적 클러스터링(발현된 유전자 패턴->기능이 비슷한 애들을 묶는 것)
  • 147 -> 과발현 유전자(Up-regulated DEG)
  • 52 -> 저발현 유전자(Down-regulated DEG)
  • DEG들이 바이오마커일 확률이 높음

 

Three methods to define DEGs

  • Fold change
  • P-value (statistics)
  • Machine learning
728x90

'Bioinformatics' 카테고리의 다른 글

통계적 방법에 따른 DEG 분석 (R)  (3) 2021.08.25
Fold change에 따른 DEG 분석(Python)  (0) 2021.08.25
TCGA 데이터  (0) 2021.08.24
유전체 시퀀싱 분석  (0) 2021.08.24
정보의학개론 - 의료정보학 개요  (0) 2021.08.23