Bioinformatics
바이오마커 유전자 분석
JOFTWARE
2021. 8. 24. 15:42
RNA-seq 데이터 생성 예시
유전자 발현량 데이터 예시
- 가로축: TCGA 환자 ID
- 세로축: 유전자 ID
- ?|8225 -> 과발현(Up-DEG)
- ?|90288 -> 저발현(Down-DEG)
- DEG(Differentially Expressed Gene): 정상인에 비해 양의 차이가 있는 Gene
- 문자화된이름|숫자화된이름 :
- 문자: 유전자의 기능을 발견한 사람이 그 기능을 바탕으로 이름을 붙인 Fullname의 축약어
- 숫자: 문자 이름만으로는 명확히 구분하기 어렵기 때문에 숫자로 numbering을 한 것
TCGA 환자 ID 명명 규칙
Sample: 암세포인지 정상세포인지
- 01: Primary Solid Tumor
- 02: Recurrent Solid Tumor
- 10: Blood Derived Normal
- 11: Solid Tissue Normal
DEGs(Differentially Expressed Genes) 검출 분석
- 가로축: 사람(Control-정상인, Case-폐암환자)
- 세로축: 유전자
- 왼쪽 토너먼트 모양: 계층적 클러스터링(발현된 유전자 패턴->기능이 비슷한 애들을 묶는 것)
- 147 -> 과발현 유전자(Up-regulated DEG)
- 52 -> 저발현 유전자(Down-regulated DEG)
- DEG들이 바이오마커일 확률이 높음
Three methods to define DEGs
- Fold change
- P-value (statistics)
- Machine learning
728x90