Bioinformatics/Biomedical Data Science
[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링
[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링 바이오헬스와 데이터 모델링 모델: 의사소통에 대한 기록을 남기는 것 모델링: 일정한 표기법으로 모델을 만들어가는 일 자체 모델링의 특징 추상화(일정한 형식에 맞추어 표현) 단순화(제한된 표기법이나 언어로 표현 -> 쉽게 이해할 수 있도록) 명확화(애매모호함을 제거하고 정확하게 기술) 모델링의 관점 데이터관점(데이터 간의 관계) 프로세스관점(업무가 실제로 하고 있는 일은 무엇인지) 데이터와 프로세스의 상관관점(어떤 관계인지) 데이터 모델링: 데이터베이스의 골격을 이해하고 그 이해를 바탕으로 SQL 문장을 기능과 성능적인 측면에서 효율적으로 작성하기 위해 꼭 알아야 하는 핵심 요소 중요성: 파급효과, 복잡한 정보 요구사항의 간..
[Biomedical Data Science] - 7. 바이오헬스 데이터
[Biomedical Data Science] - 7. 바이오헬스 데이터 바이오 데이터 생물정보 유전체, 생물체 정보 등 다양한 생물 정보에 대한 데이터 바이오데이터의 종류 서열데이터: DNA/RNA 유전체 데이터, EST(Expressed Sequence Tag) 서열, SNP 데이터 등 구조데이터: 단백질 3차 주고 데이터 발현데이터: SAGE 데이터(Serial Analysis of Gene Expression) EST 데이터를 비롯해 수천에서 수 만에 이르는 유전자의 발현량을 한꺼번에 측정할 수 있는 Microarray 데이터 네트워크 데이터: pathway, protein interaction 데이터 텍스트 데이터: 논문 등과 같은 문서 형태로 저장된 텍트스 데이터 헬스데이터 의료 정보나 건강 ..
[Biomedical Data Science] - 6. 비정형 데이터마이닝
[Biomedical Data Science] - 6. 비정형 데이터마이닝 비정형 데이터마이닝의 개념 정형화되지 않은 데이터 미리 정의된 데이터 모델을 가지고 있지 않은 데이터 불규칙 정도에 따라 반정형 데이터로 구분하기도 함 반정형데이터 어의적 요소를 분리시키고 데이터 내의 레코드와 필드의 계층구조가 있게 하는 태그나 다른 마커를 포함하고 있는 정형 데이터임 비정형데이터의 예 책, 저널 문서, 메타, 데이터, 건강기록, 오디오, 비디오, 아날로그 데이터, 이미지, 파일, 비정형 텍스트, 비표준 텍스트 등 텍스트마이닝 인간의 언어로 이루어진 이러한 비정형 텍스트 데이터들을 자연어 처리 방식을 이용해서 대규모 문서에서 정보를 추출하거나, 연계성을 파악하거나, 또는 분류나 군집화, 요약 등 빅데이터에 숨겨진..
[Biomedical Data Science] - 5. 정형 데이터마이닝
[Biomedical Data Science] - 5. 정형 데이터마이닝 주요 데이터마이닝 기법 정형데이터 분석 연관관계분석 기법 의사결정나무 인공신경망 기법 사례기반추론 군집분석 기법 비정형데이터 분석 텍스트마이닝 웹마이닝 오피니언마이닝 소셜네트워크 분석 정형데이터마이닝 기법 연관관계분석 상품 혹은 서비스 간의 관계를 살펴보고 이로부터 유용한 규칙을 찾아내고자 할 때 이용될 수 있는 기법 두 항목 간 그룹 사이에 강한 연관이 존재하는지에 대한 기술 사건 또는 품목 간에 일어나는 연관성을 찾아내는 것 요소간의 연관성 패턴 분석 가능 -> 장바구니 분석을 통한 상품 추천이나 상품 진열 등에 유용하게 사용 이해하기 쉽고 명쾌한 특성을 지니며 실질적인 정보 도출 가능 마케팅 문제 뿐만 아니라 광범위한 의사 결..
[Biomedical Data Science] - 4. 데이터 마이닝
[Biomedical Data Science] - 4. 데이터 마이닝 데이터마이닝의 개념 의미 있는 패턴과 규칙을 발견하기 위해서 자동화되거나, 반자동화된 도구를 이용해서 대량의 데이터를 탐색하고 분석하는 과정 데이터에 함축되어 있으나 이전에는 발견되지 않은 잠재적으로 유용한 정보를 새롭게 추출 -> 과거 행위의 분석을 기초로 미래 행위 예측 데이터마이닝의 특징 대용량의 관측 가능한 자료(실험자료-계획적 / 관측자료-비계획적) 컴퓨터 중심적 방법(컴퓨터의 처리 속도와 연산 능력) 경험적 방법에 근거(이론 x) 일반화에 초점(에측모형이 새로운 자료에 얼마나 잘 적응하는가?) 데이터마이닝의 활용 분야 통계학, 패턴인식, 뉴로컴퓨팅, 기계학습 데이터베이스 마케팅 신용평가(신용거래 대출한도 추정) 품질관리(불량..
[Biomedical Data Science] - 3. 바이오헬스 산업과 빅데이터
[Biomedical Data Science] - 3. 바이오헬스 산업과 빅데이터 바이오헬스 산업의 국내외 시장 동향 바이오헬스 산업은 4차 산업혁명의 핵심분야로 떠오르면서 전 세계적으로 관심이 집중되고 있음 한국의 바이오헬스 산업은 2017년 1월 기준 약 30조원의 규모임 -> 제약 산업, 바이오 산업(5조), 의료기기 산업(5조), 바이오의약품 산업(2조) 의료 패러다임이 치료에서 예방/진단 중심으로 변화함. 고령화 추세, 건강에 대한 관심 고조 및 웰빙에 대한 사회적 분위기 확산 바이오헬스 산업의 국내외 상업화 사례 국내 바이오헬스 산업 상업화 사례 안트로젠의 큐피스템(줄기세포치료제) 파미셀의 에이엠아이(자가골수유래 중간엽줄기세포 이용) 테고사이언스의 배양피부칼로덤 (타인의 피부 사용) 셀트리온의..
[Biomedical Data Science] - 2. 바이오헬스 빅데이터의 특징과 이슈
바이오헬스 빅데이터의 정의 빅데이터 처리 기법을 활용해 방대한 바이오 정보를 효율성 있게 정리·해석하고 그 생물 및 의학적인 의미를 밝혀 새로운 지식 및 서비스를 개발하는 것(생명과학 + 헬스케어) 바이오헬스: 생명시스템의 다양한 생체상태에 관해 생체정보, 뇌과학, 의료기기, ICT 융합 기반으로 동작원리를 이해하고 이를 제어하여 생체상태 식별, 선제적 예방, 맞춤 관리 및 질병의 진단, 치료에 활용하는 차세대스마트 의료기술 바이오헬스 산업 맞춤의료: 유전체 연구 - 유전체 분석 서비스, 바이오 칩, 맞춤형 표적치료제, IT 융합 맞춤의료서비스 재생의료: 줄기세포 연구 - 세포치료, 조직 재생, 바이오 장기 바이오의약: 유전자재조합기술 - 항체치료제, 바이오 시밀러, 비정형데이터 바이오헬스 빅데이터의 특..
[Biomedical Data Science] - 1. 빅데이터 개요
빅데이터의 등장 배경 기업의 고객 데이터 트래킹/수집행위 증가 미디어 콘텐츠와 콘텐츠 사용에 관한 정보 증가(대용량 멀티미디어 콘텐츠) SNS의 비정형 확산과 비정형 데이터의 폭증(비정형 데이터->데이터의 복잡성 증가) M2M 확산에 따른 센서 저변 확대 => 빅데이터 필요성 증가 빅데이터 현상은 없었던 것이 새로 등장한 것이 아님 기존의 데이터 처리 방식, 다루는 사람과 조직 차원에서 일어나는 변화임. 산업계: 고객 데이터 축척 양이 증가 학계: 거대 데이터를 활용한 연구 확산 기술업계: 디지털화, 저장기술, 인터넷보급, 모바일 혁명, 클라우드컴퓨팅 관련 기술 발전 빅데이터 관련 주요 이슈 빅데이터 가치에 대한 실증적 접근, 프라이버시 침해 점증, 인력수급 불균형 심화, 빅데이터의 실시간성과 빅데이터 ..