[Biomedical Data Science] - 6. 비정형 데이터마이닝
Bioinformatics/Biomedical Data Science

[Biomedical Data Science] - 6. 비정형 데이터마이닝

[Biomedical Data Science] - 6. 비정형 데이터마이닝

 

비정형 데이터마이닝의 개념

정형화되지 않은 데이터
  • 미리 정의된 데이터 모델을 가지고 있지 않은 데이터
  • 불규칙 정도에 따라 반정형 데이터로 구분하기도 함

 

반정형데이터

어의적 요소를 분리시키고 데이터 내의 레코드와 필드의 계층구조가 있게 하는 태그나 다른 마커를 포함하고 있는 정형 데이터임

 

비정형데이터의 예

책, 저널 문서, 메타, 데이터, 건강기록, 오디오, 비디오, 아날로그 데이터, 이미지, 파일, 비정형 텍스트, 비표준 텍스트 등

 

텍스트마이닝

인간의 언어로 이루어진 이러한 비정형 텍스트 데이터들을 자연어 처리 방식을 이용해서 대규모 문서에서 정보를 추출하거나, 연계성을 파악하거나, 또는 분류나 군집화, 요약 등 빅데이터에 숨겨진 의미를 발견하는 기법

 

웹마이닝

데이터마이닝 기술의 응용 분야로서 인터넷을 통해 웹 서비스를 이용하면서 웹에서 패턴을 발견하는 기법

 

오피니언마이닝

문서, 문장, 특징, 관점 수준에서 표현된 견해가 긍정적인지, 부정적인지, 중립적인지, 진보적인지 주어진 텍스트의 특성을 분류하는 기법
728x90