[Biomedical Data Science] - 6. 비정형 데이터마이닝
비정형 데이터마이닝의 개념
정형화되지 않은 데이터
- 미리 정의된 데이터 모델을 가지고 있지 않은 데이터
- 불규칙 정도에 따라 반정형 데이터로 구분하기도 함
반정형데이터
어의적 요소를 분리시키고 데이터 내의 레코드와 필드의 계층구조가 있게 하는 태그나 다른 마커를 포함하고 있는 정형 데이터임
비정형데이터의 예
책, 저널 문서, 메타, 데이터, 건강기록, 오디오, 비디오, 아날로그 데이터, 이미지, 파일, 비정형 텍스트, 비표준 텍스트 등
텍스트마이닝
인간의 언어로 이루어진 이러한 비정형 텍스트 데이터들을 자연어 처리 방식을 이용해서 대규모 문서에서 정보를 추출하거나, 연계성을 파악하거나, 또는 분류나 군집화, 요약 등 빅데이터에 숨겨진 의미를 발견하는 기법
웹마이닝
데이터마이닝 기술의 응용 분야로서 인터넷을 통해 웹 서비스를 이용하면서 웹에서 패턴을 발견하는 기법
오피니언마이닝
문서, 문장, 특징, 관점 수준에서 표현된 견해가 긍정적인지, 부정적인지, 중립적인지, 진보적인지 주어진 텍스트의 특성을 분류하는 기법
728x90
'Bioinformatics > Biomedical Data Science' 카테고리의 다른 글
[Biomedical Data Science] - 8. 바이오헬스와 데이터 모델링 (0) | 2021.07.20 |
---|---|
[Biomedical Data Science] - 7. 바이오헬스 데이터 (0) | 2021.07.12 |
[Biomedical Data Science] - 5. 정형 데이터마이닝 (0) | 2021.06.18 |
[Biomedical Data Science] - 4. 데이터 마이닝 (0) | 2021.06.18 |
[Biomedical Data Science] - 3. 바이오헬스 산업과 빅데이터 (0) | 2021.06.18 |