[MIT] Data Science - 5. Random Walks
Data Science, ML/MIT- Introduction to Data Science

[MIT] Data Science - 5. Random Walks

Introduction to Computational Thinking and Data Science
(6.0002, Fall 2016)

 

Introduction to Computational Thinking and Data Science

6.0002 is the continuation of 6.0001 Introduction to Computer Science and Programming in Python and is intended for students with little or no programming experience. It aims to provide students with an understanding of the role computation can play in sol

ocw.mit.edu

MIT 공대의 "Introduction to Computational Thinking and Data Science"(6.0002, Fall 2016) 강의 정리 자료

 

핵심 키워드

  • 무작위 행보(Random Walks)
  • 위생 검사(Sanity Check)

 

학습 내용

무작위 행보(Random Walks)

  • 많은 영역에서 중요
    • 주식 시장에서 가격의 움직임을 입증하는데 가장 좋은 모델
    • 현대의 많은 포트폴리오 분석이 기반을 두고 있음
    • 전파를 모델링할 때도 랜덤 워크를 사용, 열 전파나 분자의 전파
  • 우리 주변의 세계를 이해하기 위해 시뮬레이션을 어떻게 사용할지에 대한 좋은 사례를 제공
  • 추상적인 것들을 다루면서 프로그래밍과 소프트웨어 엔지니어링을 같이 진행!
  • 강의의 예시 : 술 취한 사람의 걸음과 편향성을 가진 술 취한 사람의 걸음 차이를 파악

 

위생 검사(Sanity Check)

  • 시뮬레이션을 생성할 땐 위생 검사가 필요
  • 시뮬레이션이 실제로 말이 되는지 확인하는 과정
    • 의심을 가져야 함
    • 코드에 버그가 있을 수 있음!
  • 사용할 수 있는 Python 라이브러리
    • Numpy: 벡터 행렬 그리고 많은 고수준의 수학적인 함수 제공
    • SciPy: 과학자들에게 유용한 수학적 클래스와 함수 제공
    • Matplotlib: 그래프를 그리기 위한 객체 지향 API 제공
    • PyLab: MATLAB과 비슷한 인터페이스를 제공하는 라이브러리

 

정리

  • 랜덤 워크를 하는 요점은 시뮬레이션 모델이 아닌 어떻게 만드는지에 관한 것
  • 클래스를 정의하는 것부터 한번의 시도와 여러 번의 시도에 대응하는 함수를 만들고 결과를 보는 과정
  • 시뮬레이션에 점진적 변화를 줘서 다른 문제를 조사할 수 있음
  • 처음엔 간단한 시뮬레이션으로 시작해 잘 되지 않는 이유를 알고, Sanity check로 잘못된 것을 체크
  • plot 스타일로 그래프를 그림

 

 

 

 

 

 

실습 코드

 

MIT_Reference_code.zip

 

drive.google.com

 

728x90