Introduction to Computational Thinking and Data Science
(6.0002, Fall 2016)
MIT 공대의 "Introduction to Computational Thinking and Data Science"(6.0002, Fall 2016) 강의 정리 자료
핵심 키워드
- 무작위 행보(Random Walks)
- 위생 검사(Sanity Check)
학습 내용
무작위 행보(Random Walks)
- 많은 영역에서 중요
- 주식 시장에서 가격의 움직임을 입증하는데 가장 좋은 모델
- 현대의 많은 포트폴리오 분석이 기반을 두고 있음
- 전파를 모델링할 때도 랜덤 워크를 사용, 열 전파나 분자의 전파
- 우리 주변의 세계를 이해하기 위해 시뮬레이션을 어떻게 사용할지에 대한 좋은 사례를 제공
- 추상적인 것들을 다루면서 프로그래밍과 소프트웨어 엔지니어링을 같이 진행!
- 강의의 예시 : 술 취한 사람의 걸음과 편향성을 가진 술 취한 사람의 걸음 차이를 파악
위생 검사(Sanity Check)
- 시뮬레이션을 생성할 땐 위생 검사가 필요
- 시뮬레이션이 실제로 말이 되는지 확인하는 과정
- 의심을 가져야 함
- 코드에 버그가 있을 수 있음!
- 사용할 수 있는 Python 라이브러리
- Numpy: 벡터 행렬 그리고 많은 고수준의 수학적인 함수 제공
- SciPy: 과학자들에게 유용한 수학적 클래스와 함수 제공
- Matplotlib: 그래프를 그리기 위한 객체 지향 API 제공
- PyLab: MATLAB과 비슷한 인터페이스를 제공하는 라이브러리
정리
- 랜덤 워크를 하는 요점은 시뮬레이션 모델이 아닌 어떻게 만드는지에 관한 것
- 클래스를 정의하는 것부터 한번의 시도와 여러 번의 시도에 대응하는 함수를 만들고 결과를 보는 과정
- 시뮬레이션에 점진적 변화를 줘서 다른 문제를 조사할 수 있음
- 처음엔 간단한 시뮬레이션으로 시작해 잘 되지 않는 이유를 알고, Sanity check로 잘못된 것을 체크
- plot 스타일로 그래프를 그림
실습 코드
728x90
'Data Science, ML > MIT- Introduction to Data Science' 카테고리의 다른 글
[MIT] Data Science - 7. Confidence Intervals (0) | 2021.05.27 |
---|---|
[MIT] Data Science - 6. Monte Carlo Simulation (0) | 2021.05.26 |
[MIT] Data Science - 4. Stochastic Thinking (0) | 2021.05.26 |
[MIT] Data Science - 3. Graph-theoretic Models (0) | 2021.05.26 |
[MIT] Data Science - 2. Optimization Problems (0) | 2021.05.26 |