pandas

    [Kaggle] - Pandas

    [Kaggle] - Pandas 2021/02/17 수료 후기 Solveed short hands-on challenges to perfect data manipulation skills.

    파이썬으로 시작하는 데이터 사이언스 3 - Pandas 기초

    Pandas : 수식으로 계산할 수 있고 시각화도 할 수 있는 데이터 분석도구입니다. 엑셀로도 데이터를 분석할 수 있는데 왜 판다스를 사용하는 것일까요? 엑셀로는 힘든 대용량의 데이터를 판다스는 분석할 수 있기 때문입니다. 아래에 첨부된 10 minutes to pandas를 한 번씩 실행해보시면 판다스의 전반적인 것을 익힐 수 있습니다. (다만, 10 minutes는 문서를 스크롤 하는데 걸리는 시간입니다ㅎㅎ 실제로는 더 오래 걸립니다.) 추가로 같이 첨부된 Pandas Cheat Sheet도 추천드립니다. 우선 판다스를 불러보겠습니다. import pandas as pd 일반적으로 as pd라고 정해줍니다. 이는 쉽게 별칭을 지어준다고 보시면 됩니다. 별칭을 지어주시면 나중에 불러올 때 굳이 다 적지..

    [Kaggle] Data Cleaning 데이터 정제

    1. Handling Missing Values Missing Value 처리하기 Drop missing values, or fill them in with an automated workflow. # modules we'll use import pandas as pd import numpy as np # read in all our data nfl_data = pd.read_csv("../input/nflplaybyplay2009to2016/NFL Play by Play 2009-2017 (v4).csv") # set seed for reproducibility np.random.seed(0) # get the number of missing data points per column missing_va..