본문 바로가기
도서/프로그래밍

[01] Do it! 데이터 분석을 위한 판다스 입문

by 신발사야지 2024. 1. 2.

 

1일차

01 판다스 실습 환경 준비하기

01-1 아나콘다 설치하기

Free Download | Anaconda

01-2 판다스 실습 공부하기

https://github.com/EasysPublishing/do_it_pandas

 

아나콘다 설치 후 Jetbrains ultimate 요금제를 매년 결제하고 있기 때문에

Data Spell을 사용해 책을 진행하려고 한다.

02 판다스 시작하기

판다스는 데이터프레임과 시리즈라는 두 가지 새로운 자료형을 제공하는 데이터 분석용 오픈소스 라이브러리, 스프레드시트 형태의 데이터를 불러와 빠르게 조작, 정렬, 병합할 수 있다.

시리즈는 데이터프레임의 한 열을 나타낸다. 시리즈를 여러 개 모은 딕셔너리나 컬렉션이 판다스의 데이터프레임

판다스의 장점

  1. 자동화
  2. 모든 실행 단계를 기록할 수 있다, 재현성

02-2 데이터셋 불러오기

통계 분석 서비스인 갭마인더에서 제공하는 데이터셋을 이용

 

02장 판다스 시작하기