본문 바로가기
  • 나를 찾는 여행...
▷ AI 인공지능

데이터분석을 위한 파이썬 필수 패키지

by AmosK 2025. 9. 12.
728x90

파이썬 데이터 분석에서 기본 자료 구조로 넘파이(NumPy) 와 판다스(pandas)를 자주 사용한다.


▶ NumPy - 과학 계산과 배열에 필요한 수학 패키지.

넘파이 NumPy는 numerical python의 줄임말이고, 고성능 과학 계산과 다차원 배열(array)을 위한 파이썬 패키지이다.

대부분의 파이썬 데이터 분석 패키지는 데이터를 다룰 때 넘파이 배열을 사용한다.


 

pandas - 숫자와 문자를 섞어 표처럼 사용하는 데이터프레임 제공, 데이터분석 전문패키지

판다스 pandas는 파이썬 데이터 분석을 위한 전문 패키지이다. 판다스는 마이크로소프트 엑셀(execl)의 시트(sheet)처럼 숫자와 문자를 섞어서 표 형태로 저장할 수 있는 데이터프레임(Data Frame)을 사용한다.

넘파이(numPy)가 과학 계산에 초점을 맞추고 있다면, 판다스는 편리한 데이터 처리와 분석 작업을 위해 많은 기능을 제공한다.

또 다양한 그래프 출력 기능을 갖추고 있다. 

 


 

시각화를 위한 파이썬 패키지로

맷플롯립(matplotlib), 시본(seaborn), 보케(bokeh) 같은 시각화 패키지를 많이 사용한다.

 


 

matplotlib - 동적, 정적 그래프를 만드는 시각화 패키지

맷플롯립(matplotlib)은 파이썬 시각화를 위한 기본 패키지.

정적 혹은 동적인 그래프를 그리 수 있고, 고품질의 매우 다양한 그래프를 제공한다. 

파이썬의 다른 과학 패키지와 호환성이 높다.

 


 

SciPy - 수학과 과학 계산 전문 패키지

사이파이(SciPy)는 넘파이(NumPy)를 기반으로 구축된 수학과 과학 계산 전문 패키지이다.

미분, 적분, 확률, 선형대수, 최적화 등을 알고리즘으로 통계를 위해 많이 사용한다.


 

scikit-learn - 대표적 머신러닝 패키지

사이킷런(scikit-learn)은 파이썬의 독보적인 머신러닝 패키지로 넘파이와 사이파이에 크게 의존한다.

파이썬뿐만 아니라 전체 데이터 과학 분야에서 가장 널리 사용하는 머신러닝 패키지이다.

728x90
728x90