파이썬 데이터 분석에서 기본 자료 구조로 넘파이(NumPy) 와 판다스(pandas)를 자주 사용한다.
▶ NumPy - 과학 계산과 배열에 필요한 수학 패키지.
넘파이 NumPy는 numerical python의 줄임말이고, 고성능 과학 계산과 다차원 배열(array)을 위한 파이썬 패키지이다.
대부분의 파이썬 데이터 분석 패키지는 데이터를 다룰 때 넘파이 배열을 사용한다.
▶ pandas - 숫자와 문자를 섞어 표처럼 사용하는 데이터프레임 제공, 데이터분석 전문패키지
판다스 pandas는 파이썬 데이터 분석을 위한 전문 패키지이다. 판다스는 마이크로소프트 엑셀(execl)의 시트(sheet)처럼 숫자와 문자를 섞어서 표 형태로 저장할 수 있는 데이터프레임(Data Frame)을 사용한다.
넘파이(numPy)가 과학 계산에 초점을 맞추고 있다면, 판다스는 편리한 데이터 처리와 분석 작업을 위해 많은 기능을 제공한다.
또 다양한 그래프 출력 기능을 갖추고 있다.
시각화를 위한 파이썬 패키지로
맷플롯립(matplotlib), 시본(seaborn), 보케(bokeh) 같은 시각화 패키지를 많이 사용한다.
▶ matplotlib - 동적, 정적 그래프를 만드는 시각화 패키지
맷플롯립(matplotlib)은 파이썬 시각화를 위한 기본 패키지.
정적 혹은 동적인 그래프를 그리 수 있고, 고품질의 매우 다양한 그래프를 제공한다.
파이썬의 다른 과학 패키지와 호환성이 높다.
▶ SciPy - 수학과 과학 계산 전문 패키지
사이파이(SciPy)는 넘파이(NumPy)를 기반으로 구축된 수학과 과학 계산 전문 패키지이다.
미분, 적분, 확률, 선형대수, 최적화 등을 알고리즘으로 통계를 위해 많이 사용한다.
▶ scikit-learn - 대표적 머신러닝 패키지
사이킷런(scikit-learn)은 파이썬의 독보적인 머신러닝 패키지로 넘파이와 사이파이에 크게 의존한다.
파이썬뿐만 아니라 전체 데이터 과학 분야에서 가장 널리 사용하는 머신러닝 패키지이다.
'▷ AI 인공지능' 카테고리의 다른 글
아파트 실거래가 예측 프로젝트 (0) | 2025.09.12 |
---|---|
머신러닝 vs 딥러닝: 정의, 원리, 차이점 완벽 정리 (10) | 2025.09.01 |
AI 시대, 꼭 알아야 할 인공지능 용어 완벽 정리 (초보자 필독) (5) | 2025.08.31 |
데이터분석 프로세스 - 문제해결 프로세스 7단계 (3) | 2025.08.29 |
<챗gpt 10분만에 일잘러되기> 강의로 업무 효율 200% 높이기 (2) | 2025.04.16 |