데이터분석3 데이터분석을 위한 파이썬 필수 패키지 파이썬 데이터 분석에서 기본 자료 구조로 넘파이(NumPy) 와 판다스(pandas)를 자주 사용한다. 데이터분석을 위한 파이썬 필수 패키지▶ NumPy - 과학 계산과 배열에 필요한 수학 패키지.넘파이 NumPy는 numerical python의 줄임말이고, 고성능 과학 계산과 다차원 배열(array)을 위한 파이썬 패키지이다.대부분의 파이썬 데이터 분석 패키지는 데이터를 다룰 때 넘파이 배열을 사용한다. ▶ pandas - 숫자와 문자를 섞어 표처럼 사용하는 데이터프레임 제공, 데이터분석 전문패키지판다스 pandas는 파이썬 데이터 분석을 위한 전문 패키지이다. 판다스는 마이크로소프트 엑셀(execl)의 시트(sheet)처럼 숫자와 문자를 섞어서 표 형태로 저장할 수 있는 데이터프레임(Data.. 2025. 9. 12. 아파트 실거래가 예측 프로젝트 1. AI 대회 소개주제 - 서울 아파트 매매 실거래가 예측 (Regression)평가지표 - RMSE (예측값과 실제값 간 평균 편차)기간 - 2025/9/1(월) ~ 9/11(목)규정 핵심외부 데이터 허용 (단, 평가 데이터 유추 금지)평가 데이터 학습 금지사전학습 가중치 금지 (토크나이저는 허용)팀당 일일 제출 12회2. 목표대회 공식 목표 - RMSE 최소화 (리더보드 기준)우리 팀 목표 - 성능 경쟁보다 학습·지식 공유에 중점각자 전처리·모델링 실습 → 팀 내 설명/공유외부 데이터 탐색 & 아이디어 확장서로 다른 접근법 비교를 통한 학습 극대화3. 환경 세팅서버 환경 세팅*1) 먼저 OpenVPN 설치* VPN 계정을 만들어서 유저네임과 비밀번호를 만들고 따로 저장.OpenVPN을 실행시킨 다음.. 2025. 9. 12. 데이터분석 프로세스 - 문제해결 프로세스 7단계 문제해결 프로세스란?현업의 이슈를 데이터 분석으로 해결하기 위한 프로세스입니다. 1. 문제정의 Define The Problem 기업의 문제상황을 문제현상과 문제 발생으로 인한 기업의 피해로 나누어 정의합니다. 2. 기대효과 Expected Effects - 문제현상을 해결했을 때 기대할 수 있는 효과를 정의합니다. - 기대효과는 정성적이 아닌 정량적으로 작성할 수 있어야 합니다. 3. 해결방안 Solution - 해결하기 위한 방안을 탐색하고 List up합니다. - 해결방은은 꼭 모델링이 아니어도 되며, 간단한 통계분석으로도 해결할 수 있습니다. 4. 우선순위 Prioritize - List up한 해결방안들에 대해서 우선순위를 설저합니다. - 빠르게 수행할 수 있고, 결과를 파악할.. 2025. 8. 29. 이전 1 다음 728x90 반응형