pandas 5

3. 샘플 문제로 함께 알아보는 [데이터 분석] 파트 내용 정리하기 (1) 시각화, 전처리

데이터 분석 파트는 총 4~5문항으로 구성되며, 전체 배점은 데이터 탐색 파트와 동일하게 30점이다.상세 항목은 아래와 같이 구성되어 있다.1. 데이터 시각화 (상관분석 등) 2. 데이터 전처리 (결측치 처리, 라벨 인코딩/원핫 인코딩)3. xy 데이터 분리4. 데이터 정규분포화5. 표준화 이번 글에서는 1, 2를 중점적으로 정리하였다. 1. 데이터 시각화시각화 방법은 다양하므로, 샘플 문제에서 등장한 메소드를 중심으로 살펴보겠다. (1) 데이터 개수의 분포를 보여주는 countplot 그래프import seaborn as snssns.countplot(x='col1', data=df)  (2) 두 변수의 분포와 관계를 함께 나타내는 jointplot 그래프import seaborn as snssns.j..

Certifications/AICE 2024.06.20

2. AICE [데이터 탐색] 파트 내용 정리하기

데이터 탐색 파트는 총 5~6문항으로 구성되며, 전체 배점은 30점이다.상세 항목은 아래와 같이 구성되어 있다.1. 필요한 라이브러리 설치2. Tabular 데이터 가져오기3. 데이터의 구성 확인 AICE에서 제공하는 샘플 문제를 기반으로 하여 데이터 탐색 파트 풀이 방법을 구체적으로 알아보자.  1. 필요한 라이브러리 설치pandas, numpy, sklearn, matplotlib, seaborn 등 필요한 라이브러리를 import 하고 별칭을 할당하는 문제가 등장한다.이 때는 아래와 같이 문제에서 요구하는 라이브러리를 호출하고 별칭을 설정해주면 된다.import pandas as pd # pandasimport numpy as np # numpyimpor..

Certifications/AICE 2024.06.20

[KT AIVLE/2024.02.26] 한기영 강사님의 [데이터 처리] 강의 정리: Numpy, Pandas 라이브러리 심화

목차1. 서론2. 실습 환경3. 수업 내용 요약4. 상세 내용5. 느낀 점   1. 서론판다스나 넘파이를 필요할 때 필요한 기능만 검색해서 사용했었는데, 이렇게 함수를 구체적으로 이해하며 학습하니 더 머리에 잘 들어오는 것 같다. 유사한 함수들끼리 비교하면서 서로 어떤 차이가 있는지 파악할 수도 있어서 좋다. 이번 주는 스터디 준비랑 병행하면서 조금 정신이 없었는데, 얼른 전부 정리해버리고 기존에 계획했던 자격증 공부도 시작할 수 있게 준비하자. 힘들지만 이겨내고 꾸준히 해야 관성이 생긴다, 화이팅!(그러나 4일차도 여전히 코드 부분은 일단 생략하고 주말에 채워넣는 것으로 하겠다.)  2. 실습 환경- 3일차와 동일하게 Jupyter 환경에서 numpy, pandas 라이브러리가 설치되어 있다는 전제 하..

Education 2024.02.28

[KT AIVLE/2024.02.23] 한기영 강사님의 [Python Library] 강의 정리: Numpy, Pandas 라이브러리의 이해

목차1. 서론2. 실습 환경3. 수업 내용 요약4. 상세 내용5. 느낀 점   1. 서론오늘은 사실 5일차 수업인데 3일차 수업부터 블로그 포스팅이 밀려서 부랴부랴 남기고 있다. 매일 복습은 꾸준히 했는데 노션 정리 따로, 에이블스쿨 우리반 게시판에 정리 따로, 블로그 포스팅 따로 이렇게 세 번 글을 정리하려고 하니까 조금 비효율적인 것 같다. 효율적으로 정리할 수 있는 방법을 찾아야겠다. 그러나 이상하더라도 꾸준히 하는 것이 더 중요하다. 좋은 결과만 보여주려고 멈추면 결국 안 하게 되니까. 조금씩 변하더라도 일단 계속 하긴 하자.3일차 수업을 정리하려고 하는데 계속 한기영 강사님의 "한기영 강사님 밉다, 라고 쓰면 안 돼요~" 라는 말이 머리 속에 멤돈다. (ㅋㅋ) 한기영 강사님 수업을 4일째(2일차..

Education 2024.02.27

[Package][pandas] 데이터(csv, excel) 불러오기 & 저장하기

Summary - csv 파일이나 excel 파일을 dataframe 형태로 불러오거나, 혹은 dataframe을 csv나 excel 파일 형태로 저장할 때 아래와 같은 코드를 사용할 수 있다. - 엑셀 파일이 너무 커서 열리지 않을 때나 열어서 바로 분석하고 싶을 때 등등 아래 기능들을 활용할 수 있다. - 함수별로 파라미터를 추가적으로 하나씩 더 붙여서 소개하였으나, 다양한 파라미터가 있으니 첨부된 링크를 확인해보자. - 참고로 불러올 때는 함수 형태로 사용하지만 저장할 때는 메소드 형태로 사용한다. 즉, 불러올 때는 pandas.read_excel()과 같은 형태로 라이브러리에서 함수를 호출하는 형태이지만, 저장할 때는 생성된 데이터프레임을 저장하는 것이므로 (저장할 데이터프레임 변수 명).to_e..

Developer/Python 2023.05.09