728x90
728x90
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자!
📝목차
1. loc를 활용한 데이터 추출
2. iloc를 활용한 데이터 추출
※ !! loc와 iloc의 차이는 loc는 '변수명'을 기준으로 데이터프레임을 분리하고, iloc는 '인덱스 번호'로 분류한다.
1. loc를 활용한 데이터 추출
- location의 줄인 말로 데이터 프레임의 행 라벨 기준으로 데이터를 읽을 때 사용한다.
일단 csv파일을 불러온 후 df 변수에 선언했다.
import pandas as pd
df = pd.read_csv("/content/2021 부산 50_100.csv",encoding='euc-kr')
df
output:
☑️ 하나의 특정 행을 추출할 경우
- - df.loc[행 이름] - Series 형태로 출력
df.loc[0] # 1개의 특정 행만 추출
output:
- df.loc[[행 이름]] - DataFrame 형태로 출력
df.loc[[0]] # 1개의 특정 행만 추출
output:
☑️ 여러 개의 특정 행을 가져오고 싶을 경우
- - df.loc[[행 이름, 행 이름,...]]
df.loc[[0,1,3]] # 여러 개의 특정 행을 가져오고 싶을 경우
output:
☑️ 슬라이싱
- df.loc[행 이름 : 행 이름]
df.loc[2:5] # 슬라이싱
output:
☑️ loc를 이용한 특정 위치의 값 추출
- df.loc[행 이름, 열 이름]
📌대청동의 50~54세 인구를 구해주세요.
df.loc[2,'50~54세'] # 특정 값 조회
output:
☑️ loc를 이용한 특정 범위 추출
- df.loc[행 이름 : 행 이름, 열 이름 : 열 이름]
📌5번째 행부터, '50~54세' 열 부터'60~64세' 열만 추출해주세요.
df.loc[5:, '50~54세':'60~64세'] # 특정 범위 추출
output:
2. iloc를 활용한 데이터 추출
- integer location의 줄인 말로 데이터 프레임의 인덱스 기준으로 데이터를 읽을 때 사용한다
- loc보다 적게 사용되며 주로 특정 행 값으로 슬라이싱 할 때 사용된다.
- 인덱스번호(숫자)로 접근한다.
#iloc 사용
df.iloc[:5,0:2] # 5번째 행까지 0,1번째 열만 추출
output:
# 마지막 행
df.iloc[-1]
output:
# 마지막 열 접근
df.iloc[:,-1]
output:
728x90
728x90
'Programming > Pandas' 카테고리의 다른 글
[Pandas] 데이터 정렬(sort_values, sort_index) (0) | 2023.02.12 |
---|---|
[Pandas] 조건에 맞는 데이터 추출 (0) | 2023.02.12 |
[Pandas] 시리즈(Series) 기초 (0) | 2023.02.05 |
[Pandas] 데이터 복사(copy(), 깊은 복사, 얕은 복사) (0) | 2023.02.05 |
[Pandas] 데이터 프레임 생성, 컬럼명 추출&변경 (0) | 2023.02.03 |