728x90
728x90
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자!
📝목차
1. 컬럼 추가
2. 컬럼 삭제
3. 레코드 추가
4. 레코드 삭제
먼저 사용할 데이터 선언
import pandas as pd
# list를 이용해서 데이터 프레임 만들기
name_list = ["안유진","가을","레이","장원영","리즈","이서"]
korean_list = [90,85,70,87,85,85]
english_list = [95,85,87,94,74,84]
df = pd.DataFrame({"name": name_list,"korean": korean_list, "english": english_list})
df
output:
1. 컬럼 추가
- df['컬럼명'] = '값' # 레코드 수만큼 값으로 초기화
df['math'] = 100 # 컬럼 추가
df
output:
- df['컬럼명'] = [값, 값, 값 ...]
df['math']=[97,86,84,88,90,92]
df
output:
- loc를 이용한 컬럼 추가 - df.loc[df['컬럼명']... , ' 컬럼명' ] = ' 값'
df['결과']='불합격' # 결과 컬럼 생성 후 불합격으로 초기화
# 국영수 총합이 260이상일 시 결과 컬럼 합격으로 대입
df.loc[df['korean']+df['english']+df['math']>=260,'결과']='합격'
df
output:
2. 컬럼 삭제
- df.drop(컬럼명, axis = 1)
df = df.drop('결과',axis=1) # 결과 컬럼 삭제, axis=1은 열 의미
df
output:
3. 레코드 추가
- df.append({컬럼명 : 값}, ignore_index = True)
df.append({'name': '판다스','korean' : 90, 'english' : 85, 'math': 88}, ignore_index = True)
output:
- df.loc[인덱스 번호] = [값, 값, 값...]
df.loc[7] = ['파이썬',50,100,100]
df
output:
4. 레코드 삭제
- df.drop(컬럼명)
df = df.drop([6,7]) # 6,7 레코드 삭제
df
output:
- 조건에 따른 레코드 삭제
df = df.drop(df[df['english']<90].index)
# english 점수가 90미만인 레코드 삭제
df
output:
728x90
728x90
'Programming > Pandas' 카테고리의 다른 글
[Pandas] 함수를 활용해서 데이터 변환 (map, apply, applymap) (0) | 2023.02.16 |
---|---|
[Pandas] 타입 변환(astype(), pd.to_datetime(), pd.to_numeric()) (0) | 2023.02.15 |
[Pandas] 결측값 처리(isnull(), dropna(), fillna()) (0) | 2023.02.15 |
[Pandas] 데이터 정렬(sort_values, sort_index) (0) | 2023.02.12 |
[Pandas] 조건에 맞는 데이터 추출 (0) | 2023.02.12 |