728x90
728x90
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자!
시리즈(Series)
☑️소개
시리즈는 인덱스가 있는 1차원 배열이며, 데이터프레임 각 열이 시리즈이다. 즉, 데이터프레임은 시리즈들이 모여서 형성한다고 할 수 있다. 각 셀마다 서로 다른 자료형을 넣을 수 있다는 특징이 있다.
☑️시리즈 생성 및 접근
1)
dic = {'가':1,'나':2,'다':3} # 딕셔너리로 시리즈 만들기
ser = pd.Series(dic)
ser
output:
2)
ser = pd.Series([1,2,3],index=['가','나','다']) # index 인자 사용
ser
output:
(리스트와 다른 점은 인덱스 옵션이 존재하다는 것이다. 인덱스 요소 미설정시 기본값 0,1,2 ...)
첫번째 열(가,나,다)는 인덱스 값이며 두번째 열(1,2,3)은 하나의 값으로 구성되어있다. 각각의 값에 접근하려면 첫번째 열 index 로 두번째 열은 values 로 접근할 수 있다.
ser.index # 첫번째 열
output:
ser.values # 두번째 열
output:
ser.values[1] # 두번째 열의 첫번째 요소
output:
☑️ 삽입
series['컬럼명'] = value 형식으로 삽입하면 된다. 파이썬에서 흔히 쓰는 딕셔너리와 동일하다.
ser['라']=4 # 삽입
ser
output:
☑️ name 속성
name 속성을 이용해서 시리즈 데이터에 이름을 붙일 수 있다. index.name 속성으로 시리즈의 인덱스에도 이름을 붙일 수 있다.
korean.name = "한국어"
korean.index.name="훈민정음"
korean
output:
☑️ 데이터프레임과 시리즈
데이터프레임 생성
import pandas as pd
korean =['가','나','다']
english =['K','N','D']
df = pd.DataFrame({"한국어":korean, "영어": english})
df
output:
korean = df['한국어'] # 데이터프레임에서 괄호 안에 열인덱스 또는 열이름을 넣어주면 Series 형식으로 가져온다.
korean
output:
type(korean) # 타입확인
output:
728x90
728x90
'Programming > Pandas' 카테고리의 다른 글
[Pandas] 데이터 정렬(sort_values, sort_index) (0) | 2023.02.12 |
---|---|
[Pandas] 조건에 맞는 데이터 추출 (0) | 2023.02.12 |
[Pandas] 원하는 위치의 데이터 추출(loc, iloc) (0) | 2023.02.12 |
[Pandas] 데이터 복사(copy(), 깊은 복사, 얕은 복사) (0) | 2023.02.05 |
[Pandas] 데이터 프레임 생성, 컬럼명 추출&변경 (0) | 2023.02.03 |