🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자! https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 📝목차 1. loc를 활용한 데이터 추출 2. iloc를 활용한 데이터 추출 ※ !! loc와 iloc의 차이는 loc는 '변수명'을 기준으로 데이터프레임을 ..
* 본 포스팅은 1월 27일 제3회 CDS 빅데이터 경진대회에서 푼 문제에 대한 내용입니다. 스스로 생각하고 푼 것이라 틀린 부분이 많을수도 있다는 점 양해 부탁드립니다. 전처리 과정 건물별 발전량 데이터와(cds2_data.csv) 건물정보(cds2_building_metadata.csv)를 user_id 기준으로 결합 1.번 데이터와 날씨 데이터(cds2_weather.csv)를 datetime과 region_id 기준으로 결합 Missing Value를 이용해서 construct_year과 num_floors를 mean값으로 바꿈 (mean값으로 한 이유 : 발전량을 예측하는 데 있어 별 의미 없는 변수라고 생각해서 mean값 사용, 결론적으로 Backward Feature Elimination에서..
https://www.acmicpc.net/problem/1439 1439번: 뒤집기 다솜이는 0과 1로만 이루어진 문자열 S를 가지고 있다. 다솜이는 이 문자열 S에 있는 모든 숫자를 전부 같게 만들려고 한다. 다솜이가 할 수 있는 행동은 S에서 연속된 하나 이상의 숫자를 잡고 모 www.acmicpc.net 문제 다솜이는 0과 1로만 이루어진 문자열 S를 가지고 있다. 다솜이는 이 문자열 S에 있는 모든 숫자를 전부 같게 만들려고 한다. 다솜이가 할 수 있는 행동은 S에서 연속된 하나 이상의 숫자를 잡고 모두 뒤집는 것이다. 뒤집는 것은 1을 0으로, 0을 1로 바꾸는 것을 의미한다. 예를 들어 S=0001100 일 때, 전체를 뒤집으면 1110011이 된다. 4번째 문자부터 5번째 문자까지 뒤집으면..
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자! https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 시리즈(Series) ☑️소개 시리즈는 인덱스가 있는 1차원 배열이며, 데이터프레임 각 열이 시리즈이다. 즉, 데이터프레임은 시리즈들이 모여서 형성한다고 할 ..
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자! https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 데이터 복사 ☑️ copy() 이용 일단 얕은 복사 예시 import pandas as pd korean =['가','나','다'] english =['K',..
https://www.acmicpc.net/problem/25391 25391번: 특별상 주최자가 첫 번째와 네 번째 학생을 골라서 특별상을 줄 경우 심판은 자신이 매긴 점수에 따라 두 번째, 여섯 번째, 일곱 번째 학생에게 상을 주게 된다. 이때 상을 받은 $5$명의 작품에 대해 주최 www.acmicpc.net 풀이 처음에 예제에 있는 설명을 보고 주최자가 준 점수가 높지만 심판이 준 점수가 낮아서 특별상으로 뽑는다 -> 하지만 첫 번째 학생이 그렇지 않음 주최자가 준 점수 - 심판이 준 점수를 계산해서 할려고 했지만 실패 도저히 아이디어가 안 떠올라서 질문게시판에 반례를 봤는데 이걸 보고 깨달았다. 무조건 본상을 수여한 학생은 심판 점수가 높으니, 본상을 수여하는 사람 수만큼 뽑고, 그 후 본상을 ..
🔉 빅데이터 분석을 편리하게 해주는 파이썬 라이브러리인 Pandas에 대해 공부해보자! https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org 📝목차 1. 데이터 프레임 생성 2. column명 추출 & 변경 1. 데이터 프레임 생성 ☑️ list를 사용해서 데이터 프레임 만들기 import pand..
https://www.acmicpc.net/problem/2630 2630번: 색종이 만들기 첫째 줄에는 전체 종이의 한 변의 길이 N이 주어져 있다. N은 2, 4, 8, 16, 32, 64, 128 중 하나이다. 색종이의 각 가로줄의 정사각형칸들의 색이 윗줄부터 차례로 둘째 줄부터 마지막 줄까지 주어진다. www.acmicpc.net 문제 아래 과 같이 여러개의 정사각형칸들로 이루어진 정사각형 모양의 종이가 주어져 있고, 각 정사각형들은 하얀색으로 칠해져 있거나 파란색으로 칠해져 있다. 주어진 종이를 일정한 규칙에 따라 잘라서 다양한 크기를 가진 정사각형 모양의 하얀색 또는 파란색 색종이를 만들려고 한다. 전체 종이의 크기가 N×N(N=2k, k는 1 이상 7 이하의 자연수) 이라면 종이를 자르는 규..
https://www.acmicpc.net/problem/1780 1780번: 종이의 개수 N×N크기의 행렬로 표현되는 종이가 있다. 종이의 각 칸에는 -1, 0, 1 중 하나가 저장되어 있다. 우리는 이 행렬을 다음과 같은 규칙에 따라 적절한 크기로 자르려고 한다. 만약 종이가 모두 같은 수 www.acmicpc.net 문제 N×N크기의 행렬로 표현되는 종이가 있다. 종이의 각 칸에는 -1, 0, 1 중 하나가 저장되어 있다. 우리는 이 행렬을 다음과 같은 규칙에 따라 적절한 크기로 자르려고 한다. 만약 종이가 모두 같은 수로 되어 있다면 이 종이를 그대로 사용한다. (1)이 아닌 경우에는 종이를 같은 크기의 종이 9개로 자르고, 각각의 잘린 종이에 대해서 (1)의 과정을 반복한다. 이와 같이 종이를 ..
QGIS의 대표적인 기능 중 하나인 경사도 분석을 대해서 쓰려고 한다. 🙌 1️⃣ 국가공간정보포털 - 오픈마켓 행정경계 구역별 데이터를 가져오기 위해 오픈마켓에 들어간다. 스크롤 내리다보면 수치표고모델(DEM)이 나온다. 구하고자 하는 지역을 다운하고 난 후 압축파일에서 img파일만 압축해제한다. 이 글에서는 부산광역시 영도구의 경사도를 구해보겠다. 2️⃣ QGIS 실행후 드래그 앤 드롭 구하고자 하는 지역의 img파일을 띄운 후 웹 - TMS for korea 에서 kakao hybrid를 클릭후 지도를 중첩해준다. https://jxxngho.tistory.com/10 [QGIS] 지도(카카오맵, 구글지도) 데이터 불러오기 아래 사진은 부산 지하철역 위치 데이터이다. 좌표가 정확한지 확인하기 위해 사..