Recent Posts
Recent Comments
Archives
반응형
250x250
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Today
Yesterday

Total
04-25 06:29
관리 메뉴

Hey Tech

[파이썬] pandas를 활용한 열, 행 선택하기 본문

AI & 빅데이터/데이터 분석 with Python

[파이썬] pandas를 활용한 열, 행 선택하기

Tony Park 2021. 1. 23. 15:35
728x90
반응형

오늘은 파이썬 pandas 라이브러리를 통해 엑셀에서 특정 열(column)이나 행(row)을 불러오는 방법을 공유해 드립니다.

바로 시작하죠!

1.  pandas 라이브러리 import

import pandas as pd

pandas 설치가 안된 경우: 아래 코드를 커맨드라인/터미널/주피터노트북 환경 중에서 설치부터 진행해 주세요.

pip install pandas

2.  데이터셋 불러오기

# 파일이 xlsx 형식인 경우,
dataset = pd.read_excel([파일경로], sheet_name = [불러올 시트 이름])

# 파일이 csv 형식인 경우,
dataset = pd.read_csv([파일경로], sheet_name = [불러올 시트 이름])

 

파일 경로를 대괄호([]) 안에 따옴표('')안에 입력해 주세요.

그리고 불러올 시트 이름을 sheet_name 파라미터에 입력해 줍니다.

아래는 데이터셋 불러오는 예시코드입니다.

# 데이터셋 불러오기 예시
dataset = pd.read_excel('./dataset_files/example.xlsx', sheet_name = 'Sheet1')

3.  열 선택하기

3.1.  단일 열(column) 선택

dataset['col1']

불러오고 싶은 칼럼의 이름을 따옴표('') 안에 입력해 주세요.

3.2.  여러 개 열(column) 선택

dataset[['col1', 'col2']]

불러오고 싶은 칼럼이 여러 개일 경우네는 대괄호 세트를 하나 더 추가한 뒤,

칼럼들을 따옴표 세트 안에 각각 입력해 줍니다.

4.  행 선택하기

4.1. 단일 행(row) 선택

dataset.loc[rowNUmber]

행을 불러올 때는 위의 코드와 같이 loc 메소드를 사용합니다.

불러오고 싶으신 행의 번호를 입력해 주세요.

참고로, 파이썬에서 행 번호와 같이 숫자형 데이터에는 따옴표로 묶어줄 필요가 없으니

바로 숫자만 입력해 주시길 바랍니다.

4.2. 여러 행(row) 선택

4.2.1. 특정 행들만 선택

dataset.loc[[rowNUmber1, rowNumber2]]

특정 번호의 행만 불러오고 싶으신 경우에는 여러 개의 열을 불러올 때와 마찬가지로,

대괄호 세트를 하나 더 추가해 주신 후에 불러오고 싶으신 행 번호를 각각 입력해 주세요.

4.2.2 연이은 행 모두 선택

dataset.loc[rowNUmber1:rowNumber2]

만약 불러오고 싶으신 행들이 연달아 이어져 있다면 행 번호를 하나하나 입력할 필요가 없습니다.

콜론(:)을 중심으로 좌측에 불러오고 싶은 행 번호 중 가장 작은 값을 입력해 주시고

콜론 우측에는 불러오고 싶은 행 번호 중 가장 큰 값을 입력해 주시면 됩니다.


게시물에 오류 발견 시 댓글을 남겨주시면 대단히 감사드리겠습니다.

그럼, 오늘도 즐거운 하루 보내시길 바랍니다 :)

고맙습니다.

728x90
반응형
Comments