Recent Posts
Recent Comments
Archives
반응형
250x250
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Today
Yesterday

Total
05-02 06:06
관리 메뉴

Hey Tech

[파이썬] 칼럼 이름별로 데이터프레임 출력하기(loc 함수) 본문

AI & 빅데이터/데이터 분석 with Python

[파이썬] 칼럼 이름별로 데이터프레임 출력하기(loc 함수)

Tony Park 2021. 2. 28. 14:15
728x90
반응형

안녕하세요, 오늘은 파이썬을 활용하여 데이터프레임 내 특정 칼럼만 출력하는 방법에 대해 공유해 드립니다.

그럼 바로 시작하죠!

목차

1.  데이터프레임 셋업
2.  특정 칼럼만 지정하여 출력하기
    2.1.  특정 칼럼 1개만 출력하기
    2.2.  특정 칼럼 2개 이상 출력하기
      2.2.1.  칼럼 이름 리스트 사용하기
      2.2.2.  loc 함수 사용하기
      2.2.3.  iloc 함수 사용하기

1.  데이터프레임 셋업

판다스 모듈 설치하기

pip install pandas

판다스 라이브러리를 설치하지 않으셨다면 설치해 주세요.

판다스 모듈 불러오기

import pandas as pd

판다스 라이브러리를 불러옵니다.

데이터프레임 생성

df = pd.DataFrame({"ID": [1, 2, 3, 4, 5], "Name": ["Tony", "Smith", "Jason", "Jhon", "Michel"],
                  "Department": ["Data Engineering", "UI/UX", "Marketing", "HR", "iOS development"]})
print(df)

간단하게 데이터프레임을 임의로 생성하고 출력해 보겠습니다(그림 1 참고).

 

그림 1.  생성한 데이터프레임

2.  특정 칼럼만 지정하여 출력하기

2.1.  특정 칼럼 1개만 출력하기

하나의 칼럼만 지정해서 출력하는 것은 간단하죠?

예를 들어, 칼럼 이름이 'Name'인 칼럼의 5개 행만 출력해 보겠습니다.

df['Name'].head()

아래 그림 2 와 같이 Name 칼럼에 해당하는 행 5개가 출력된 것을 확인할 수 있습니다.

 

그림 2.  하나의 특정 칼럼만 출력한 결과

2.2.  특정 칼럼 2개 이상 출력하기

그렇다면, 칼럼 이름이 각각 ID와 Name에 해당하는 2개의 칼럼만 출력하고 싶을 때는 어떻게 해야 할까요?

방법은 크게 3가지가 있습니다.

2.2.1.  칼럼 이름 리스트 사용하기

첫 번째 방법은 출력할 여러 칼럼의 이름을 리스트에 담아 앞서 살펴본 하나의 특정 칼럼만 출력하는 것처럼

칼럼 이름을 지정하는 자리에 대입해 주는 것입니다. 아래 코드와 같이 말이죠.

df[['ID', 'Name']]

아래 그림 3 과 같이 ID 와 Name 이라는 이름의 칼럼만 출력되는 것을 확인하실 수 있습니다.

 

그림 3. 여러 칼럼이 출력된 결과

2.2.2.  loc 함수 사용하기

두 번째 방법은 데이터프레임 내 loc 함수를 사용하는 것입니다.

df.loc[:, ['1st column name', '2nd column name', ... ]]

loc 함수 내 괄호에 첫 번째 자리의 변수는 출력할 행의 위치를 결정합니다.

위 코드에서는 해당 변수값이 콜론(:)이므로 "모든 행"을 출력하라는 의미가 됩니다.

이제 두 번째 자리의 변수에 앞서 살펴본 것처럼 출력할 칼럼들의 이름을 리스트에 담아 넣어줍니다.

print(df.loc[:, ['ID', 'Name']])

loc 함수를 활용하여 앞서 셋업한 데이터프레임을 활용하여 작성하면 위와 같습니다.

2.2.3 iloc 함수 사용하기

세 번째 방법은 데이터프레임 내 iloc 함수를 사용하는 것입니다.

df.iloc[:, [칼럼 인덱스1, 칼럼 인덱스2, ... ]]

iloc 함수는 칼럼 인덱스를 활용하여 출력할 칼럼을 지정하여 사용합니다.

iloc 함수의 괄호 내 첫 번째 자리는 앞서 살펴본 loc 함수와 마찬가지로 출력할 행을 지정하는 변수입니다.

따라서 우리는 칼럼을 기준으로 모든 행을 출력할 것이기 때문에 행의 인덱스 자리는 콜론(:)을 입력해 주겠습니다.

괄호 내 두 번째 자리의 변수에는 출력할 칼럼의 인덱스를 입력해 줍니다.

df.iloc[:, [0, 1]]

우리가 출력할 칼럼은 순서적으로는 1, 2번째 칼럼이므로 인덱스는 0과 1이 해당합니다.

출력 결과는 위의 그림 3 과 동일합니다.

참고할만한 포스팅

[파이썬] 데이터프레임 칼럼 이름 바꾸기(feat. pandas)

포스팅 내용에 오류가 있는 부분이 있을 경우 댓글을 남겨 주시면 감사드리겠습니다.

그럼 오늘도 건강한 하루 보내시길 바랍니다 :-)

고맙습니다.

 

728x90
반응형
Comments