Recent Posts
Recent Comments
Archives
반응형
250x250
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Today
Yesterday

Total
04-28 00:00
관리 메뉴

Hey Tech

[파이썬] 데이터프레임 내 특정 단어가 포함된 데이터 조회(feat. pandas) 본문

SW 개발/Python

[파이썬] 데이터프레임 내 특정 단어가 포함된 데이터 조회(feat. pandas)

Tony Park 2021. 10. 24. 21:07
728x90
반응형

Step 1.  pandas 패키지 import

import pandas as pd

pandas를 import 해줍니다. 설치가 안 되어 있는 분은 터미널(커맨드라인)에 아래 명령어를 입력하셔서 pandas를 설치해 주세요.

$ pip install pandas

Step 2.  데이터프레임 세팅

dt = pd.DataFrame({'이름': ['성기훈', '조상우', '장덕수', '오일남', '한미녀'], 
                   '주소': ['서울시 도봉구 쌍문동',
                           '서울시 종로구 혜화동',
                           '서울시 강남구 삼성동',
                           '서울시 강남구 논현동',
                           '서울시 강남구 논현동']})

예제를 위한 데이터프레임을 세팅했습니다.

dt.head()

데이터프레임을 조회하면 아래와 같습니다.

Step 3.  Series.str.contains('찾을 문자열')

위의 데이터프레임 예시처럼 주소 정보가 주어질 때, 특정 구나 동에 거주하는 사람들만 조회하고 싶다면 어떻게 해야 할까요? 이럴 때 사용하는것이 데이터프레임의 내장 함수인 str.contains()입니다. 사용방법을 예시와 함께 살펴보죠.

예제1) 종로구 거주자 조회

예제로 종로구에 거주하는 사람의 정보를 조회해 보겠습니다.

# 종로구 거주자 찾기
dt['주소'].str.contains('종로구')

사용방법은 간단합니다. 키워드를 조회할 특정 열(column)에 str.contains 구문 내 키워드를 입력해 주면 됩니다.

위👆👆👆와 같이 bool 데이터를 갖는 Series가 반환되는 것을 확인할 수 있습니다. 그렇다면 원본 데이터프레임의 형태로 특정 키워드를 포함한 데이터는 어떻게 조회할 수 있을까요?

# 종로구 거주자 찾기
dt[dt['주소'].str.contains('종로구')]

위와 같이 코드를 작성하면 str.contains() 함수를 통해 반환된 값 중 True에 해당되는 행(row) 데이터만 조회할 수 있습니다.


포스팅 내용에 오류가 있다면 아래에 👇👇👇 댓글 남겨주시면 감사드리겠습니다.
그럼 오늘도 즐거운 하루 보내시길 바랍니다.
고맙습니다 :)

728x90
반응형
Comments