Recent Posts
Recent Comments
Archives
반응형
250x250
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Today
Yesterday

Total
04-19 00:38
관리 메뉴

Hey Tech

[파이썬] Excel(xlsx, csv 등) 파일 불러오기 ,읽기 본문

AI & 빅데이터/데이터 분석 with Python

[파이썬] Excel(xlsx, csv 등) 파일 불러오기 ,읽기

Tony Park 2021. 1. 10. 17:19
728x90
반응형

📚 목차

1.  pandas 모듈 설치(미설치자만 해당)
2.  pandas 모듈 임포트
3.  파일 불러오기

1.  pandas 모듈 설치(미설치자만 해당)

pandas 모듈을 설치하지 않으신 분께서는 Terminal이나 CMD를 통해서 모듈을 설치해 주세요.

pip install pandas

pip 미설치자는 아래의 포스팅을 참고하셔서 설치해 주시기 바랍니다.

https://heytech.tistory.com/318

 

[Python] pip 개념 및 설치 방법(pip, pip3)

본 포스팅에서는 pip 개념과 pip/pip3 설치 방법을 알아봅니다. 1. pip 개념 Pip Installs Packages의 약자 Python 패키지를 설치하고 관리하는 패키지 매니저(Package Manneger) MacOS에서 brew, node의 npm, yar..

heytech.tistory.com

2.  pandas 모듈 임포트

pandas 모듈을 import 합니다.

# pandas 모듈을 import 하고, 클린코드를 위해 이 모듈을 앞으로 "pd"로 줄여서 표현.
import pandas as pd

3.  파일 불러오기

3.1.  파일 내 시트가 오직 1개인 경우

파일 내 시트가 1개인 경우에는 파일 경로만 잘 입력하시면 됩니다.

(1) csv 형식의 파일을 불러오는 경우

'''
	(1) csv 확장자의 파일을 불러올 경우 
	파일 경로 입력 시 directory 구분은 OS 마다 다릅니다.
    
        1) Window OS: 원화 기호(₩, i.e., 역슬래시(\))
        2) Mac OS: 슬래시(/)
'''

# dataset1 이라는 변수에 해당 파일을 저장합니다.
dataset1 = pd.read_csv('/Users/gbpark/Downloads/rootkey.csv', index_col = 0) # 옵션: 인덱스 칼럼 제외
dataset1 # 변수에 파일이 잘 저장이 되었는지 확인합니다.

pandas 모듈 내 read_csv 함수를 사용하고 파일 경로를 따옴표 안에 입력해 줍니다.

 

Tip) MacOS에서는 해당 파일을 한 번 클릭하시고 "command + option + c" 단축키를 눌러주신 후에 코드에 "command + v" 해주시면 파일 경로가 그대로 복붙됩니다.

(2) xlsx 형식의 파일을 불러오는 경우

# (2) xlsx 형식의 파일을 불러오는 경우
dataset2 = pd.read_excel('/Users/gbpark/Downloads/rootkey.xlsx', index_col = 0) # 옵션: 인덱스 칼럼 제외
dataset2 # 변수에 파일이 잘 저장이 되었는지 확인합니다.

pandas 모듈 내 read_excel 함수를 사용하고 파일 경로를 따옴표 안에 입력합니다.

openpyxls 패키지 미설치한 경우 설치해 주세요.

pip install openpyxls

3.2.  파일 내 특정 시트(sheet)만 불러오고 싶은 경우

dataset3 = pd.read_csv('/Users/gbpark/Downloads/rootkey.csv', sheet_name = 'sheet1', index_col = 0) # 옵션: 인덱스 칼럼 제외
dataset3 # 변수에 파일이 잘 저장되었는지 확인합니다.

파일 내 시트가 여러 개인 경우에는 파일 경로뿐만 아니라 시트 이름도 파라미터로서 입력해 주셔야 합니다. csv, xlsx 파일 형식 모두 아래와 같이 sheet 이름을 그대로 따옴표 안에 입력하시면 됩니다.

💡 (Optional) 파일 불러오기에 실패한 경우

dataset = pd.read_csv('C:₩₩Users₩₩gbpark₩₩Downloads₩₩rootkey.csv', index_col = 0) # 옵션: 인덱스 칼럼 제외

윈도우OS를 사용하는 경우 directory 구분을 위한 원화 기호(₩)를 2번씩 써주면 해결되는 경우가 있습니다.

📚 참고할 만한 포스팅

- [Python] 'Unnamed: 0" 없이 엑셀 파일 읽어오기

포스팅 내용에 오류가 있다면 아래에 댓글 남겨주세요!

그럼 오늘도 즐거운 하루 보내시길 바랍니다.

고맙습니다 :)

728x90
반응형
Comments