์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ํ๋ธ๋ก
- ์์ฐ์ด์ฒ๋ฆฌ
- ์ฝ๋ฉํ ์คํธ
- ๋น ๋ฐ์ดํฐ
- sap
- abap
- erp
- react
- AI
- ์ธ๊ณต์ง๋ฅ
- ๋ฐ์ดํฐ ๋ถ์
- ๋ฅ๋ฌ๋
- github
- ์ฝํ
- ํ ์คํธ๋ถ์
- ์๋ฐ์คํฌ๋ฆฝํธ
- AWS
- Git
- ๊นํ๋ธ
- ํ ์คํธ๋ง์ด๋
- tableau
- ํ์ด์ฌ
- ์๋ง์กด์น์๋น์ค
- ๋ฐฑ์ค
- ๋ฆฌ์กํธ
- ๋ฐ์ดํฐ๋ถ์
- DFS
- ์๊ณ ๋ฆฌ์ฆ
- ํ๋ธ๋ฃจ
- nlp
- Today
- Total
๋ชฉ๋กpandas (6)
DATA101
๐ ๋ค์ด๊ฐ๋ฉฐ๋ณธ ํฌ์คํ ์์๋ ํ์ด์ฌ pandas ์ฌ์ฉ ์ ๋ฐ์ดํฐํ๋ ์ ์ ์ฒด ํ๊ณผ ์ด ์กฐํ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค.๐ก์ํฉํ๋ค์ค ํตํด ์์ ํ์ผ ์กฐํ ์ ๊ธฐ๋ณธ๊ฐ์ผ๋ก๋ ์ผ๋ถ ํ๊ณผ ์ด์ด ์จ๊น์ฒ๋ฆฌ ๋๋ ํ์์ด ๋ฐ์ํฉ๋๋ค(๊ทธ๋ฆผ 1).# ๋ฏธ์ค์น ์ pip install pandasimport pandas as pddf = pd.read_excel(filepath+filename, sheet_name = 'Sheet2')df.head()โ ํด๊ฒฐ๋ฐฉ๋ฒํด๊ฒฐ๋ฐฉ๋ฒ์ ๊ฐ๋จํฉ๋๋ค. ์๋์ ๊ฐ์ด ํ๋ค์ค ์ต์ ์ ๋ณ๊ฒฝํด ์ฃผ๋ฉด ๋ฉ๋๋ค.1) ๋ชจ๋ ์ด ์ถ๋ ฅ์๋์ ๋ช ๋ น์ด๋ง ์คํํด ์ฃผ๋ฉด ๋ชจ๋ ์ด์ ์กฐํํ ์ ์์ต๋๋ค(๊ทธ๋ฆผ 2).pd.set_option('display.max_columns', None)2) ๋ชจ๋ ํ ์ถ๋ ฅ์ ์ฌํ๊ฒ ๋ชจ๋ ํ ์ถ๋ ฅํ๋ ๋ช ..
๐ Text ๋น ๋ฐ์ดํฐ๋ถ์ ํ๋ซํผ ๋ฒ ํํ ์คํธ ์ฐธ๊ฐ์ ๋ชจ์ง ์ค!(๋ค์ด๋ฒํ์ด 4๋ง ์ ์ ์ ์ง๊ธ) ๐ ์๋ ํ์ธ์, ์ฝ๋ฉ์ด ํ์ ์๋ AI/๋น ๋ฐ์ดํฐ ๋ถ์ All in One ํ๋ซํผ ๊ฐ๋ฐํ์ ๋๋ค.๐ ์ ํฌ ์๋น์ค๋ฅผ ์ฌ์ฉํด ๋ณด์๊ณ ๊ฒฝํ๋ด์ ๋ค๋ ค์ฃผ์ธ์ :)๐ธ ์ฐธ์ฌํด ์ฃผ์ "๋ชจ๋ " ๋ถ๋ค๊ป ๋ค์ด๋ฒํ์ด 4๋ง ์ ์ฟ ํฐ์ ์ง๊ธํด ๋๋ฆฝ๋๋ค.๐จ๐ป ์ฐธ์ฌ ํฌ๋ง ์ ์นดํกํ๋ฌ์ค์น๊ตฌ 1:1 ์ฑํ or ์ธ์คํ๊ทธ๋จ DM ๋ถํ๋๋ฆฝ๋๋ค :)๐ ์ฐธ์ฌ๊ธฐ๊ฐ : 11/25(์)~11/29(๊ธ) 11:00~21:00 ์ค ํ1 (1์๊ฐ 1ํ์)๐ ์ฐธ์ฌ์ฅ์ : ๊ฐ๋จ์ญ ์ธ๊ทผ ์คํฐ๋์นดํ ๋ฏธํ Room๐ ์์์๊ฐ : ์ด 40๋ถ ๋ด์ธ(์๋น์ค ์ฒดํ ๋ฐ ์ธํฐ๋ทฐ ํฌํจ)โ ์ฐธ๊ฐ์กฐ๊ฑด : Text ๋น ๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌด ๊ฒฝํ์๐ ์ฐธ๊ฐ ๊ฐ๋ฅ์ผ์ ์กฐํํ๊ธฐ : ht..
๋ณธ ํฌ์คํ ์์๋ Python pandas ํจํค์ง๋ฅผ ํ์ฉํ์ฌ ๊ฒฐ์ธก์น๋ฅผ ํ์ธํ๊ณ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ค๋ฃน๋๋ค. ๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ ๊ธฐ๋ณธ์ ์ผ๋ก pandas ์ค์น ๋ฐ import๋ ๋์ด ์๊ณ ์ํ๋ ๋ฐ์ดํฐ์ ๋ ๋ถ๋ฌ์๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. pandas ํจํค์ง ์ค์น !pip install pandas !pip install openpyxl # excel ํ์ผ ๋ถ๋ฌ์ค๊ธฐ ์ํจ # pipenv ๊ฐ์ํ๊ฒฝ์ฉ # !pipenv install pandas # !pipenv install openpyxl pandas ํจํค์ง import import pandas as pd ๋ฐ์ดํฐ์ Load dataset_raw = pd.read_excel("./data/dataset_raw.xlsx") 1. ๊ฒฐ์ธก์น ํ์ธ ๊ฒฐ์ธก์น ๊ฐ์๋ฅผ ํ์ธํ๋ ๋ฐฉ๋ฒ์ ํฌ..
โ๏ธ ์๋ฌ ์ํฉ ์๋์ ๊ฐ์ด ๋ฐ์ดํฐํ๋ ์์์ 2๊ฐ์ง ์กฐ๊ฑด์ ๋ง์กฑํ๋ ๋ฐ์ดํฐ๋ฅผ ํํฐ๋งํ๋๋ ์ฝ๋๋ ์ ๋์๊ฐ๋๋ฐ ์๋ฌ ๋ฉ์์ง๊ฐ ์ถ๋ ฅ๋์์ต๋๋ค. 2018
๋ณ๊ฒฝ ์ ํ์ด์ฌ pandas ํจํค์ง๋ก ์์ ํ์ผ์ ๋ถ๋ฌ์ค๋ฉด ์๋์ ๊ฐ์ด ํ์ผ์๋ ์๋ ์นผ๋ผ์ด ์๋์ผ๋ก ์ถ๊ฐ๋๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค. ์ผ๋จ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์จ ํ์ ํด๋น ์นผ๋ผ์ ์ญ์ ํ๋ ๋ฐฉ๋ฒ๋ ์์ง๋ง, ๋ฒ๊ฑฐ๋ก์ด ์์ ์ 2๋ฒ์ ํ ํ์๋ ์๊ฒ ์ฃ . ๊ทธ๋์ ์ด๋ฒ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ฌ ๋๋ถํฐ ํด๋น ์นผ๋ผ์ด ์๋์ผ๋ก ์์ฑ๋๋ ๊ฒ์ ๋ฐฉ์งํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ด ๋๋ค. ๋ณ๊ฒฝ ํ "Unnamed: 0" ์นผ๋ผ ์์ด ํ์ผ์ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ๊ฐ๋จํฉ๋๋ค. read ๋ฉ์๋ ์คํ ์ index_col ์ต์ ๊ฐ์ 0์ผ๋ก ์ค์ ํ๋ ๊ฒ์ ๋๋ค. dataset = pd.read_csv("๋ฐ์ดํฐ์ ๊ฒฝ๋ก", index_col = 0) dataset.head() ์์ ๊ฐ์ด ์ต์ ์ ์ค์ ํ๋ฉด ์ด์ ํด๋น ์นผ๋ผ("Unnamed: 0") ์์ด ๋ฐ์ดํฐ๊ฐ..
์ค๋์ ํ์ด์ฌ pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํตํด ์์ ์์ ํน์ ์ด(column)์ด๋ ํ(row)์ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! 1. pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ import import pandas as pd pandas ์ค์น๊ฐ ์๋ ๊ฒฝ์ฐ: ์๋ ์ฝ๋๋ฅผ ์ปค๋งจ๋๋ผ์ธ/ํฐ๋ฏธ๋/์ฃผํผํฐ๋ ธํธ๋ถ ํ๊ฒฝ ์ค์์ ์ค์น๋ถํฐ ์งํํด ์ฃผ์ธ์. pip install pandas 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ # ํ์ผ์ด xlsx ํ์์ธ ๊ฒฝ์ฐ, dataset = pd.read_excel([ํ์ผ๊ฒฝ๋ก], sheet_name = [๋ถ๋ฌ์ฌ ์ํธ ์ด๋ฆ]) # ํ์ผ์ด csv ํ์์ธ ๊ฒฝ์ฐ, dataset = pd.read_csv([ํ์ผ๊ฒฝ๋ก], sheet_name = [๋ถ๋ฌ์ฌ ์ํธ ์ด๋ฆ]) ํ์ผ ๊ฒฝ๋ก๋ฅผ ๋๊ดํธ([]) ์์ ๋ฐ์ดํ('')์์ ..