์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- sap
- ๋ฐฑ์ค
- ํ ์คํธ๋ถ์
- ๊นํ๋ธ
- tableau
- ์ฝํ
- erp
- ๋ฐ์ดํฐ ๋ถ์
- abap
- ์ฝ๋ฉํ ์คํธ
- ์๊ณ ๋ฆฌ์ฆ
- AI
- ์๋ฐ์คํฌ๋ฆฝํธ
- ํ์ด์ฌ
- github
- ์ธ๊ณต์ง๋ฅ
- Git
- AWS
- react
- ํ ์คํธ๋ง์ด๋
- ์๋ง์กด์น์๋น์ค
- ํ๋ธ๋ก
- ๋ฅ๋ฌ๋
- DFS
- ๋ฐ์ดํฐ๋ถ์
- ์์ฐ์ด์ฒ๋ฆฌ
- nlp
- ํ๋ธ๋ฃจ
- ๋น ๋ฐ์ดํฐ
- ๋ฆฌ์กํธ
- Today
- Total
๋ชฉ๋กํ์ด์ฌ ๋ฐ์ดํฐํ๋ ์ (2)
DATA101

๐ ๋ค์ด๊ฐ๋ฉฐ๋ณธ ํฌ์คํ ์์๋ ํ์ด์ฌ pandas ์ฌ์ฉ ์ ๋ฐ์ดํฐํ๋ ์ ์ ์ฒด ํ๊ณผ ์ด ์กฐํ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค.๐ก์ํฉํ๋ค์ค ํตํด ์์ ํ์ผ ์กฐํ ์ ๊ธฐ๋ณธ๊ฐ์ผ๋ก๋ ์ผ๋ถ ํ๊ณผ ์ด์ด ์จ๊น์ฒ๋ฆฌ ๋๋ ํ์์ด ๋ฐ์ํฉ๋๋ค(๊ทธ๋ฆผ 1).# ๋ฏธ์ค์น ์ pip install pandasimport pandas as pddf = pd.read_excel(filepath+filename, sheet_name = 'Sheet2')df.head()โ ํด๊ฒฐ๋ฐฉ๋ฒํด๊ฒฐ๋ฐฉ๋ฒ์ ๊ฐ๋จํฉ๋๋ค. ์๋์ ๊ฐ์ด ํ๋ค์ค ์ต์ ์ ๋ณ๊ฒฝํด ์ฃผ๋ฉด ๋ฉ๋๋ค.1) ๋ชจ๋ ์ด ์ถ๋ ฅ์๋์ ๋ช ๋ น์ด๋ง ์คํํด ์ฃผ๋ฉด ๋ชจ๋ ์ด์ ์กฐํํ ์ ์์ต๋๋ค(๊ทธ๋ฆผ 2).pd.set_option('display.max_columns', None)2) ๋ชจ๋ ํ ์ถ๋ ฅ์ ์ฌํ๊ฒ ๋ชจ๋ ํ ์ถ๋ ฅํ๋ ๋ช ..

๐ฅ ๋ชฉํ ์ค๋์ ํ์ด์ฌ map ํจ์์ lambda ํจ์๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ํธ๋ค๋งํ๋ ๋ฐฉ๋ฒ๊ณผ ์ด์ ์ ๋ํด ์์๋ด ๋๋ค. ๐จโ๐ป ๋ฌธ์ ์ํฉ ์์ ๋ฐ์ดํฐํ๋ ์ ๋ด ํน์ ์นผ๋ผ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์ด๋ ํ ์ฐ์ฐ์ ๊ฑฐ์ณ ์๋ก์ด ๊ฐ๋ค๋ก ์ด๋ฃจ์ด์ง ์นผ๋ผ์ ์๋กญ๊ฒ ์์ฑํ๊ณ ์ถ๋ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ ๊น์? ๊ตฌ์ฒด์ ์ธ ์์์ ํจ๊ป ์์๋ณด๊ฒ ์ต๋๋ค. ์๋์ ๊ฐ์ด dataset์ด๋ผ๋ ๋ฐ์ดํฐํ๋ ์์ yyyymmdd ํ์์ date ์ ๋ณด๊ฐ ๋ด๊ธด date_full ์นผ๋ผ์ด ์๋ค๊ณ ๊ฐ์ ํด ๋ณด๊ฒ ์ต๋๋ค. ๋ง์ฝ, ์๋์ ๊ฐ์ด ์ฐ๋ ์ ๋ณด๋ง ์ถ์ถํ์ฌ date_year๋ผ๋ ์นผ๋ผ์ ์๋กญ๊ฒ ์ ์ฅํ๊ณ ์ถ๋ค๋ฉด ์ด๋ป๊ฒ ์ฝ๋๋ฅผ ์์ฑํด์ผ ํ ๊น์? ๐ก ํด๊ฒฐ๋ฐฉ๋ฒ 1: ๋ฐ๋ณต๋ฌธ ํ์ฉ(Bad Case โ) ๋ฐ๋ณต๋ฌธ์ ํ์ฉํ์ฌ date_full ์นผ๋ผ ๋ด ๋ฐ์ดํฐ๋ฅผ ํ ๊ฐ์ฉ ์ ๊ทผํ์ฌ ..