์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- sap
- ํ๋ธ๋ฃจ
- AWS
- ํ๋ธ๋ก
- ์๊ณ ๋ฆฌ์ฆ
- AI
- ๊นํ๋ธ
- Git
- ๋ฆฌ์กํธ
- ๋ฐ์ดํฐ๋ถ์
- ์๋ฐ์คํฌ๋ฆฝํธ
- abap
- ์๋ง์กด์น์๋น์ค
- ์์ฐ์ด์ฒ๋ฆฌ
- ์ธ๊ณต์ง๋ฅ
- ํ ์คํธ๋ถ์
- tableau
- ๋ฅ๋ฌ๋
- nlp
- ์ฝํ
- ํ ์คํธ๋ง์ด๋
- react
- ๋ฐฑ์ค
- erp
- DFS
- ๋น ๋ฐ์ดํฐ
- ์ฝ๋ฉํ ์คํธ
- ํ์ด์ฌ
- github
- ๋ฐ์ดํฐ ๋ถ์
- Today
- Total
๋ชฉ๋ก์๊ณ์ด ๋ถ์ (4)
DATA101

๐ก ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ฃผ ๋จ์๋ก ์นด์ดํ ํ๊ณ ์ด๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ํจํค์ง import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ ํฌ์คํ ์์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ณต์ ๊ฐ ๋ถ๊ฐํ์ค๋ ํ์ต ๋ชฉ์ ์ผ๋ก๋ง ๋ด์ฃผ์๊ธธ ๋ฐ๋๋๋ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํฐ ํ์ ํ์ธ DATASET.dtypes ์๋์ ๊ฐ์ด, ๋ ์ง ์ ๋ณด(date)๋ ํ์ฌ ์ ์ํ(int)์ ๋๋ค. ํธ๋ฆฌํ๊ฒ ๋ ์งํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํ์ฌ ์ด๋ฅผ datetime ํ์ ์ผ๋ก ๋ฐ๊ฟ์ค ํ์๊ฐ ์์ต๋๋ค. 4. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ "์ฐ-..

๐ก ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ ๋จ์๋ก ์นด์ดํ ํ๊ณ ์ด๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ํจํค์ง import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ ํฌ์คํ ์์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ณต์ ๊ฐ ๋ถ๊ฐํ์ค๋ ํ์ต ๋ชฉ์ ์ผ๋ก๋ง ๋ด์ฃผ์๊ธธ ๋ฐ๋๋๋ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํฐ ํ์ ํ์ธ DATASET.dtypes ์๋์ ๊ฐ์ด, ๋ ์ง ์ ๋ณด(date)๋ ํ์ฌ ์ ์ํ(int)์ ๋๋ค. ํธ๋ฆฌํ๊ฒ ๋ ์งํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํ์ฌ ์ด๋ฅผ datetime ํ์ ์ผ๋ก ๋ฐ๊ฟ์ค ํ์๊ฐ ์์ต๋๋ค. 4. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ "์ฐ-..

๐ ๋ชฉ์ฐจ 1. ์ฌ์ ์ค๋น 2. ์ ๋ฐ์ดํฐ ์ถ์ถ 3. ์์ผ ๋ฐ์ดํฐ ์ถ์ถ 4. ํน์ ๊ธฐ๊ฐ ๋ฐ์ดํฐ ์ถ์ถ ๐ 1. ์ฌ์ ์ค๋น ์๋์ ๊ทธ๋ฆผ 1๊ณผ ๊ฐ์ด, ๋ฐ์ดํฐ์ ์ ๋ ์ง ๋ฐ์ดํฐ๋ datetime ํ์ ์ ๊ฐ์ง๋๋ก ์ฌ์ ์ ์ค๋นํด ์ฃผ์ ์ผ ํฉ๋๋ค. ๋ง์ผ, ๋ ์ง ๋ฐ์ดํฐ๊ฐ '20220101'๊ณผ ๊ฐ์ด ๋ฌธ์์ด์ด๋ ์ ์ํ์ด๋ผ๋ฉด ์๋์ ํฌ์คํ ์ ์ฐธ๊ณ ํ์ ์ ๋ฐ์ดํฐ ํ์ ์ datetime์ผ๋ก ๋ณ๊ฒฝํ์๊ธธ ๋ฐ๋๋๋ค. https://heytech.tistory.com/443?category=453614#recentComments [Python] ์ซ์ํ/๋ฌธ์์ด ๋ฐ์ดํฐ๋ฅผ ๋ ์งํ์ผ๋ก ๋ฐ๊พธ๊ธฐ(pd.to_datetime) ๐ ๋ชฉํ ์ซ์ํ ๋ฐ์ดํฐ๋ฅผ ๋ ์ง ํํ๋ก(i.e., datetime) ๋ณํํ๊ธฐ ์์: 20220816 (int) ๐ 2022-08-1..

๐ ๋ชฉํ ์ซ์ํ ๋ฐ์ดํฐ๋ฅผ ๋ ์ง ํํ๋ก(i.e., datetime) ๋ณํํ๊ธฐ ์์: 20220816 (int) ๐ 2022-08-16 (datetime object) ๐ ๋ชฉ์ฐจ 1. ๋ฐ์ดํฐ์ ์์ 2. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ 3. ์ฝ๋ ๋ฏ์ด๋ณด๊ธฐ ๐ ๋ฐ์ดํฐ์ ์์ ํ์ด์ฌ์ pandas ํจํค์ง๋ฅผ ํ์ฉํ๊ฒ ์ต๋๋ค. import pandas as pd ์๋์ ๊ทธ๋ฆผ 1๊ณผ ๊ฐ์ด, ๊ณ ๊ฐ ID, ๋ฆฌ๋ทฐ ๋ฑ๋ก์ผ, ํ ์คํธ ๋ฐ์ดํฐ๊ฐ ๋ด๊ธด ๋ฐ์ดํฐ์ ์ด ์์ต๋๋ค. ์นผ๋ผ๋ณ ๋ฐ์ดํฐ ํ์ ์ ํ์ธํด ๋ด ๋๋ค. ์์ ๊ทธ๋ฆผ 2์ ๊ฐ์ด, date ์นผ๋ผ์ด ์ ์ํ์ธ ๊ฒ์ ํ์ธํ์ค ์ ์์ต๋๋ค. ๐ก ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ ์ด์ date ์นผ๋ผ์ datetime ํํ๋ก ๋ณํํด ๋ณด๊ฒ ์ต๋๋ค. ๐ ์ฝ๋ DATASET['datetime'] = DATASET['date'].ap..