๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ (4)

Hey Tech

[Python] subplot์„ ํ™œ์šฉํ•œ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ทธ๋ž˜ํ”„ ๋™์‹œ ์ถœ๋ ฅํ•˜๊ธฐ

๐Ÿ‘จ‍๐Ÿ’ป ๋“ค์–ด๊ฐ€๋ฉฐ ๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ์•„๋ž˜์˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ, ํŒŒ์ด์ฌ subplot์„ ํ™œ์šฉํ•˜์—ฌ 2๊ฐœ ์ด์ƒ์˜ ๊ทธ๋ž˜ํ”„๋ฅผ ํ•˜๋‚˜์˜ figure์— ์ถœ๋ ฅํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. Step 1. ํŒจํ‚ค์ง€ import ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”๋ฅผ ์œ„ํ•œ matplotlib ํŒจํ‚ค์ง€๋ฅผ ์„ค์น˜ํ•˜๊ณ  import ํ•ฉ๋‹ˆ๋‹ค. import matplotlib.pyplot as plt ๐ŸŽฏ ํŒจํ‚ค์ง€ ์„ค์น˜๋ฐฉ๋ฒ• ๋”๋ณด๊ธฐ pip install matplotlib Step 2. ๋ฐ์ดํ„ฐ์…‹ ์ค€๋น„ ์ €๋Š” ์›”๋ณ„ ๋ฐ์ดํ„ฐ ๊ฑด์ˆ˜๋ฅผ ์ €์žฅํ•œ series ํƒ€์ž…์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค. 1) ์ฒซ ๋ฒˆ์งธ ๋ฐ์ดํ„ฐ์…‹ 2) ๋‘ ๋ฒˆ์งธ ๋ฐ์ดํ„ฐ์…‹ Step 3. x์ถ•, y์ถ• ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌ x์ถ•๊ณผ y์ถ•์— ๊ฐ๊ฐ ์‹œ๊ฐํ™”ํ•  ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ๊ฐ ๋‚˜๋ˆ•๋‹ˆ๋‹ค. x1 = dataset_pos_m.index y1 = dataset_p..

[Python] ์ฃผ ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ๊ทธ๋ฃนํ™” ๋ฐ ์‹œ๊ฐํ™”ํ•˜๊ธฐ

๐Ÿ’ก ๋“ค์–ด๊ฐ€๋ฉฐ ๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ ๋‹จ์œ„๋กœ ์นด์šดํŒ…ํ•˜๊ณ  ์ด๋ฅผ ์‹œ๊ฐํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. 1. ํŒจํ‚ค์ง€ import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํ„ฐ์…‹ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ์…‹์€ ๊ณต์œ ๊ฐ€ ๋ถˆ๊ฐ€ํ•˜์˜ค๋‹ˆ ํ•™์Šต ๋ชฉ์ ์œผ๋กœ๋งŒ ๋ด์ฃผ์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํ„ฐ ํƒ€์ž… ํ™•์ธ DATASET.dtypes ์•„๋ž˜์™€ ๊ฐ™์ด, ๋‚ ์งœ ์ •๋ณด(date)๋Š” ํ˜„์žฌ ์ •์ˆ˜ํ˜•(int)์ž…๋‹ˆ๋‹ค. ํŽธ๋ฆฌํ•˜๊ฒŒ ๋‚ ์งœํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•˜์—ฌ ์ด๋ฅผ datetime ํƒ€์ž…์œผ๋กœ ๋ฐ”๊ฟ”์ค„ ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. 4. ๋ฐ์ดํ„ฐ ํƒ€์ž… ๋ณ€๊ฒฝ "์—ฐ-..

[Python] ์›” ๋‹จ์œ„ ๋ฐ์ดํ„ฐ ๊ทธ๋ฃนํ™” ๋ฐ ์‹œ๊ฐํ™”ํ•˜๊ธฐ

๐Ÿ’ก ๋“ค์–ด๊ฐ€๋ฉฐ ๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์›” ๋‹จ์œ„๋กœ ์นด์šดํŒ…ํ•˜๊ณ  ์ด๋ฅผ ์‹œ๊ฐํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. 1. ํŒจํ‚ค์ง€ import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํ„ฐ์…‹ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ์…‹์€ ๊ณต์œ ๊ฐ€ ๋ถˆ๊ฐ€ํ•˜์˜ค๋‹ˆ ํ•™์Šต ๋ชฉ์ ์œผ๋กœ๋งŒ ๋ด์ฃผ์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํ„ฐ ํƒ€์ž… ํ™•์ธ DATASET.dtypes ์•„๋ž˜์™€ ๊ฐ™์ด, ๋‚ ์งœ ์ •๋ณด(date)๋Š” ํ˜„์žฌ ์ •์ˆ˜ํ˜•(int)์ž…๋‹ˆ๋‹ค. ํŽธ๋ฆฌํ•˜๊ฒŒ ๋‚ ์งœํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•˜์—ฌ ์ด๋ฅผ datetime ํƒ€์ž…์œผ๋กœ ๋ฐ”๊ฟ”์ค„ ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. 4. ๋ฐ์ดํ„ฐ ํƒ€์ž… ๋ณ€๊ฒฝ "์—ฐ-..

[Python] ์ˆซ์žํ˜•/๋ฌธ์ž์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๋‚ ์งœํ˜•์œผ๋กœ ๋ฐ”๊พธ๊ธฐ(pd.to_datetime)

๐Ÿ“Œ ๋ชฉํ‘œ ์ˆซ์žํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ๋‚ ์งœ ํ˜•ํƒœ๋กœ(i.e., datetime) ๋ณ€ํ™˜ํ•˜๊ธฐ ์˜ˆ์‹œ: 20220816 (int) ๐Ÿ‘‰ 2022-08-16 (datetime object) ๐Ÿ—‚ ๋ชฉ์ฐจ 1. ๋ฐ์ดํ„ฐ์…‹ ์˜ˆ์‹œ 2. ๋ฐ์ดํ„ฐ ํƒ€์ž… ๋ณ€๊ฒฝ 3. ์ฝ”๋“œ ๋œฏ์–ด๋ณด๊ธฐ ๐Ÿ“ ๋ฐ์ดํ„ฐ์…‹ ์˜ˆ์‹œ ํŒŒ์ด์ฌ์˜ pandas ํŒจํ‚ค์ง€๋ฅผ ํ™œ์šฉํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. import pandas as pd ์•„๋ž˜์˜ ๊ทธ๋ฆผ 1๊ณผ ๊ฐ™์ด, ๊ณ ๊ฐ ID, ๋ฆฌ๋ทฐ ๋“ฑ๋ก์ผ, ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๊ฐ€ ๋‹ด๊ธด ๋ฐ์ดํ„ฐ์…‹์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์นผ๋Ÿผ๋ณ„ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ํ™•์ธํ•ด ๋ด…๋‹ˆ๋‹ค. ์œ„์˜ ๊ทธ๋ฆผ 2์™€ ๊ฐ™์ด, date ์นผ๋Ÿผ์ด ์ •์ˆ˜ํ˜•์ธ ๊ฒƒ์„ ํ™•์ธํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿ’ก ๋ฐ์ดํ„ฐ ํƒ€์ž… ๋ณ€๊ฒฝ ์ด์ œ date ์นผ๋Ÿผ์„ datetime ํ˜•ํƒœ๋กœ ๋ณ€ํ™˜ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๐Ÿ›  ์ฝ”๋“œ DATASET['datetime'] = DATASET['date'].ap..