๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กํŒŒ์ด์ฌ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ (2)

Hey Tech

[Python] Pandas ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋ชจ๋“  ํ–‰, ์—ด ์ถœ๋ ฅํ•˜๋Š” ๋ฐฉ๋ฒ•

๐Ÿ“š ๋“ค์–ด๊ฐ€๋ฉฐ๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ํŒŒ์ด์ฌ pandas ์‚ฌ์šฉ ์‹œ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ์ „์ฒด ํ–‰๊ณผ ์—ด ์กฐํšŒ ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.๐Ÿ’ก์ƒํ™ฉํŒ๋‹ค์Šค ํ†ตํ•ด ์—‘์…€ ํŒŒ์ผ ์กฐํšŒ ์‹œ ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ๋Š” ์ผ๋ถ€ ํ–‰๊ณผ ์—ด์ด ์ˆจ๊น€์ฒ˜๋ฆฌ ๋˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค(๊ทธ๋ฆผ 1).# ๋ฏธ์„ค์น˜ ์‹œ pip install pandasimport pandas as pddf = pd.read_excel(filepath+filename, sheet_name = 'Sheet2')df.head()โœ… ํ•ด๊ฒฐ๋ฐฉ๋ฒ•ํ•ด๊ฒฐ๋ฐฉ๋ฒ•์€ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜์™€ ๊ฐ™์ด ํŒ๋‹ค์Šค ์˜ต์…˜์„ ๋ณ€๊ฒฝํ•ด ์ฃผ๋ฉด ๋ฉ๋‹ˆ๋‹ค.1) ๋ชจ๋“  ์—ด ์ถœ๋ ฅ์•„๋ž˜์˜ ๋ช…๋ น์–ด๋งŒ ์‹คํ–‰ํ•ด ์ฃผ๋ฉด ๋ชจ๋“  ์—ด์„ ์กฐํšŒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(๊ทธ๋ฆผ 2).pd.set_option('display.max_columns', None)2) ๋ชจ๋“  ํ–‰ ์ถœ๋ ฅ์œ ์‚ฌํ•˜๊ฒŒ ๋ชจ๋“  ํ–‰ ์ถœ๋ ฅํ•˜๋Š” ๋ช…..

SW ๊ฐœ๋ฐœ/Python 2024. 5. 21. 11:08
[Python] map, lambda ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ํ•ธ๋“ค๋ง ๋ฐฉ๋ฒ• ๋ฐ ์ด์ 

๐Ÿ”ฅ ๋ชฉํ‘œ ์˜ค๋Š˜์€ ํŒŒ์ด์ฌ map ํ•จ์ˆ˜์™€ lambda ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ•ธ๋“ค๋งํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ์ด์ ์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค. ๐Ÿ‘จ‍๐Ÿ’ป ๋ฌธ์ œ ์ƒํ™ฉ ์˜ˆ์‹œ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด ํŠน์ • ์นผ๋Ÿผ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์–ด๋– ํ•œ ์—ฐ์‚ฐ์„ ๊ฑฐ์ณ ์ƒˆ๋กœ์šด ๊ฐ’๋“ค๋กœ ์ด๋ฃจ์–ด์ง„ ์นผ๋Ÿผ์„ ์ƒˆ๋กญ๊ฒŒ ์ƒ์„ฑํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ• ๊นŒ์š”? ๊ตฌ์ฒด์ ์ธ ์˜ˆ์‹œ์™€ ํ•จ๊ป˜ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜์™€ ๊ฐ™์ด dataset์ด๋ผ๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์— yyyymmdd ํ˜•์‹์˜ date ์ •๋ณด๊ฐ€ ๋‹ด๊ธด date_full ์นผ๋Ÿผ์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ, ์•„๋ž˜์™€ ๊ฐ™์ด ์—ฐ๋„ ์ •๋ณด๋งŒ ์ถ”์ถœํ•˜์—ฌ date_year๋ผ๋Š” ์นผ๋Ÿผ์— ์ƒˆ๋กญ๊ฒŒ ์ €์žฅํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•ด์•ผ ํ• ๊นŒ์š”? ๐Ÿ’ก ํ•ด๊ฒฐ๋ฐฉ๋ฒ• 1: ๋ฐ˜๋ณต๋ฌธ ํ™œ์šฉ(Bad Case โŒ) ๋ฐ˜๋ณต๋ฌธ์„ ํ™œ์šฉํ•˜์—ฌ date_full ์นผ๋Ÿผ ๋‚ด ๋ฐ์ดํ„ฐ๋ฅผ ํ•œ ๊ฐœ์”ฉ ์ ‘๊ทผํ•˜์—ฌ ..