๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กpandas (6)

DATA101

[Python] Pandas ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋ชจ๋“  ํ–‰, ์—ด ์ถœ๋ ฅํ•˜๋Š” ๋ฐฉ๋ฒ•

๐Ÿ“š ๋“ค์–ด๊ฐ€๋ฉฐ๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ํŒŒ์ด์ฌ pandas ์‚ฌ์šฉ ์‹œ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ์ „์ฒด ํ–‰๊ณผ ์—ด ์กฐํšŒ ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.๐Ÿ’ก์ƒํ™ฉํŒ๋‹ค์Šค ํ†ตํ•ด ์—‘์…€ ํŒŒ์ผ ์กฐํšŒ ์‹œ ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ๋Š” ์ผ๋ถ€ ํ–‰๊ณผ ์—ด์ด ์ˆจ๊น€์ฒ˜๋ฆฌ ๋˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค(๊ทธ๋ฆผ 1).# ๋ฏธ์„ค์น˜ ์‹œ pip install pandasimport pandas as pddf = pd.read_excel(filepath+filename, sheet_name = 'Sheet2')df.head()โœ… ํ•ด๊ฒฐ๋ฐฉ๋ฒ•ํ•ด๊ฒฐ๋ฐฉ๋ฒ•์€ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜์™€ ๊ฐ™์ด ํŒ๋‹ค์Šค ์˜ต์…˜์„ ๋ณ€๊ฒฝํ•ด ์ฃผ๋ฉด ๋ฉ๋‹ˆ๋‹ค.1) ๋ชจ๋“  ์—ด ์ถœ๋ ฅ์•„๋ž˜์˜ ๋ช…๋ น์–ด๋งŒ ์‹คํ–‰ํ•ด ์ฃผ๋ฉด ๋ชจ๋“  ์—ด์„ ์กฐํšŒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(๊ทธ๋ฆผ 2).pd.set_option('display.max_columns', None)2) ๋ชจ๋“  ํ–‰ ์ถœ๋ ฅ์œ ์‚ฌํ•˜๊ฒŒ ๋ชจ๋“  ํ–‰ ์ถœ๋ ฅํ•˜๋Š” ๋ช…..

SW ๊ฐœ๋ฐœ/Python 2024. 5. 21. 11:08
[Python] pandas ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋ฌธ์ž์—ด ๋ฐ”๊พธ๊ธฐ(replace, str.replace ํ•จ์ˆ˜)

๐Ÿ“Œ Text ๋น…๋ฐ์ดํ„ฐ๋ถ„์„ ํ”Œ๋žซํผ ๋ฒ ํƒ€ํ…Œ์ŠคํŠธ ์ฐธ๊ฐ€์ž ๋ชจ์ง‘ ์ค‘!(๋„ค์ด๋ฒ„ํŽ˜์ด 4๋งŒ ์› ์ „์› ์ง€๊ธ‰) ๐Ÿ‘‹ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ฝ”๋”ฉ์ด ํ•„์š” ์—†๋Š” AI/๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ All in One ํ”Œ๋žซํผ  ๊ฐœ๋ฐœํŒ€์ž…๋‹ˆ๋‹ค.๐Ÿ˜Š ์ €ํฌ ์„œ๋น„์Šค๋ฅผ ์‚ฌ์šฉํ•ด ๋ณด์‹œ๊ณ  ๊ฒฝํ—˜๋‹ด์„ ๋“ค๋ ค์ฃผ์„ธ์š” :)๐Ÿ’ธ ์ฐธ์—ฌํ•ด ์ฃผ์‹  "๋ชจ๋“ " ๋ถ„๋“ค๊ป˜ ๋„ค์ด๋ฒ„ํŽ˜์ด 4๋งŒ ์› ์ฟ ํฐ์„ ์ง€๊ธ‰ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค.๐Ÿ‘จ‍๐Ÿ’ป ์ฐธ์—ฌ ํฌ๋ง ์‹œ ์นดํ†กํ”Œ๋Ÿฌ์Šค์นœ๊ตฌ 1:1 ์ฑ„ํŒ… or ์ธ์Šคํƒ€๊ทธ๋žจ DM ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค :)๐Ÿ“† ์ฐธ์—ฌ๊ธฐ๊ฐ„ : 11/25(์›”)~11/29(๊ธˆ) 11:00~21:00 ์ค‘ ํƒ1 (1์‹œ๊ฐ„ 1ํƒ€์ž„)๐Ÿ‘‰ ์ฐธ์—ฌ์žฅ์†Œ : ๊ฐ•๋‚จ์—ญ ์ธ๊ทผ ์Šคํ„ฐ๋””์นดํŽ˜ ๋ฏธํŒ…Room๐Ÿ“ ์†Œ์š”์‹œ๊ฐ„ : ์ด 40๋ถ„ ๋‚ด์™ธ(์„œ๋น„์Šค ์ฒดํ—˜ ๋ฐ ์ธํ„ฐ๋ทฐ ํฌํ•จ)โœ… ์ฐธ๊ฐ€์กฐ๊ฑด : Text ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ์—…๋ฌด ๊ฒฝํ—˜์ž๐Ÿ‘‰ ์ฐธ๊ฐ€ ๊ฐ€๋Šฅ์ผ์ • ์กฐํšŒํ•˜๊ธฐ : ht..

[Python] 'Unnamed: 0" ์—†์ด ์—‘์…€ ํŒŒ์ผ ์ฝ์–ด์˜ค๊ธฐ

๋ณ€๊ฒฝ ์ „ ํŒŒ์ด์ฌ pandas ํŒจํ‚ค์ง€๋กœ ์—‘์…€ ํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์˜ค๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ํŒŒ์ผ์—๋Š” ์—†๋˜ ์นผ๋Ÿผ์ด ์ž๋™์œผ๋กœ ์ถ”๊ฐ€๋˜๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ผ๋‹จ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ์˜จ ํ›„์— ํ•ด๋‹น ์นผ๋Ÿผ์„ ์‚ญ์ œํ•˜๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ์ง€๋งŒ, ๋ฒˆ๊ฑฐ๋กœ์šด ์ž‘์—…์„ 2๋ฒˆ์— ํ•  ํ•„์š”๋Š” ์—†๊ฒ ์ฃ . ๊ทธ๋ž˜์„œ ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ์˜ฌ ๋•Œ๋ถ€ํ„ฐ ํ•ด๋‹น ์นผ๋Ÿผ์ด ์ž๋™์œผ๋กœ ์ƒ์„ฑ๋˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค. ๋ณ€๊ฒฝ ํ›„ "Unnamed: 0" ์นผ๋Ÿผ ์—†์ด ํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์˜ค๋Š” ๋ฐฉ๋ฒ•์€ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค. read ๋ฉ”์†Œ๋“œ ์‹คํ–‰ ์‹œ index_col ์˜ต์…˜ ๊ฐ’์„ 0์œผ๋กœ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. dataset = pd.read_csv("๋ฐ์ดํ„ฐ์…‹ ๊ฒฝ๋กœ", index_col = 0) dataset.head() ์œ„์™€ ๊ฐ™์ด ์˜ต์…˜์„ ์„ค์ •ํ•˜๋ฉด ์ด์ œ ํ•ด๋‹น ์นผ๋Ÿผ("Unnamed: 0") ์—†์ด ๋ฐ์ดํ„ฐ๊ฐ€..

[ํŒŒ์ด์ฌ] pandas๋ฅผ ํ™œ์šฉํ•œ ์—ด, ํ–‰ ์„ ํƒํ•˜๊ธฐ

์˜ค๋Š˜์€ ํŒŒ์ด์ฌ pandas ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ์—‘์…€์—์„œ ํŠน์ • ์—ด(column)์ด๋‚˜ ํ–‰(row)์„ ๋ถˆ๋Ÿฌ์˜ค๋Š” ๋ฐฉ๋ฒ•์„ ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! 1. pandas ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ import import pandas as pd pandas ์„ค์น˜๊ฐ€ ์•ˆ๋œ ๊ฒฝ์šฐ: ์•„๋ž˜ ์ฝ”๋“œ๋ฅผ ์ปค๋งจ๋“œ๋ผ์ธ/ํ„ฐ๋ฏธ๋„/์ฃผํ”ผํ„ฐ๋…ธํŠธ๋ถ ํ™˜๊ฒฝ ์ค‘์—์„œ ์„ค์น˜๋ถ€ํ„ฐ ์ง„ํ–‰ํ•ด ์ฃผ์„ธ์š”. pip install pandas 2. ๋ฐ์ดํ„ฐ์…‹ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ # ํŒŒ์ผ์ด xlsx ํ˜•์‹์ธ ๊ฒฝ์šฐ, dataset = pd.read_excel([ํŒŒ์ผ๊ฒฝ๋กœ], sheet_name = [๋ถˆ๋Ÿฌ์˜ฌ ์‹œํŠธ ์ด๋ฆ„]) # ํŒŒ์ผ์ด csv ํ˜•์‹์ธ ๊ฒฝ์šฐ, dataset = pd.read_csv([ํŒŒ์ผ๊ฒฝ๋กœ], sheet_name = [๋ถˆ๋Ÿฌ์˜ฌ ์‹œํŠธ ์ด๋ฆ„]) ํŒŒ์ผ ๊ฒฝ๋กœ๋ฅผ ๋Œ€๊ด„ํ˜ธ([]) ์•ˆ์— ๋”ฐ์˜ดํ‘œ('')์•ˆ์— ..