๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กํŒŒ์ด์ฌ๊ฒฐ์ธก์น˜ (1)

Hey Tech

[ํŒŒ์ด์ฌ] ๊ฒฐ์ธก์น˜(Na, NaN, Null) ์ œ๊ฑฐ/๋ณ€ํ™˜ํ•˜๊ธฐ!

์˜ค๋Š˜์€ ํŒŒ์ด์ฌ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด ๊ฒฐ์ธก์น˜(Na, NaN, Null)๋ฅผ ์ œ๊ฑฐ/์น˜ํ™˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ import import numpy as np import pandas as pd ๊ฒฐ์ธก์น˜ ์กด์žฌ์œ ๋ฌด ํ™•์ธ # ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด null ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜ ์นด์šดํŒ…. np.sum(pd.isnull(๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„)) ์œ„ ๋ช…๋ น์–ด๋ฅผ ํ†ตํ•ด ์–ด๋–ค ์นผ๋Ÿผ์—, ๋ช‡ ๊ฐœ์˜ ๊ฒฐ์ธก์น˜๊ฐ€ ์กด์žฌํ•˜๋Š”์ง€ ๋ฆฌ์ŠคํŠธ์˜ ํ˜•ํƒœ๋กœ ํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(์•„๋ž˜ ์Šคํฌ๋ฆฐ์ƒท ์ฐธ๊ณ ). ์ฐธ๊ณ ๋กœ isnull ๋ฉ”์†Œ๋“œ๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์—์„œ ๊ฒฐ์ธก์น˜๊ฐ€ ์กด์žฌํ•˜๋ฉด True๋ฅผ, ๊ฒฐ์ธก์น˜๊ฐ€ ์•„๋‹Œ ๋ฐ์ดํ„ฐ ์œ„์น˜์—์„œ๋Š” False๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ์ธก์น˜ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ๋ฒ• # ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด ๊ฒฐ์ธก์น˜๊ฐ€ ํฌํ•จํ•œ ๋ชจ๋“  ํ–‰์„ ์ œ๊ฑฐ dataset_drop = dataset_orig..

SW ๊ฐœ๋ฐœ/Python 2021. 2. 2. 09:53