๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กClassification (2)

Hey Tech

[Python] ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด(Decision Tree)์˜ ์‚ฌ์šฉ์ด์œ , ์žฅ๋‹จ์ , ๋ชจ๋ธํ‰๊ฐ€๋ฐฉ๋ฒ•, ๋ณ€์ˆ˜ ์ค‘์š”๋„ ์‚ฐ์ถœ๋ฐฉ๋ฒ•

๐Ÿ“š ๋ชฉ์ฐจ 1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด๋ž€? 2. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์˜ ์žฅ๋‹จ์  3. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ตฌ์กฐ ๋ฐ ์šฉ์–ด 4. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์˜ ๋ถ„๋ฆฌ์กฐ๊ฑด 4.1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๋ชจ๋ธ๋ง 4.1.1. MSE(Mean Squared Error, ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ) 4.1.2. MAE(Mean Absolute Error, ํ‰๊ท  ์ ˆ๋Œ€ ์˜ค์ฐจ) 4.2. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜ ๋ชจ๋ธ๋ง 4.2.1. ์ง€๋‹ˆ ์ง€์ˆ˜(Gini Index) 4.2.2. ์—”ํŠธ๋กœํ”ผ ์ง€์ˆ˜(Entropy Index) 5. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๋ณ€์ˆ˜๋ณ„ ์ค‘์š”๋„ ๊ณ„์‚ฐ 1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด๋ž€? ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด(Decision Tree)๋Š” ์„ค๋ช…๋ณ€์ˆ˜(X) ๊ฐ„์˜ ๊ด€๊ณ„๋‚˜ ์ฒ™๋„์— ๋”ฐ๋ผ ๋ชฉํ‘œ๋ณ€์ˆ˜(Y)๋ฅผ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ์— ํ™œ์šฉ๋˜๋Š” ๋‚˜๋ฌด ๊ตฌ์กฐ์˜ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ์„ค๋ช…๋ณ€์ˆ˜์˜ ๊ด€์ธก๊ฐ’์„ ๋ชจ๋ธ์— ์ž…๋ ฅํ•ด ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ๋ถ„..

[ํ†ต๊ณ„] ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„(Logistic Regression)์˜ ์ดํ•ด

๐Ÿ“š ๋ชฉ์ฐจ 1. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ์ •์˜ 2. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์˜ ๋“ฑ์žฅ ๋ฐฐ๊ฒฝ 3. Odds(์˜ค์ฆˆ ๋˜๋Š” ์Šน์‚ฐ) ๋ฐ Odds Ratio (์˜ค์ฆˆ๋น„ ๋˜๋Š” ์Šน์‚ฐ๋น„) 3.1. Odds(์˜ค์ฆˆ ๋˜๋Š” ์Šน์‚ฐ) 3.2. Odds Ratio (์˜ค์ฆˆ๋น„ ๋˜๋Š” ์Šน์‚ฐ๋น„) 4. ์—ฐ๊ฒฐํ•จ์ˆ˜(Link Function) 5. ์šฐ๋„(๊ฐ€๋Šฅ๋„, Likehood) 1. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ์ •์˜ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์€ ์„ค๋ช…๋ณ€์ˆ˜(๋…๋ฆฝ๋ณ€์ˆ˜, X)์™€ ๋ฒ”์ฃผํ˜• ๋ชฉํ‘œ๋ณ€์ˆ˜(์ข…์†๋ณ€์ˆ˜, Y) ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ชจํ˜•ํ™”ํ•˜์—ฌ ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ๋ถ„์„ํ•˜๊ฑฐ๋‚˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•๋ก ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ, ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์„ ํ™œ์šฉํ•œ ๋ถ„๋ฅ˜(classification) ๋ฌธ์ œ์—์„œ๋Š” ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ์ง์ ‘ ์˜ˆ์ธก(prediction)ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹Œ 2๊ฐœ์˜ ํด๋ž˜์Šค(e.g., '์„ฑ๊ณต' or '์‹คํŒจ') ์ค‘ ํ•˜๋‚˜์˜ ํด๋ž˜์Šค๋กœ ์˜ˆ์ธกํ• ..