CS/์ธ๊ณต์ง๋ฅ
2024. 10. 17.
SVM ์ ํ์ฉํ ์คํธ ๋ถ๋ฅ๊ธฐ ( Spam Classification via SVM )
SVM(Support Vector Machine)์ด๋?๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ์ด ๋ชจ๋ธ์ ๊ฒฐ์ ์ดํ๋ฉด(hyperplane)์ ์ฐพ์์, ๋ ๊ฐ์ ํด๋์ค๋ฅผ ๊ฐ์ฅ ํฐ ์ฌ์ (margin)๋ฅผ ๋๊ณ ๋ถ๋ฆฌํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค. ์ฃผ๋ก ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ์์ ์ฌ์ฉ๋๋ ๊ฐ๋ ฅํ ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, ์ด๋ฉ์ผ์ ๋จ์ด ๋น๋๋ฅผ ํน์ง์ผ๋ก ์ฌ์ฉํ์ฌ ์คํธ ๋๋ ์คํธ์ด ์๋ ์ด๋ฉ์ผ์ ๋ถ๋ฅํ๋ ๋ฐ ์ฌ์ฉํ ์ ์๋ค.์ ํ ๋ถ๋ฅ๊ธฐ ๋๋ ๋น์ ํ ๋ถ๋ฅ๊ธฐ๋ก ์ฌ์ฉํ ์ ์๋ค.์ปค๋ ํธ๋ฆญ์ ์ฌ์ฉํด ๊ณ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋งคํํ์ฌ ๋น์ ํ ๋ถ๋ฅ๋ ๊ฐ๋ฅํ๊ฒ ํ๋ค.ํ๋ ๋ง์ง(hard margin)๊ณผ ์ํํธ ๋ง์ง(soft margin)์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ๋ถ๋ฅ๋ฅผ ์ ์ฐํ๊ฒ ์กฐ์ ํ ์ ์๋ค.๋ชฉํํ๋ ๋ง์ง SVM, ์ํํธ ๋ง์ง SVM, ๊ฐ์ฐ์์ R..