CS/์ธ๊ณต์ง๋ฅ
2024. 10. 18.
k-ํ๊ท ์๊ณ ๋ฆฌ์ฆ (k-means clustering) ๊ตฌํ
K-means ํด๋ฌ์คํฐ๋ง์ด๋?์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ๋๋๋ ๋น์ง๋ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ ๊ตฐ์ง(ํด๋ฌ์คํฐ)์ ์ค์ฌ์ ๋ฐ๋ณต์ ์ผ๋ก ์
๋ฐ์ดํธํ์ฌ, ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ๊ฐ์ฅ ๊ฐ๊น์ด ์ค์ฌ(์ผํธ๋ก์ด๋)์ ํ ๋นํ๋ ๋ฐฉ์์ผ๋ก ๋์ํ๋ค. ๋์๋ฐฉ์ K๊ฐ์ ์ด๊ธฐ ์ค์ฌ(centroid)์ ๋ฌด์์๋ก ์ ํํ๋ค.๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ๊ฐ์ฅ ๊ฐ๊น์ด ์ค์ฌ์ ํ ๋นํ๋ค.๊ฐ ํด๋ฌ์คํฐ์ ์ค์ฌ์ ๋ค์ ๊ณ์ฐํ๋ค.์ค์ฌ์ด ๋ ์ด์ ๋ณํ์ง ์๊ฑฐ๋, ์ง์ ๋ ๋ฐ๋ณต ํ์์ ๋๋ฌํ ๋๊น์ง 2~3 ๋จ๊ณ๋ฅผ ๋ฐ๋ณตํ๋ค. ๋ชฉํK-means ํด๋ฌ์คํฐ๋ง์ ๊ตฌํํ๋ค. ์ ์ฝ์กฐ๊ฑด- ๋ ๋ฒ์ ๋ฐ๋ณต ๋์ ๋ชจ๋ ์ค์ฌ์ (centroids)์ ์์น๊ฐ 1 * 10^-5 ์ดํ๋ก ๋ณํ ๊ฒฝ์ฐ ์๋ ดํ๋ค๊ณ ๊ฐ์ฃผํ๋ค.- K-means ํด๋ฌ์คํฐ๋ง๊ณผ ๊ด๋ จ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ ๋ ์ฌ์ฉํ์ง..