2.5.1
k-means
Resumo
- O k-means segue uma regra intuitiva – agrupar pontos próximos – atualizando repetidamente os representantes dos clusters (centroides) até que as atribuições se estabilizem.
- A função objetivo é a soma dos quadrados intra-cluster (WCSS), ou seja, a distância quadrática entre cada amostra e seu centroide atribuído.
- Com o
KMeansdoscikit-learnvocê pode visualizar a convergência, experimentar esquemas de inicialização e inspecionar como as atribuições mudam. - A escolha de \(k\) tipicamente envolve diagnósticos como o método do cotovelo ou pontuações de silhueta, equilibrados com o conhecimento do domínio.
Intuição #
Este método deve ser interpretado por meio de suas suposições, condições dos dados e como as escolhas de parâmetros afetam a generalização.