k-means

2.5.1

k-means

Atualizado 2020-01-29 Leitura 1 min
Resumo
  • O k-means segue uma regra intuitiva – agrupar pontos próximos – atualizando repetidamente os representantes dos clusters (centroides) até que as atribuições se estabilizem.
  • A função objetivo é a soma dos quadrados intra-cluster (WCSS), ou seja, a distância quadrática entre cada amostra e seu centroide atribuído.
  • Com o KMeans do scikit-learn você pode visualizar a convergência, experimentar esquemas de inicialização e inspecionar como as atribuições mudam.
  • A escolha de \(k\) tipicamente envolve diagnósticos como o método do cotovelo ou pontuações de silhueta, equilibrados com o conhecimento do domínio.

Intuição #

Este método deve ser interpretado por meio de suas suposições, condições dos dados e como as escolhas de parâmetros afetam a generalização.

Explicação Detalhada #