13.7 Clústering con k-medias

La función kmeans de R aplica el algoritmo de las k-medias para encontrar grupos de observaciones similares. Puedes visitar https://www.datanalytics.com/2016/04/18/visualizacion-de-k-medias-y-dbscan/ para ver una animación que muestra cómo funciona el algoritmo.

Vamos a ilustrar el uso de este algoritmo con R usando iris para tratar de agrupar los registros en tres grupos por sus variables numéricas (una limitación de k-medias):

dat <- iris[,1:4]
res <- kmeans(dat, 3)

Investiga el objeto res. Busca en particular el grupo al que el el algoritmo asocia cada observación.

Compara los clústers obtenidos con las especies (conocidas). Nota: puede servirte hacer table(iris\(Species, res\)cluster).

Repite el ejercicio anterior 3 o 4 veces: ¿obtienes los mismos (o equivalentes) resultados cada vez?

Haz lo mismo pero usando 4 clústers.