Análisis de correspondencia en R

Aprende a realizar análisis de correspondencia en R con esta guía paso a paso, ideal para visualizar relaciones en datos categóricos.

SOFTWARE RTUTORIALES

💡 ¿Análisis de correspondencia simple?

  • El análisis de correspondencias simples se aplica sobre tablas de contingencia.

  • El análisis de correspondencias es una técnica estadística descriptiva cuyo objetivo es mostrar relación entre variables. pudiendo obtener relaciones entre las variables presentes en la tabla.

Ejemplo

  • Se clasificó un grupo de estudiantes según la disciplina académica de su maestría y según la categoría de financiamiento obtenida para realizar dichos estudios. Estas categorías de financiamiento son cinco: A, B, C, D y E (A es la categoría de mayor financiamiento, D es la menor y la categoría E es no financiada.

# Guardado de tablas en una lista ------------------------------------------

Disciplina <- c("Geología","Bioquímica", "Química", "Zoología", "Física", "Ingeniería", "Microbiología", "Botánica", "Estadística", "Matemática")

Financiamiento <- c("A", "B", "C", "D", "E")

Tabla <- expand.grid(Financiamiento = Financiamiento, Disciplina = Disciplina)

data <- c(3, 19, 39, 14, 10, 1, 2, 13, 1, 12, 6, 25, 49, 21, 29, 3, 15, 41, 35, 26, 10, 22, 47, 9, 26, 3, 11, 25, 15, 34, 1, 6, 14, 5, 11, 0, 12, 34, 17, 23, 2, 5, 11, 4, 7, 2, 11, 37, 8, 20)

Tabla <- cbind(Tabla, Frecuencia = data)

Tabla <- xtabs(Frecuencia ~ Disciplina + Financiamiento, Tabla)

Tabla

  • Posteriormente guardamos las 3 tablas almacenadas en el objeto mis_tablas, en un libro de Excel, donde cada hoja, contendrá un elemento de nuestra lista de tablas anteriormente mencionadas.

# Ejecución del analisis de correspondencia -------------------------------

library(ca)

tabla_ca = ca(Tabla)

summary(tabla_ca)

plot(tabla_ca)

  • El gráfico final que nos permite hacer el análisis es el que sigue:

# CÓDIGO R

library(ca)

# Creacion de datos -------------------------------------------------------

Disciplina <- c("Geología","Bioquímica", "Química", "Zoología", "Física", "Ingeniería", "Microbiología", "Botánica", "Estadística", "Matemática")

Financiamiento <- c("A", "B", "C", "D", "E")

Tabla <- expand.grid(Financiamiento = Financiamiento, Disciplina = Disciplina)

data <- c(3, 19, 39, 14, 10, 1, 2, 13, 1, 12, 6, 25, 49, 21, 29, 3, 15, 41, 35, 26, 10, 22, 47, 9, 26, 3, 11, 25, 15, 34, 1, 6, 14, 5, 11, 0, 12, 34, 17, 23, 2, 5, 11, 4, 7, 2, 11, 37, 8, 20)

Tabla <- cbind(Tabla, Frecuencia = data)

Tabla <- xtabs(Frecuencia ~ Disciplina + Financiamiento, Tabla)

Tabla

# Ejecución del analisis de correspondencia -------------------------------

tabla_ca = ca(Tabla)

summary(tabla_ca)

plot(tabla_ca)