Análisis de correspondencia en R
Aprende a realizar análisis de correspondencia en R con esta guía paso a paso, ideal para visualizar relaciones en datos categóricos.
SOFTWARE RTUTORIALES
💡 ¿Análisis de correspondencia simple?
El análisis de correspondencias simples se aplica sobre tablas de contingencia.
El análisis de correspondencias es una técnica estadística descriptiva cuyo objetivo es mostrar relación entre variables. pudiendo obtener relaciones entre las variables presentes en la tabla.
Ejemplo
Se clasificó un grupo de estudiantes según la disciplina académica de su maestría y según la categoría de financiamiento obtenida para realizar dichos estudios. Estas categorías de financiamiento son cinco: A, B, C, D y E (A es la categoría de mayor financiamiento, D es la menor y la categoría E es no financiada.
# Guardado de tablas en una lista ------------------------------------------
Disciplina <- c("Geología","Bioquímica", "Química", "Zoología", "Física", "Ingeniería", "Microbiología", "Botánica", "Estadística", "Matemática")
Financiamiento <- c("A", "B", "C", "D", "E")
Tabla <- expand.grid(Financiamiento = Financiamiento, Disciplina = Disciplina)
data <- c(3, 19, 39, 14, 10, 1, 2, 13, 1, 12, 6, 25, 49, 21, 29, 3, 15, 41, 35, 26, 10, 22, 47, 9, 26, 3, 11, 25, 15, 34, 1, 6, 14, 5, 11, 0, 12, 34, 17, 23, 2, 5, 11, 4, 7, 2, 11, 37, 8, 20)
Tabla <- cbind(Tabla, Frecuencia = data)
Tabla <- xtabs(Frecuencia ~ Disciplina + Financiamiento, Tabla)
Tabla


Posteriormente guardamos las 3 tablas almacenadas en el objeto mis_tablas, en un libro de Excel, donde cada hoja, contendrá un elemento de nuestra lista de tablas anteriormente mencionadas.
# Ejecución del analisis de correspondencia -------------------------------
library(ca)
tabla_ca = ca(Tabla)
summary(tabla_ca)
plot(tabla_ca)


El gráfico final que nos permite hacer el análisis es el que sigue:
# CÓDIGO R
library(ca)
# Creacion de datos -------------------------------------------------------
Disciplina <- c("Geología","Bioquímica", "Química", "Zoología", "Física", "Ingeniería", "Microbiología", "Botánica", "Estadística", "Matemática")
Financiamiento <- c("A", "B", "C", "D", "E")
Tabla <- expand.grid(Financiamiento = Financiamiento, Disciplina = Disciplina)
data <- c(3, 19, 39, 14, 10, 1, 2, 13, 1, 12, 6, 25, 49, 21, 29, 3, 15, 41, 35, 26, 10, 22, 47, 9, 26, 3, 11, 25, 15, 34, 1, 6, 14, 5, 11, 0, 12, 34, 17, 23, 2, 5, 11, 4, 7, 2, 11, 37, 8, 20)
Tabla <- cbind(Tabla, Frecuencia = data)
Tabla <- xtabs(Frecuencia ~ Disciplina + Financiamiento, Tabla)
Tabla
# Ejecución del analisis de correspondencia -------------------------------
tabla_ca = ca(Tabla)
summary(tabla_ca)
plot(tabla_ca)

