\documentclass[a4paper,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{amsmath,amssymb}
\usepackage{amsfonts}
\usepackage{hyperref}
\usepackage{geometry}
\geometry{a4paper, margin=2cm}
\usepackage[spanish]{babel}
\usepackage{amsthm}
\theoremstyle{plain}
\newtheorem{theorem}{Teorema}[section]
\title{Análisis de Correspondencias}
\author{Basado en las notas de Norberto Corral Blanco y Beatriz Sinova Fernández \\
Facultad de Ciencias, Universidad de Oviedo}


\begin{document}
\maketitle
\tableofcontents
\newpage

\section{Introducción}
El análisis de correspondencias es una técnica descriptiva para representar tablas de contingencia, cuyo objetivo es analizar la razón por la cual dos variables cualitativas no son independientes. Se utiliza habitualmente en tablas de gran tamaño, y permite resumir una gran cantidad de datos en un número reducido de dimensiones, con la menor pérdida de información posible. La técnica se basa en el trabajo de H.O. Hirschfeld (1935) y fue desarrollada por J.P. Benzécri (1973).

A diferencia del test chi-cuadrado de Pearson, que simplemente detecta la existencia de asociación, el análisis de correspondencias busca describir la \textbf{estructura de dicha asociación}: qué categorías de una variable se relacionan con qué categorías de la otra y en qué sentido.

\section{Notación}
Consideramos una tabla de contingencia donde la variable \(X\) (filas) tiene \(n\) categorías y la variable \(Y\) (columnas) tiene \(p\) categorías.
\begin{align*}
k_{ij} &= \text{número de observaciones en la fila } i \text{ y columna } j,\\
k_{i\cdot} &= \sum_{j=1}^{p} k_{ij} \quad \text{(total marginal de la fila } i),\\
k_{\cdot j} &= \sum_{i=1}^{n} k_{ij} \quad \text{(total marginal de la columna } j),\\
N &= \sum_{i=1}^{n}\sum_{j=1}^{p} k_{ij} \quad \text{(total de observaciones)}.
\end{align*}
Las frecuencias relativas y marginales son:
\[
f_{ij} = \frac{k_{ij}}{N}, \qquad f_{i\cdot} = \frac{k_{i\cdot}}{N} = \sum_{j=1}^{p} f_{ij}, \qquad f_{\cdot j} = \frac{k_{\cdot j}}{N} = \sum_{i=1}^{n} f_{ij}.
\]
Se cumple \(\sum_{i=1}^{n} f_{i\cdot} = \sum_{j=1}^{p} f_{\cdot j} = 1\).

\section{Perfiles fila y distancia \(\chi^2\)}

Cada categoría fila \(i\) se caracteriza por su \textbf{perfil}, que es la distribución condicionada de las columnas dado \(i\):
\[
i \;\longrightarrow\; \left( \frac{f_{ij}}{f_{i\cdot}} \right)_{j=1}^{p}.
\]
Bajo independencia (\(f_{ij} = f_{i\cdot} f_{\cdot j}\)), todos los perfiles fila serían idénticos al vector de marginales columna: \((f_{\cdot j})_{j=1}^{p}\). Por tanto, la asociación entre \(X\) e \(Y\) se traduce en \textbf{dispersión de los perfiles fila} respecto de este perfil medio.

Para medir dicha dispersión se introduce la \textbf{distancia \(\chi^2\)} entre dos filas \(i\) e \(i'\):
\[
d^2(i,i') = \sum_{j=1}^{p} \frac{1}{f_{\cdot j}} \left( \frac{f_{ij}}{f_{i\cdot}} - \frac{f_{i'j}}{f_{i'\cdot}} \right)^2.
\]
El factor \(1/f_{\cdot j}\) pondera cada columna de forma inversamente proporcional a su frecuencia, para que las diferencias en categorías raras tengan más importancia relativa que las mismas diferencias en categorías muy frecuentes.

Esta distancia puede reescribirse como una distancia euclídea estándar si redefinimos las coordenadas del punto fila:
\[
i \;\longrightarrow\; \vec{x}_i = \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} \right)_{j=1}^{p}.
\]
En efecto,
\[
d^2(i,i') = \sum_{j=1}^{p} \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} - \frac{f_{i'j}}{f_{i'\cdot}\sqrt{f_{\cdot j}}} \right)^2 = \|\vec{x}_i - \vec{x}_{i'}\|^2.
\]

\subsection{Propiedad de equivalencia distribucional}
Si dos puntos fila \(i_1\) e \(i_2\) tienen idénticos perfiles, es decir,
\[
\frac{f_{i_1 j}}{f_{i_1\cdot}} = \frac{f_{i_2 j}}{f_{i_2\cdot}}, \quad \forall j=1,\dots,p,
\]
y se agrupan en una única categoría \(i_0\) (con \(f_{i_0 j}=f_{i_1 j}+f_{i_2 j}\) y \(f_{i_0\cdot}=f_{i_1\cdot}+f_{i_2\cdot}\)), entonces la distancia entre dos columnas \(j\) y \(j'\) no se altera. 
\begin{proof}
La distancia \(\chi^2\) entre columnas se define de manera análoga:
\[
d^2(j,j') = \sum_{i=1}^{n} \frac{1}{f_{i\cdot}} \left( \frac{f_{ij}}{f_{\cdot j}} - \frac{f_{ij'}}{f_{\cdot j'}} \right)^2.
\]
Separando los sumandos correspondientes a \(i_1\) e \(i_2\) y usando la igualdad de perfiles \(\frac{f_{i_1 j}}{f_{i_1\cdot}} = \frac{f_{i_2 j}}{f_{i_2\cdot}} = \frac{f_{i_0 j}}{f_{i_0\cdot}}\), se tiene:
\begin{align*}
\frac{1}{f_{i_1\cdot}} \left( \frac{f_{i_1 j}}{f_{\cdot j}} - \frac{f_{i_1 j'}}{f_{\cdot j'}} \right)^2 
&= f_{i_1\cdot} \left( \frac{f_{i_0 j}/f_{i_0\cdot}}{f_{\cdot j}} - \frac{f_{i_0 j'}/f_{i_0\cdot}}{f_{\cdot j'}} \right)^2,\\
\frac{1}{f_{i_2\cdot}} \left( \frac{f_{i_2 j}}{f_{\cdot j}} - \frac{f_{i_2 j'}}{f_{\cdot j'}} \right)^2 
&= f_{i_2\cdot} \left( \frac{f_{i_0 j}/f_{i_0\cdot}}{f_{\cdot j}} - \frac{f_{i_0 j'}/f_{i_0\cdot}}{f_{\cdot j'}} \right)^2.
\end{align*}
Sumando ambas contribuciones se obtiene
\[
(f_{i_1\cdot}+f_{i_2\cdot}) \left( \frac{f_{i_0 j}/f_{i_0\cdot}}{f_{\cdot j}} - \frac{f_{i_0 j'}/f_{i_0\cdot}}{f_{\cdot j'}} \right)^2
= \frac{1}{f_{i_0\cdot}} \left( \frac{f_{i_0 j}}{f_{\cdot j}} - \frac{f_{i_0 j'}}{f_{\cdot j'}} \right)^2,
\]
que es exactamente el sumando que corresponde a la categoría agrupada \(i_0\). Por tanto, \(d^2(j,j')\) queda invariante.
\end{proof}

\section{Análisis de componentes principales sobre los perfiles}
El objetivo es analizar la variabilidad de la nube de puntos fila, ponderada por las masas \(f_{i\cdot}\), en el espacio \(\mathbb{R}^p\). Para ello se aplica un análisis de componentes principales a las variables
\[
\text{variable } j \;\longrightarrow\; \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} \right)_{i=1}^{n}.
\]
Las etapas son las habituales: centrar las variables, calcular la matriz de covarianzas, obtener valores y vectores propios, y proyectar.

\subsection{Centrado}
La esperanza (media ponderada por \(f_{i\cdot}\)) de la variable \(j\) es
\[
E(j) = \sum_{i=1}^{n} \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}}\, f_{i\cdot}
= \frac{1}{\sqrt{f_{\cdot j}}} \sum_{i=1}^{n} f_{ij}
= \frac{f_{\cdot j}}{\sqrt{f_{\cdot j}}} = \sqrt{f_{\cdot j}}.
\]
Las coordenadas centradas del punto fila \(i\) son, por tanto,
\[
i \;\longrightarrow\; \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} - \sqrt{f_{\cdot j}} \right)_{j=1}^{p}.
\]

\subsection{Matriz de covarianzas}
La covarianza entre las variables \(j\) y \(j'\) se calcula como:
\[
\operatorname{Cov}(j,j') = \sum_{i=1}^{n} f_{i\cdot} \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} - \sqrt{f_{\cdot j}} \right)
\left( \frac{f_{ij'}}{f_{i\cdot}\sqrt{f_{\cdot j'}}} - \sqrt{f_{\cdot j'}} \right).
\]
Definimos los coeficientes
\[
w_{ij} = \frac{f_{ij}}{\sqrt{f_{i\cdot} f_{\cdot j}}} - \sqrt{f_{i\cdot} f_{\cdot j}},
\]
con lo cual la covarianza anterior se reescribe como
\[
\operatorname{Cov}(j,j') = \sum_{i=1}^{n} w_{ij}\, w_{ij'}.
\]
Así, la matriz de varianzas-covarianzas de las \(p\) variables es
\[
T = W^t W, \qquad \text{donde } W = (w_{ij})_{\substack{i=1,\dots,n\\ j=1,\dots,p}}.
\]
Nótese que cada \(w_{ij}\) puede interpretarse como el \textbf{residuo tipificado} de Pearson:
\[
w_{ij} = \frac{f_{ij} - f_{i\cdot}f_{\cdot j}}{\sqrt{f_{i\cdot}f_{\cdot j}}}.
\]

\subsection{Valores y vectores propios}
Sean \(\lambda_1 \ge \lambda_2 \ge \cdots \ge \lambda_p \ge 0\) los valores propios de \(T = W^t W\) y \(\vec{u}_1, \vec{u}_2, \dots, \vec{u}_p\) los vectores propios ortonormales asociados.

\begin{theorem}[Valor propio nulo]
La matriz \(T\) tiene un valor propio igual a 0, con vector propio \(\vec{u}_p = \bigl(\sqrt{f_{\cdot j}}\bigr)_{j=1}^{p}\).
\end{theorem}
\begin{proof}
Basta comprobar que \(W \vec{u}_p = \vec{0}\), ya que entonces \(W^t W \vec{u}_p = \vec{0}\). Para cada fila \(i\),
\begin{align*}
\sum_{j=1}^{p} w_{ij}\, \sqrt{f_{\cdot j}}
&= \sum_{j=1}^{p} \left( \frac{f_{ij}}{\sqrt{f_{i\cdot} f_{\cdot j}}} - \sqrt{f_{i\cdot} f_{\cdot j}} \right) \sqrt{f_{\cdot j}}\\
&= \sum_{j=1}^{p} \frac{f_{ij}}{\sqrt{f_{i\cdot}}} - \sqrt{f_{i\cdot}} \sum_{j=1}^{p} f_{\cdot j}\\
&= \frac{1}{\sqrt{f_{i\cdot}}} f_{i\cdot} - \sqrt{f_{i\cdot}} \cdot 1 = 0.
\end{align*}
Por tanto, \(W\vec{u}_p = \vec{0}\) y \(\vec{u}_p\) es vector propio de \(T\) con valor propio \(0\).
\end{proof}

La existencia de este valor propio nulo refleja que las frecuencias marginales suman 1 y, en consecuencia, la nube de puntos está contenida en un subespacio de dimensión a lo sumo \(p-1\).

\subsection{Equivalencia con la matriz de frecuencias relativas condicionadas}
En muchos textos se trabaja directamente con la matriz \(W^*\) de términos
\[
w^*_{ij} = \frac{f_{ij}}{\sqrt{f_{i\cdot} f_{\cdot j}}}.
\]
La relación con \(W\) es \(w_{ij} = w^*_{ij} - \sqrt{f_{i\cdot}f_{\cdot j}}\).

\begin{theorem}[Equivalencia de vectores propios]
Todo vector propio \(\vec{u}_\alpha\) de \(W^t W\) con \(\alpha \neq p\) (asociado a \(\lambda_\alpha\)) es también vector propio de \((W^*)^t W^*\) asociado al mismo valor propio \(\lambda_\alpha\).
\end{theorem}
\begin{proof}
Sea \(\vec{u}_\alpha\) con \(\alpha \neq p\) tal que \(W^t W \vec{u}_\alpha = \lambda_\alpha \vec{u}_\alpha\). La componente \(j'\)-ésima de \(W^t W \vec{u}_\alpha\) es
\[
\sum_{j=1}^{p} \sum_{i=1}^{n} w_{ij'} w_{ij} \, u_{\alpha j}.
\]
Sustituyendo \(w_{ij} = w^*_{ij} - \sqrt{f_{i\cdot}f_{\cdot j}}\) y desarrollando:
\begin{align*}
\sum_{j=1}^{p} \sum_{i=1}^{n} w_{ij'} w_{ij} u_{\alpha j}
&= \sum_{i=1}^{n} w_{ij'} \sum_{j=1}^{p} w^*_{ij} u_{\alpha j} \;-\; \sum_{i=1}^{n} w_{ij'} \sqrt{f_{i\cdot}} \sum_{j=1}^{p} \sqrt{f_{\cdot j}}\, u_{\alpha j}.
\end{align*}
Como \(\vec{u}_\alpha\) es ortogonal a \(\vec{u}_p = (\sqrt{f_{\cdot j}})\), se tiene \(\sum_{j} \sqrt{f_{\cdot j}} u_{\alpha j} = 0\), luego el segundo sumando se anula.
Análogamente, podemos reexpresar \(\sum_i w_{ij'} w^*_{ij}\) y, tras un cálculo similar, se llega a que la componente \(j'\)-ésima de \((W^*)^t W^* \vec{u}_\alpha\) coincide con la de \(W^t W \vec{u}_\alpha\). De manera concisa:
\[
(W^*)^t W^* \vec{u}_\alpha = W^t W \vec{u}_\alpha + \text{términos que contienen } \sum_j \sqrt{f_{\cdot j}} u_{\alpha j}=0,
\]
por lo que \((W^*)^t W^* \vec{u}_\alpha = \lambda_\alpha \vec{u}_\alpha\).
\end{proof}

\begin{theorem}[Valor propio unidad de \(W^*\)]
El vector \(\vec{u}_p = (\sqrt{f_{\cdot j}})_{j=1}^{p}\) es vector propio de \((W^*)^t W^*\) asociado al valor propio \(1\).
\end{theorem}
\begin{proof}
Para cada \(j'\), la componente \(j'\)-ésima de \((W^*)^t W^* \vec{u}_p\) es
\begin{align*}
\sum_{j=1}^{p} \sum_{i=1}^{n} \frac{f_{ij'}}{\sqrt{f_{i\cdot}f_{\cdot j'}}} \frac{f_{ij}}{\sqrt{f_{i\cdot}f_{\cdot j}}} \sqrt{f_{\cdot j}}
&= \frac{1}{\sqrt{f_{\cdot j'}}} \sum_{i=1}^{n} \frac{f_{ij'}}{f_{i\cdot}} \sum_{j=1}^{p} f_{ij} \\
&= \frac{1}{\sqrt{f_{\cdot j'}}} \sum_{i=1}^{n} f_{ij'} = \frac{f_{\cdot j'}}{\sqrt{f_{\cdot j'}}} = \sqrt{f_{\cdot j'}}.
\end{align*}
Así, \((W^*)^t W^* \vec{u}_p = 1 \cdot \vec{u}_p\). 
\end{proof}

En consecuencia, los valores propios no nulos de \(T\) coinciden con los de \((W^*)^t W^*\) excepto el valor propio \(1\) que reemplaza al \(0\) de \(T\). En la práctica, se trabaja con los vectores propios de \(W^t W\) (o de \((W^*)^t W^*\) omitiendo el asociado a \(1\)).

\section{Puntuaciones factoriales (componentes principales)}
\subsection{Puntos fila en \(\mathbb{R}^p\)}
La puntuación del punto fila \(i\) en el eje \(\alpha\) (con \(\alpha \neq p\)) es:
\[
\psi_{\alpha i} = \sum_{j=1}^{p} \left( \frac{f_{ij}}{f_{i\cdot}\sqrt{f_{\cdot j}}} \right) u_{\alpha j},
\]
donde se ha omitido el término \(-\sqrt{f_{\cdot j}}\) porque \(\sum_j \sqrt{f_{\cdot j}} u_{\alpha j} = 0\) para \(\alpha \neq p\). En notación matricial, \(\Psi = W^* U\).

\subsection{Puntos columna en \(\mathbb{R}^n\)}
De manera simétrica, los puntos columna se representan mediante sus perfiles:
\[
j \;\longrightarrow\; \left( \frac{f_{ij}}{f_{\cdot j}\sqrt{f_{i\cdot}}} \right)_{i=1}^{n},
\]
cuya esperanza es \(\sqrt{f_{i\cdot}}\). La puntuación de la columna \(j\) en el eje \(\alpha\) es
\[
\varphi_{\alpha j} = \sum_{i=1}^{n} \left( \frac{f_{ij}}{f_{\cdot j}\sqrt{f_{i\cdot}}} \right) v_{\alpha i},
\]
donde \(\vec{v}_\alpha\) es el vector propio unitario de \(W W^t\) asociado a \(\lambda_\alpha\).

\section{Relaciones de transición y espacio conjunto}
La descomposición en valores singulares de \(W\) (o de \(W^*\)) vincula los dos espacios. Como \(W = \sum_{\alpha=1}^{p} \sqrt{\lambda_\alpha}\, \vec{v}_\alpha \vec{u}_\alpha^t\), se verifican las \textbf{fórmulas de transición}:
\[
\vec{v}_\alpha = \frac{1}{\sqrt{\lambda_\alpha}} W \vec{u}_\alpha, \qquad
\vec{u}_\alpha = \frac{1}{\sqrt{\lambda_\alpha}} W^t \vec{v}_\alpha.
\]
Desarrollando la primera:
\begin{align*}
v_{\alpha i} &= \frac{1}{\sqrt{\lambda_\alpha}} \sum_{j=1}^{p} \left( \frac{f_{ij}}{\sqrt{f_{i\cdot}f_{\cdot j}}} - \sqrt{f_{i\cdot}f_{\cdot j}} \right) u_{\alpha j}\\
&= \frac{1}{\sqrt{\lambda_\alpha}} \sum_{j=1}^{p} \frac{f_{ij}}{\sqrt{f_{i\cdot}f_{\cdot j}}} u_{\alpha j} 
   = \frac{\sqrt{f_{i\cdot}}}{\sqrt{\lambda_\alpha}} \, \psi_{\alpha i},
\end{align*}
donde se ha usado que \(\sum_j \sqrt{f_{\cdot j}} u_{\alpha j}=0\). Por tanto,
\[
\boxed{\psi_{\alpha i} = \frac{\sqrt{\lambda_\alpha}}{\sqrt{f_{i\cdot}}} \, v_{\alpha i}, \qquad
\varphi_{\alpha j} = \frac{\sqrt{\lambda_\alpha}}{\sqrt{f_{\cdot j}}} \, u_{\alpha j}.}
\]

Las relaciones entre las puntuaciones de filas y columnas se obtienen inmediatamente:
\[
\varphi_{\alpha j} = \frac{1}{\lambda_\alpha} \sum_{i=1}^{n} \frac{f_{ij}}{f_{\cdot j}} \,\psi_{\alpha i}, \qquad
\psi_{\alpha i} = \frac{1}{\lambda_\alpha} \sum_{j=1}^{p} \frac{f_{ij}}{f_{i\cdot}} \,\varphi_{\alpha j}.
\]
Estas expresiones muestran que, salvo un factor de escala, cada puntuación columna es un promedio ponderado de las puntuaciones fila, y viceversa. Esta \textbf{relación baricéntrica} permite representar puntos fila y columna en un mismo plano factorial, interpretando la proximidad entre una fila y una columna como indicio de asociación.

\subsection{Acotación de los valores propios}
\begin{theorem}
Todos los valores propios \(\lambda_\alpha\) de \(W^t W\) son menores o iguales que \(1\).
\end{theorem}
\begin{proof}
Supongamos que existe \(\lambda_\alpha > 1\). Usando la relación \(\varphi_{\alpha j} = \frac{1}{\lambda_\alpha} \sum_{i} \frac{f_{ij}}{f_{\cdot j}} \psi_{\alpha i}\), y teniendo en cuenta que \(\frac{f_{ij}}{f_{\cdot j}} \ge 0\) y \(\sum_i \frac{f_{ij}}{f_{\cdot j}} = 1\), \(\varphi_{\alpha j}\) es una combinación lineal convexa de los \(\psi_{\alpha i}\). Por tanto,
\[
|\varphi_{\alpha j}| \le \max_i |\psi_{\alpha i}|.
\]
Como \(\lambda_\alpha > 1\), el factor \(1/\lambda_\alpha\) hace que la desigualdad sea estricta para algún \(j\), obteniéndose \(\max_j |\varphi_{\alpha j}| < \max_i |\psi_{\alpha i}|\). Aplicando el mismo razonamiento a la relación inversa \(\psi_{\alpha i} = \frac{1}{\lambda_\alpha} \sum_j \frac{f_{ij}}{f_{i\cdot}} \varphi_{\alpha j}\), se deduce que \(\max_i |\psi_{\alpha i}| < \max_j |\varphi_{\alpha j}|\). Ambas desigualdades son contradictorias, a menos que \(\max_i |\psi_{\alpha i}| = \max_j |\varphi_{\alpha j}| = 0\). Pero en ese caso el eje \(\alpha\) tendría varianza nula, lo que es imposible para \(\alpha \neq p\) por la definición de los valores propios. En consecuencia, \(\lambda_\alpha \le 1\).
\end{proof}

\section{Reconstrucción de la tabla de frecuencias}
Las frecuencias relativas \(f_{ij}\) pueden recuperarse completamente a partir de los marginales y de las puntuaciones factoriales.

\begin{theorem}[Fórmula de reconstrucción]
\[
f_{ij} = f_{i\cdot} f_{\cdot j} \left( 1 + \sum_{\alpha=1}^{p-1} \frac{1}{\sqrt{\lambda_\alpha}} \psi_{\alpha i}\, \varphi_{\alpha j} \right).
\]
(El sumatorio se extiende hasta \(p-1\) porque \(\lambda_p = 0\) y el término correspondiente se anula; en la versión con \(W^*\) se suma sobre \(\alpha=2,\dots,p\) con \(\lambda_1=1\) y \(\psi_{1i}=\varphi_{1j}=1\).)
\end{theorem}
\begin{proof}
Partimos de la descomposición espectral de \(W^*\). Como \(W^* = \sum_{\alpha=1}^{p} \sqrt{\lambda_\alpha}\, \vec{v}_\alpha \vec{u}_\alpha^t\), el elemento \((i,j)\) de \(W^*\) es
\[
\frac{f_{ij}}{\sqrt{f_{i\cdot}f_{\cdot j}}} = \sum_{\alpha=1}^{p} \sqrt{\lambda_\alpha}\, v_{\alpha i} u_{\alpha j}.
\]
Sustituyendo \(v_{\alpha i} = \frac{\sqrt{f_{i\cdot}}}{\sqrt{\lambda_\alpha}} \psi_{\alpha i}\) y \(u_{\alpha j} = \frac{\sqrt{f_{\cdot j}}}{\sqrt{\lambda_\alpha}} \varphi_{\alpha j}\), se obtiene
\begin{align*}
\frac{f_{ij}}{\sqrt{f_{i\cdot}f_{\cdot j}}}
&= \sum_{\alpha=1}^{p} \sqrt{\lambda_\alpha} \, \frac{\sqrt{f_{i\cdot}}}{\sqrt{\lambda_\alpha}} \psi_{\alpha i}\, \frac{\sqrt{f_{\cdot j}}}{\sqrt{\lambda_\alpha}} \varphi_{\alpha j}\\
&= \sqrt{f_{i\cdot}f_{\cdot j}} \sum_{\alpha=1}^{p} \frac{1}{\sqrt{\lambda_\alpha}} \psi_{\alpha i} \varphi_{\alpha j}.
\end{align*}
Multiplicando ambos lados por \(\sqrt{f_{i\cdot}f_{\cdot j}}\) y notando que para \(\alpha = p\) se tiene \(\lambda_p=0\) (ese término se anula) o, si se prefiere, teniendo en cuenta que el eje trivial (\(\lambda=1\)) tiene \(\psi_{1i}=\varphi_{1j}=1\), se llega a
\[
f_{ij} = f_{i\cdot}f_{\cdot j} \left( 1 + \sum_{\alpha=2}^{p} \frac{1}{\sqrt{\lambda_\alpha}} \psi_{\alpha i} \varphi_{\alpha j} \right),
\]
que es la expresión deseada (con el sumatorio sobre los ejes no triviales).
\end{proof}

\section{Contribuciones absolutas y relativas}
\subsection{Contribuciones absolutas}
Indican la parte de variabilidad del eje \(\alpha\) explicada por cada punto.
\[
\text{Fila } i: \quad \operatorname{Ca}_\alpha(i) = \frac{f_{i\cdot} \psi_{\alpha i}^2}{\lambda_\alpha}, \qquad
\text{Columna } j: \quad \operatorname{Ca}_\alpha(j) = \frac{f_{\cdot j} \varphi_{\alpha j}^2}{\lambda_\alpha}.
\]
Se cumple \(\sum_i \operatorname{Ca}_\alpha(i) = \sum_j \operatorname{Ca}_\alpha(j) = 1\).

\subsection{Contribuciones relativas (o calidades de representación)}
Representan la aportación del eje \(\alpha\) a la distancia del punto al centroide (origen).
\[
\operatorname{Cr}_i(\alpha) = \frac{\psi_{\alpha i}^2}{d^2(i,G)}, \qquad
\operatorname{Cr}_j(\alpha) = \frac{\varphi_{\alpha j}^2}{d^2(j,G)},
\]
donde \(d^2(i,G) = \sum_{\alpha=1}^{p-1} \psi_{\alpha i}^2\) es la distancia al cuadrado del punto \(i\) al centro de la nube.

\section{Puntos suplementarios}
En ocasiones, ciertas categorías fila o columna no deben intervenir en la construcción de los ejes (por ser \textit{outliers}, tener una masa muy grande o ser categorías ilustrativas). Estos \textbf{puntos suplementarios} se proyectan después, usando las relaciones de transición, sin afectar a la inercia de los ejes.

Si las frecuencias del punto suplementario son \(k_{ij}^+\), con totales \(k_{i\cdot}^+\) y \(k_{\cdot j}^+\), sus puntuaciones son:
\[
\psi_{\alpha i}^+ = \frac{1}{\sqrt{\lambda_\alpha}} \sum_{j=1}^{p} \frac{k_{ij}^+}{k_{i\cdot}^+}\, \varphi_{\alpha j}, \qquad
\varphi_{\alpha j}^+ = \frac{1}{\sqrt{\lambda_\alpha}} \sum_{i=1}^{n} \frac{k_{ij}^+}{k_{\cdot j}^+}\, \psi_{\alpha i}.
\]

\end{document}