\documentclass[12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage{amsmath, amssymb, amsthm}
\usepackage[spanish]{babel}
\usepackage{fullpage}
\newtheorem{teorema}{Teorema}
\newtheorem{lema}{Lema}
\theoremstyle{definition}
\newtheorem{definicion}{Definición}

\title{Distribución asintótica del estadístico $T^+$ de los rangos signados de Wilcoxon}
\author{deepseek.com}

\begin{document}

\maketitle
\raggedright
\section{Introducción}

Sea $X_1,\dots,X_n$ una muestra aleatoria simple de una distribución continua y simétrica respecto a $0$ (bajo la hipótesis nula). Definimos el estadístico de Wilcoxon para una muestra como
\[
T^+ = \sum_{i=1}^n R_i \, I_i,
\]
donde $R_i$ es el rango de $|X_i|$ entre $|X_1|,\dots,|X_n|$ (con $R_i \in \{1,\dots,n\}$) e $I_i = \mathbf{1}_{(0,\infty)}(X_i)$ es el indicador de que la observación es positiva.

El objetivo es demostrar que, bajo $H_0$, 
\[
\frac{T^+ - \mathbb{E}[T^+]}{\sqrt{\operatorname{Var}(T^+)}} \;\xrightarrow{d}\; \mathcal{N}(0,1),
\]
y proporcionar explícitamente la esperanza y la varianza.

\section{Independencia de signos y rangos}

Bajo $H_0$, la distribución de $X_i$ es simétrica continua alrededor de $0$. Entonces:
\begin{itemize}
  \item Los signos $\operatorname{sgn}(X_i)$ son independientes entre sí y de los valores absolutos $|X_i|$.
  \item Los rangos $R_i$ son una función únicamente de los valores absolutos, luego también son independientes de los signos.
  \item Además, los signos son equiprobables: $\mathbb{P}(I_i=1) = 1/2$, e independientes.
\end{itemize}
Por tanto, el vector $(R_1,\dots,R_n)$ es una permutación aleatoria uniforme de $\{1,\dots,n\}$ independiente de $(I_1,\dots,I_n)$.

\section{Esperanza y varianza de $T^+$}

\subsection{Esperanza}
Usando la independencia,
\[
\mathbb{E}[T^+] = \sum_{i=1}^n \mathbb{E}[R_i]\,\mathbb{E}[I_i] = \sum_{i=1}^n \frac{n+1}{2}\cdot\frac12 = \frac{n(n+1)}{4}.
\]

\subsection{Varianza}
No podemos sumar simplemente las varianzas porque los $R_i$ no son independientes. Sin embargo, aprovechamos que $\sum_{i=1}^n R_i = n(n+1)/2$ es constante.

\begin{align*}
\operatorname{Var}(T^+) &= \sum_{i=1}^n \operatorname{Var}(R_i I_i) + \sum_{i\neq j} \operatorname{Cov}(R_i I_i, R_j I_j).
\end{align*}
Dado que $I_i$ y $R_i$ son independientes:
\[
\operatorname{Var}(R_i I_i) = \mathbb{E}[R_i^2]\mathbb{E}[I_i^2] - (\mathbb{E}[R_i]\mathbb{E}[I_i])^2 = \frac12 \mathbb{E}[R_i^2] - \frac14 (\mathbb{E}[R_i])^2.
\]
Para $i\neq j$, usando la independencia entre $(I_i,I_j)$ y $(R_i,R_j)$,
\[
\operatorname{Cov}(R_i I_i, R_j I_j) = \mathbb{E}[R_i R_j]\mathbb{E}[I_i I_j] - \mathbb{E}[R_i]\mathbb{E}[I_i]\mathbb{E}[R_j]\mathbb{E}[I_j] = \frac14 \operatorname{Cov}(R_i,R_j).
\]
Entonces
\[
\operatorname{Var}(T^+) = \sum_i \Bigl(\frac12 \mathbb{E}[R_i^2] - \frac14 (\mathbb{E}R_i)^2\Bigr) + \frac14 \sum_{i\neq j} \operatorname{Cov}(R_i,R_j).
\]
Observamos que
\[
\sum_{i\neq j} \operatorname{Cov}(R_i,R_j) = -\sum_i \operatorname{Var}(R_i),
\]
pues $\operatorname{Var}(\sum_i R_i)=0$ implica $\sum_i \operatorname{Var}(R_i) + \sum_{i\neq j}\operatorname{Cov}(R_i,R_j)=0$.
Sustituyendo:
\begin{align*}
\operatorname{Var}(T^+) &= \sum_i \Bigl(\frac12 \mathbb{E}[R_i^2] - \frac14 (\mathbb{E}R_i)^2\Bigr) - \frac14 \sum_i \operatorname{Var}(R_i)\\
&= \sum_i \Bigl(\frac12 \mathbb{E}[R_i^2] - \frac14 (\mathbb{E}R_i)^2 - \frac14 \bigl(\mathbb{E}[R_i^2]-(\mathbb{E}R_i)^2\bigr)\Bigr)\\
&= \sum_i \frac14 \mathbb{E}[R_i^2].
\end{align*}
Como los rangos son una permutación de $\{1,\dots,n\}$, $\mathbb{E}[R_i^2] = \frac{1}{n}\sum_{k=1}^n k^2 = \frac{(n+1)(2n+1)}{6}$. Por tanto,
\[
\operatorname{Var}(T^+) = \frac14 \cdot n \cdot \frac{(n+1)(2n+1)}{6} = \frac{n(n+1)(2n+1)}{24}.
\]

\section{Distribución exacta de $T^+$ bajo $H_0$}

Un hecho clave: la distribución de $T^+$ no depende de la distribución subyacente de los $|X_i|$ y es idéntica a la de $\sum_{i=1}^n i\, B_i$, donde $B_1,\dots,B_n$ son independientes con $\mathbb{P}(B_i=1)=1/2$.

\begin{proof}
El vector de rangos $(R_1,\dots,R_n)$ es una permutación aleatoria uniforme independiente de los signos. Sea $\sigma$ la permutación tal que $R_{\sigma(i)} = i$. Entonces
\[
T^+ = \sum_{i=1}^n R_i I_i = \sum_{i=1}^n i\, I_{\sigma(i)}.
\]
Como $\sigma$ es independiente de $(I_1,\dots,I_n)$ y los $I_i$ son i.i.d. Bernoulli($1/2$), la variable $(I_{\sigma(1)},\dots,I_{\sigma(n)})$ tiene la misma distribución que $(I_1,\dots,I_n)$. Luego $T^+ \stackrel{d}{=} \sum_{i=1}^n i\, B_i$ con $B_i$ i.i.d. Bernoulli($1/2$). 
\end{proof}

\section{Normalidad asintótica mediante el TCL de Lindeberg}

Consideremos la representación $T^+ = \sum_{i=1}^n i B_i$ con $B_i$ i.i.d. Bernoulli($1/2$). Definimos
\[
Y_i = i B_i, \qquad \mu_i = \mathbb{E}[Y_i] = \frac{i}{2}, \qquad \sigma_i^2 = \operatorname{Var}(Y_i) = \frac{i^2}{4}.
\]
Entonces
\[
S_n = T^+ - \mathbb{E}[T^+] = \sum_{i=1}^n (Y_i - \mu_i), \qquad s_n^2 = \operatorname{Var}(S_n) = \sum_{i=1}^n \sigma_i^2 = \frac{n(n+1)(2n+1)}{24}.
\]
Para aplicar el teorema central del límite de Lindeberg a la suma de variables independientes (pero no idénticamente distribuidas) $\frac{S_n}{s_n}$, debemos verificar que para todo $\varepsilon>0$,
\[
\frac{1}{s_n^2} \sum_{i=1}^n \mathbb{E}\bigl[ (Y_i-\mu_i)^2 \mathbf{1}_{\{|Y_i-\mu_i| > \varepsilon s_n\}} \bigr] \longrightarrow 0 \quad (n\to\infty).
\]

Observamos que $|Y_i-\mu_i| \le \frac{i}{2} \le \frac{n}{2}$. Por otra parte,
\[
s_n = \sqrt{\frac{n(n+1)(2n+1)}{24}} \sim \frac{n^{3/2}}{\sqrt{12}} \quad (n\to\infty).
\]
Luego, para cualquier $\varepsilon>0$ fijo, existe $N$ tal que para todo $n\ge N$ se cumple $\frac{n}{2} < \varepsilon s_n$. En consecuencia, para $n$ suficientemente grande, el conjunto $\{|Y_i-\mu_i| > \varepsilon s_n\}$ es vacío, y la suma del límite de Lindeberg es exactamente $0$. Por tanto, la condición se satisface trivialmente.

Aplicando el TCL de Lindeberg, concluimos que
\[
\frac{T^+ - \mathbb{E}[T^+]}{\sqrt{\operatorname{Var}(T^+)}} \;\xrightarrow{d}\; \mathcal{N}(0,1).
\]

\section{Conclusión}

Hemos demostrado que bajo la hipótesis nula de simetría alrededor de cero:
\begin{itemize}
  \item $\mathbb{E}[T^+] = \frac{n(n+1)}{4}$,
  \item $\operatorname{Var}(T^+) = \frac{n(n+1)(2n+1)}{24}$,
  \item $\frac{T^+ - \mathbb{E}[T^+]}{\sqrt{\operatorname{Var}(T^+)}}$ converge en distribución a una normal estándar.
\end{itemize}
La prueba se basa en la independencia entre signos y rangos, la representación exacta de $T^+$ como suma ponderada de Bernoulli independientes, y la aplicación directa del teorema de Lindeberg.

\end{document}