enunciadoJul
- Define una función llamada "r2larga" que tome como argumento un
dataframe y devuelva el coeficiente de determinación (R2) de la
regresión lineal siguiente:
- variable respuesta = la variable con el nombre más largo del dataframe
- variables regresoras = todas las demás del dataframe
(Aclaración: Por ejemplo, en "mtcars", las variables con nombre más largo son "disp", "drat", "qsec", "gear" y "carb". En casos así, donde hay varios máximos, podría tomarse como variable respuesta cualquiera de esas cinco.)
- Describe el fichero de datos ssh://carleos2.epv.uniovi.es:/home/manadine/dat/jovenes.csv (Aclaración: Di cuántos datos hay, qué variables y de qué tipo son, para cada cualitativas indica las dos categorías más frecuentes, para cada cuantitativa da mínimo y máximo.)
- Los rownames(mtcars) son cadenas que contienen marca y modelo de coches. ¿Cómo podrías obtener un vector de cadenas que contenga sólo la marca de cada coche, por ejemplo para hacer una tabla de frecuencias de las marcas?
- Dado un data frame, llamaremos "i-ésima regresión cruzada" a una regresión hecha con los datos del dataframe excepto con los de la fila número "i". Dado el dataframe "mtcars", que tiene 32 filas, obtén un vector con las 32 pendientes de las i-ésimas regresiones cruzadas, para i desde 1 hasta 32, de la variable "mpg" frente a "wt". (Aclaración: Si no sabes lo que es la pendiente, usa el coeficiente de determinación u otra cosa.)
- Explica qué efecto tiene la función "abbreviate", por ejemplo aplicada a rownames(mtcars). Úsala para hacer una nube de puntos de "mpg" sobre "wt" de "mtcars" donde en vez de puntos aparezcan los rownames abreviados.