MAnáDINe-TIplE
Aviso: Hay que justificar todas las respuestas, detallando el razonamiento o haciendo referencia a los apuntes o a cualquier fuente de internet.
Elabora un informe con tus respuestas del examen y envíalo, junto a los
anexos que consideres oportunos, a carleos@uniovi.es
- (1'2 puntos) ¿Qué lenguajes serían recomendables para…
- …programar un algoritmo que tiene que ir muy rápido?
- …programar a alto nivel un servidor de macrodatos (hadoop, spark, flink…)?
- …obtener la derivada simbólica de una función matemática?
- …acceder a un banco de datos genómico?
- …programar a alto nivel procedimientos matemáticos, pero que vayan muy rápido?
- …usar los últimos algoritmos estadísticos?
- …operar con matrices cómodamente?
- …hallar estadísticos descriptivos de un banco de datos que quepa en la memoria RAM?
- …hallar estadísticos descriptivos de un banco de datos que no quepa en la memoria RAM?
- …buscar ficheros en un disco duro que cumplan ciertas condiciones?
- …filtrar (quedarse con ciertas filas) de un fichero muy grande?
- …quedarse con los caracteres del décimo al vigésimo de cada renglón de un fichero muy grande?
- (1'5 puntos) Crea un fichero
listado.txt
a partir de la salida del comando de Bash siguiente:find /usr/share/doc -ls
La columna segunda contiene la cantidad de bloques ocupados en KiB (quibioctetos).
La columna sétima contiene el tamaño de los ficheros en octetos.
- Mediante
cut
, obtén un ficherooctetos.txt
que contenga sólo las dos columnas mencionadas arriba.Si no están bien alineadas las columnas en el fichero original, prueba a entubarlo a través del comando
column -t
- Haz lo mismo que en el anterior, pero mediante
awk
. - Mediante
awk
, obtén la media y la desviación típica de la segunda columna. - Obtén el máximo de cada columna.
- Mediante
awk
, obtén un ficherooctetos+.txt
que contenga, además, una columna con la diferencia entre octetos ocupados y octetos reales de cada fichero.
- Mediante
- (0'6) En el fichero
paises.ods
aparece la columna DENSIDAD, medida en habitantes por km2.- Calcula la densidad global.
- Calcula una nueva columna que sea la densidad en habitantes por milla cuadrada de cada país, sabiendo que cada milla es igual (más o menos) a 1'6 km.
- (0'5) ¿Cuántos ficheros hay en
/usr/share/doc
cuyo tamaño supere los 10.000 octetos? - (0'3) Considera los datos de R llamados
mtcars
. Di cómo puedes calcular coeficiente de determinación R2 entre el pesowt
y la "aceleración"qsec
y usarlo en un programa. - (1'5) Considera los datos de R llamados
AirPassengers
. Es un objeto de clasets
(serie temporal) que puede parecer una matriz pero, en este caso, es un vector con algún atributo adicional. Los elementos del vector son los totales mensuales de viajeros (en miles). ¿Cómo puedes obtener un vector (más corto) de totales anuales de viajeros? - (0'3) ¿Cómo encuentras en el sistema todos los ficheros cuyo nombre contiene la cadena
BSD
? - (0'5) ¿Cuáles son las cinco palabras más frecuentes del fichero
GFDL
? - (1 punto) Visita la página del I.N.E.
- Pincha a la izquierda en «INEbase, la información estadística».
- Pincha en «censos de población y viviendas 2011».
- Pincha a la izquierda en «resultados detallados».
- Pincha abajo en «ficheros de microdatos».
- Personas y hogares: Pincha en «fichero nacional» y guarda el archivo y descomprímelo.
- Personas y hogares: Pincha en «diseño de registro y valores válidos de las variables».
- Haz un diagrama de barras o histograma de la distribución de edades.
- (1 punto) Define una función en R que calcule la desviación mediana (la mediana de los valores absolutos de las diferencias respecto a la mediana)
y aplícala a todas las variables de
pisa2012
, sólo para los datos de España. - (0'6 puntos) ¿Cuáles son los tres años con más datos y los tres años con menos datos en el fichero
vuelos.csv
? - (1 punto) Haz un gráfico de barras de los años de nacimiento de las
vacas.csv
que no tienen dato de genotipo.