examen-2021-01-20
Justifica todas las respuestas. Por ejemplo, si tomas código fuente de internet indica de dónde lo has sacado.
- (2 puntos) En el ordenador carleos2.epv.uniovi.es hay una carpeta
/home/manadine/dat/examen que contiene mil carpetas "experimento1,…,1000".
Cada una de estas contiene varios ficheros; entre ellos, uno
llamado resumen.txt.
Explica cómo conseguirías tener en tu carpeta personal una carpeta ~/resultados que contenga mil carpetas "experimento1,…,1000" y que cada una contenga el correspondiente fichero "resumen.txt" y ninguno más.
- (1 punto) Averigua cómo se crearon los ficheros de la carpeta /home/manadine/dat/examen del ejercicio anterior. Pista: busca en la misma carpeta.
- (3 puntos) En http://carleos.epv.uniovi.es/~carleos/aireUO/dat/csv
dispones de datos horarios de contaminación atmosférica.
Cierta asociación médica aconseja que no se supere en más de 24 ocasiones por año el valor 150 para la medición horaria del dióxido de azufre (SO2). Comprueba si alguna estación no ha cumplido ese criterio. En cada contaminante, HI contiene la medida y FL toma el valor V si la medida es válida.
Para los siguientes ejercicios, ten en cuenta que el fichero base.txt contiene unos datos de referencia:
- Cada fila corresponde a un animal.
- Cada par de columnas corresponde a un locus = gen = marcador.
- Los números contenidos en las celdas representan alelos.
- La pareja de alelos de cierto locus en cierto animal se llama "genotipo para ese locus". Se trata de un par no ordenado, es decir, el genotipo (123,122) es lo mismo que el (122,123).
- Dos genotipos para cierto locus de dos animales coinciden si contienen los mismos alelos.
El fichero nuevos.txt es similar, y se trata de animales que van a compararse con los de la base.
- (1 punto) Haz un programa que, para cada nuevo animal, informe de si existe algún animal en la base con el que coincida para todo locus.
- (1 punto) Haz un programa que, para cada nuevo animal, informe de con cuántos animales en la base coincide para todo locus.
- (1 punto) Haz un programa que, para cada nuevo animal y cada animal de la base, informe de qué porcentaje de sus genotipos coinciden.
- (1 punto) Haz un programa que genere al azar conjuntos de datos como "base.txt" y "nuevos.txt", suponiendo que los alelos se muestrean al azar entre los valores 120, 121 y 122.