La disponibilidad de genomas completos en multiples individuos ha supuesto un salto cualitativo en la caracterizacion de la biodiversidad y en la deteccion de patrones selectivos en especies de interes economico, tanto en agricultura como en ganaderia, con multiples aplicaciones potenciales para la mejora. Las tecnicas de secuenciacion de ultima generacion (ngs en sus siglas en ingles) han conseguido democratizar la genomica, pero la magnitud de los datos hace que hoy en dia su analisis sea un cuello de botella importante. Este proyecto tiene como objetivo paliar estas limitaciones mediante el desarrollo de metodos (wp1) y herramientas informaticas de facil uso (ngasp, wp2), asi como proveer recomendaciones sobre la utilizacion de datos de ngs en seleccion genomica. Finalmente, se analizaran datos de interes, tanto para la industria como para el estudio de la domesticacion y seleccion artificial en porcino. El paquete informatico ngasp (wp2) utilizara ficheros estandar bam, vcf, gff y considerara caracteristicas tipicas de datos ngs como los errores de secuenciacion y valores faltantes. El paquete incluira estadisticos y tests clasicos en genetica de poblaciones, asi como nuevas metodologias para detectar patrones de interes (por ejemplo procesos selectivos). Sera programado de manera escalable para poder incorporar nuevas funcionalidades en el futuro, tales como informacion sobre estudios de asociacion o seleccion genomica. Ngasp sera de uso libre y estara disponible en la web. En el paquete wp3, se realizara un estudio por simulacion para evaluar si los datos de ngs mejoran la respuesta a la seleccion genomica vs.La obtenida mediante chips de snps de alta densidad y, si lo hacen, en que condiciones. Se evaluaran diversos factores, tales como efectos demograficos, densidad del genotipado versus cobertura de ngs y la arquitectura genetica de los qtl. En el paquete wp4, se analizara una muestra de unos 130 genomas disponibles de cerdo para caracterizar el polimorfismo a lo largo del genoma y de la especie. En general, se propone estudiar las bases geneticas de la domesticacion y de la seleccion moderna. Estos analisis daran pie a utilizar nuevos conceptos, en particular, como incorporar informacion funcional sobre el genoma tales como rutas metabolicas. Como 'prueba de concepto', se analizaran datos sobre ingesta alimentaria de una empresa multinacional de porcino.
Palabras Clave / Keywords
- porcino
- secuenciación masiva
- selección
- desarrollo de software