Detection and classification of positive selection in human populations

Enllaç permanent


  • Resum

    Detecting positive selection in genomic regions is a recurrent topic in human population genetics studies. Over the years, many positive selection tests have been implemented to highlight specific genomic patterns left by a selective event when compared to neutral expectations. However, there is little consistency among the regions detected in several genome-wide scans using different tests and/or populations: population-specific demographic dynamics, local genomic features or different types of selection acting along the genome at different times and selective coefficients might explain such discrepancies. The present doctoral thesis is focused in the study of this problem and the development of a innovative solution: a machine-learning classification framework that exploits the combined ability of some selection tests to uncover the different features expected under the hard sweep model, such as sweep completeness and age of onset. The method was calibrated and applied to three reference populations from The 1000 Genome Project to generate a genome-wide classification map of hard selective sweeps. This study improves the way a selective sweep is detected by overcoming the classical selection vs. no-selection classification strategy, and offers an explanation to the lack of consistency observed among selection tests when applied to real data.
    La detecció de selecció positiva en regions genòmiques ha estat un tema recurrent en molts estudis de genètica de poblacions humanes. En conseqüència, durant els últims anys s'han publicat molts mètodes estadístics per detectar els senyals genòmics creats per un procés de selecció molecular. No obstant això, en general hi ha poca consistència entre les regions detectades pels diferents mètodes: dinàmiques demogràfiques especifiques de població, propietats locals de les regions analitzades o diferents tipus de selecció actuant a diferents marcs temporals i intensitats podrien explicar aquestes discrepàncies. Aquesta tesi doctoral està centrada en l'estudi d'aquest problema i en el desenvolupament d'una solució: un mètode de classificació de selecció positiva basat en algoritmes d'aprenentatge automàtic. El mètode combina diferents tests per detectar selecció positiva per obtenir informació sobre el tipus i mode de selecció que afecta una regió genòmica determinada. Aquest nou mètode presenta una alta sensitivitat cap a senyals de selecció positiva i és capaç de proveir informació sobre l'edat del esdeveniment selectiu, així com del seu estat final. Aquest treball millora la forma en què la selecció positiva és detectada avui en dia i proporciona una explicació a la falta de consistència observada entre els mètodes de detecció de selecció positiva quan s'apliquen en dades reals.
    Programa de doctorat en Biomedicina
  • Col·leccions

  • Mostra el registre complet