Variation du numéro de copie - Copy number variation

Cette duplication de gène a créé une variation du nombre de copies. Le chromosome a maintenant deux copies de cette section d'ADN, plutôt qu'une.

La variation du nombre de copies ( CNV ) est un phénomène dans lequel des sections du génome sont répétées et le nombre de répétitions dans le génome varie entre les individus. La variation du nombre de copies est un type de variation structurelle : plus précisément, il s'agit d'un type d' événement de duplication ou de suppression qui affecte un nombre considérable de paires de bases. Environ les deux tiers de l'ensemble du génome humain peuvent être composés de répétitions et 4,8 à 9,5 % du génome humain peuvent être classés comme des variations du nombre de copies. Chez les mammifères , les variations du nombre de copies jouent un rôle important dans la génération de la variation nécessaire dans la population ainsi que dans le phénotype de la maladie.

Les variations du nombre de copies peuvent être généralement classées en deux groupes principaux : les répétitions courtes et les répétitions longues. Cependant, il n'y a pas de frontières claires entre les deux groupes et la classification dépend de la nature des loci d'intérêt. Les répétitions courtes comprennent principalement les répétitions dinucléotidiques (deux nucléotides répétés par exemple ACACAC...) et les répétitions trinucléotidiques. Les répétitions longues comprennent les répétitions de gènes entiers. Cette classification basée sur la taille de la répétition est le type de classification le plus évident car la taille est un facteur important dans l'examen des types de mécanismes qui ont le plus probablement donné lieu aux répétitions, d'où les effets probables de ces répétitions sur le phénotype.

Types et réarrangements chromosomiques

L'un des exemples les plus connus d'une variation du nombre de copies courtes est la répétition trinucléotidique des paires de bases CAG dans le gène de la huntingtine responsable du trouble neurologique de la maladie de Huntington . Dans ce cas particulier, une fois que le trinucléotide CAG se répète plus de 36 fois dans une expansion de répétition de trinucléotides , la maladie de Huntington se développera probablement chez l'individu et sera probablement héritée par sa progéniture. Le nombre de répétitions du trinucléotide CAG est corrélé à l' âge d'apparition de la maladie de Huntington. On pense souvent que ces types de répétitions courtes sont dus à des erreurs dans l' activité de la polymérase pendant la réplication, y compris le glissement de la polymérase, la commutation de modèle et la commutation de fourche qui seront discutés en détail plus tard. La taille de répétition courte de ces variations du nombre de copies se prête à des erreurs dans la polymérase car ces régions répétées sont sujettes à une mauvaise reconnaissance par la polymérase et les régions répliquées peuvent être répliquées à nouveau, conduisant à des copies supplémentaires de la répétition. De plus, si ces répétitions trinucléotidiques se trouvent dans le même cadre de lecture dans la partie codante d'un gène, cela peut conduire à une longue chaîne du même acide aminé , créant éventuellement des agrégats de protéines dans la cellule, et si ces courtes répétitions tombent dans le partie non codante du gène, elle peut affecter l'expression et la régulation des gènes . D'autre part, un nombre variable de répétitions de gènes entiers est moins communément identifié dans le génome. Un exemple de répétition de gène entier est le gène de l' alpha-amylase 1 (AMY1) qui code pour l'alpha-amylase qui a une variation significative du nombre de copies entre différentes populations avec différents régimes alimentaires. Bien que le mécanisme spécifique qui permet au gène AMY1 d'augmenter ou de diminuer son nombre de copies soit toujours un sujet de débat, certaines hypothèses suggèrent que la jonction d'extrémité non homologue ou la jonction d'extrémité médiée par la microhomologie est probablement responsable de ces répétitions de gène entier. Les répétitions de gènes entiers ont des effets immédiats sur l'expression de ce gène particulier, et le fait que la variation du nombre de copies du gène AMY1 ait été liée au régime alimentaire est un exemple remarquable d'adaptation évolutive humaine récente. Bien que ce soient les groupes généraux dans lesquels les variations du nombre de copies sont regroupées, le nombre exact de paires de bases affectées par les variations du nombre de copies dépend des loci spécifiques d'intérêt. Actuellement, en utilisant les données de toutes les variations du nombre de copies signalées, la taille moyenne de la variante du nombre de copies est d'environ 118 Ko et la médiane est d'environ 18 Ko.

En termes d'architecture structurelle des variations du nombre de copies, la recherche a suggéré et défini des régions de points chauds dans le génome où les variations du nombre de copies sont quatre fois plus enrichies. Ces régions de points chauds ont été définies comme des régions contenant de longues répétitions similaires à 90 à 100 %, connues sous le nom de duplications segmentaires en tandem ou entrecoupées et, plus important encore, ces régions de points chauds ont un taux accru de réarrangement chromosomique . On pensait que ces réarrangements chromosomiques à grande échelle donnaient lieu à des variations normales et à des maladies génétiques , y compris des variations du nombre de copies. De plus, ces points chauds de variation du nombre de copies sont cohérents dans de nombreuses populations de différents continents, ce qui implique que ces points chauds ont été soit acquis indépendamment par toutes les populations et transmis de génération en génération, soit ils ont été acquis au début de l'évolution humaine avant la scission des populations, ce dernier semble plus probable. Enfin, les biais spatiaux de l'emplacement où les variations du nombre de copies sont le plus densément distribuées ne semblent pas se produire dans le génome. Bien qu'il ait été initialement détecté par hybridation fluorescente in situ et analyse microsatellite que les répétitions du nombre de copies sont localisées dans des régions hautement répétitives telles que les télomères , les centromères et l' hétérochromatine , des études récentes à l'échelle du génome ont conclu autrement. À savoir, les régions subtélomériques et les régions péricentromériques sont celles où se trouvent la plupart des points chauds de réarrangement chromosomique, et il n'y a pas d'augmentation considérable des variations du nombre de copies dans cette région. De plus, ces régions de points chauds de réarrangement chromosomique n'ont pas de nombre de gènes diminué, ce qui implique encore une fois qu'il y a un biais spatial minimal de l'emplacement génomique des variations du nombre de copies.

Détection et identification

On pensait initialement que la variation du nombre de copies occupait une partie extrêmement petite et négligeable du génome grâce à des observations cytogénétiques . Les variations du nombre de copies n'étaient généralement associées qu'à de petites répétitions en tandem ou à des troubles génétiques spécifiques. Par conséquent, les variations du nombre de copies n'étaient initialement examinées qu'en termes de loci spécifiques. Cependant, les développements technologiques ont conduit à un nombre croissant de moyens très précis d'identifier et d'étudier les variations du nombre de copies. Les variations du nombre de copies ont été étudiées à l'origine par des techniques cytogénétiques, qui sont des techniques permettant d'observer la structure physique du chromosome. L'une de ces techniques est l' hybridation fluorescente in situ (FISH) qui consiste à insérer des sondes fluorescentes qui nécessitent un degré élevé de complémentarité dans le génome pour la liaison. L'hybridation génomique comparative a également été couramment utilisée pour détecter les variations du nombre de copies par visualisation au fluorophore , puis en comparant la longueur des chromosomes. Un inconvénient majeur de ces premières techniques est que la résolution génomique est relativement faible et que seules de grandes répétitions telles que des répétitions de gènes entiers peuvent être détectées.

Les progrès récents des technologies génomiques ont donné naissance à de nombreuses méthodes importantes qui sont d'une résolution génomique extrêmement élevée et, par conséquent, un nombre croissant de variations du nombre de copies du génome ont été signalées. Initialement, ces avancées impliquaient l'utilisation d' une matrice de chromosomes artificiels bactériens (BAC) avec environ 1 mégabase d'intervalles dans l'ensemble du gène, les BAC peuvent également détecter les variations du nombre de copies dans les points chauds de réarrangement permettant la détection de 119 nouvelles variations du nombre de copies. Le séquençage génomique à haut débit a révolutionné le domaine de la génomique humaine et des études in silico ont été réalisées pour détecter les variations du nombre de copies dans le génome. Les séquences de référence ont été comparées à d'autres séquences d'intérêt utilisant des fosmides en contrôlant strictement les clones de fosmides à 40 kb. Le séquençage des lectures finales fournirait des informations adéquates pour aligner la séquence de référence sur la séquence d'intérêt, et tout défaut d'alignement est facilement perceptible, ainsi conclu comme étant des variations du nombre de copies dans cette région du clone. Ce type de technique de détection offre une haute résolution génomique et une localisation précise de la répétition dans le génome, et il peut également détecter d'autres types de variations structurelles telles que les inversions.

De plus, une autre façon de détecter la variation du nombre de copies consiste à utiliser des polymorphismes nucléotidiques simples (SNP). En raison de l'abondance des données SNP humaines, la direction de détection de la variation du nombre de copies a changé pour utiliser ces SNP. S'appuyant sur le fait que la recombinaison humaine est relativement rare et que de nombreux événements de recombinaison se produisent dans des régions spécifiques du génome connues sous le nom de points chauds de recombinaison, le déséquilibre de liaison peut être utilisé pour identifier les variations du nombre de copies. Des efforts ont été faits pour associer les variations du nombre de copies avec des SNP d' haplotypes spécifiques en analysant le déséquilibre de liaison, en utilisant ces associations, on est capable de reconnaître les variations du nombre de copies dans le génome en utilisant les SNP comme marqueurs. Les techniques de séquençage de nouvelle génération , y compris le séquençage de lecture courte et longue, sont de nos jours de plus en plus utilisées et ont commencé à remplacer les techniques basées sur les matrices pour détecter les variations du nombre de copies. Contrairement aux techniques basées sur les matrices, les méthodes de détection basées sur le séquençage identifient facilement d'autres classes de variation structurelle telles que les inversions et les translocations .

Mécanisme moléculaire

Il existe deux principaux types de mécanismes moléculaires pour la formation de variations du nombre de copies : à base homologue et à base non homologue. Bien que de nombreuses suggestions aient été avancées, la plupart de ces théories sont des spéculations et des conjectures. Il n'y a aucune preuve concluante qui corrèle une variation spécifique du nombre de copies à un mécanisme spécifique.

Représentation schématique de la recombinaison homologue non allélique. Ici, le gène X représente le gène d'intérêt et la ligne noire représente le chromosome. Lorsque les deux chromosomes homologues sont mal alignés et qu'une recombinaison se produit, cela peut entraîner une duplication du gène.

L'une des théories les mieux reconnues qui conduit à des variations du nombre de copies ainsi qu'à des suppressions et des inversions est celle des recombinaisons homologues non alléliques . Au cours de la recombinaison méiotique , les chromosomes homologues s'apparient et forment deux cassures bicaténaires aboutissant à des jonctions Holliday . Cependant, dans le mécanisme aberrant, lors de la formation des jonctions Holliday, les cassures double brin sont désalignées et le croisement atterrit dans des positions non alléliques sur le même chromosome. Lorsque la jonction Holliday est résolue, l'événement de croisement inégal permet le transfert de matériel génétique entre les deux chromosomes homologues et, par conséquent, une partie de l'ADN sur les deux homologues est répétée. Étant donné que les régions répétées ne se séparent plus indépendamment , la région dupliquée du chromosome est héritée. Un autre type de mécanisme basé sur la recombinaison homologue qui peut entraîner une variation du nombre de copies est connu sous le nom de réplication induite par rupture. Lorsqu'une cassure double brin se produit de manière inattendue dans le génome, la cellule active des voies qui interviennent dans la réparation de la cassure. Des erreurs de réparation de la cassure, similaires à une recombinaison homologue non allélique, peuvent entraîner une augmentation du nombre de copies d'une région particulière du génome. Lors de la réparation d'une cassure double brin, l'extrémité cassée peut envahir son chromosome homologue au lieu de rejoindre le brin d'origine. Comme dans le mécanisme de recombinaison homologue non allélique, une copie supplémentaire d'une région particulière est transférée vers un autre chromosome, entraînant un événement de duplication. De plus, les protéines de cohésine aident au système de réparation des cassures double brin en serrant les deux extrémités à proximité immédiate, ce qui empêche l'invasion interchromosomique des extrémités. Si, pour une raison quelconque, telle que l'activation de l'ARN ribosomique , l'activité de la cohésine est affectée, il peut y avoir une augmentation locale des erreurs de réparation des cassures double brin.

L'autre classe de mécanismes possibles qui sont supposés conduire à des variations du nombre de copies n'est pas basée sur l'homologie. Pour faire la distinction entre cela et les mécanismes à base homologue, il faut comprendre le concept d'homologie. L'appariement homologue de chromosomes implique l'utilisation de brins d'ADN très similaires (~ 97%) et ces brins doivent être plus longs qu'une certaine longueur pour éviter des appariements courts mais très similaires. Les appariements non homologues, en revanche, ne reposent que sur quelques paires de bases de similitude entre deux brins, il est donc possible que du matériel génétique soit échangé ou dupliqué dans le processus de réparations double brin non homologues.

Un type de mécanisme à base non homologue est le mécanisme de jonction d'extrémité non homologue ou de jonction d'extrémité de micro-homologie . Ces mécanismes sont également impliqués dans la réparation des cassures double brin mais ne nécessitent aucune homologie ou micro-homologie limitée. Lorsque ces brins sont réparés, il y a souvent de petites suppressions ou insertions ajoutées dans le brin réparé. Il est possible que des rétrotransposons soient insérés dans le génome par ce système de réparation. Si des rétrotransposons sont insérés dans une position non allélique sur le chromosome, la recombinaison méiotique peut entraîner la recombinaison de l'insertion dans le même brin qu'une copie déjà existante de la même région. Un autre mécanisme est le cycle rupture-fusion-pont qui implique des chromatides sœurs qui ont toutes deux perdu leur région télomérique en raison de ruptures double brin. Il est proposé que ces chromatides sœurs fusionnent pour former un chromosome dicentrique , puis se séparent en deux noyaux différents. Parce que séparer le chromosome dicentrique provoque une cassure double brin, les régions terminales peuvent fusionner avec d'autres cassures double brin et répéter le cycle. La fusion de deux chromatides sœurs peut provoquer une duplication inversée et lorsque ces événements se répètent tout au long du cycle, la région inversée se répète, entraînant une augmentation du nombre de copies. Le dernier mécanisme pouvant entraîner des variations du nombre de copies est le glissement de la polymérase, également appelé changement de modèle. Au cours de la réplication normale de l'ADN, la polymérase sur le brin retardé est nécessaire pour débloquer et rebloquer la région de réplication en continu. Lorsque des répétitions à petite échelle dans la séquence d'ADN existent déjà, la polymérase peut être « confuse » lorsqu'elle se re-serre pour continuer la réplication et au lieu de se fixer sur les paires de bases correctes, elle peut déplacer quelques paires de bases et répliquer une partie de la répétition région à nouveau. Notez que bien que cela ait été observé expérimentalement et soit un mécanisme largement accepté, les interactions moléculaires qui ont conduit à cette erreur restent inconnues. De plus, étant donné que ce type de mécanisme nécessite que la polymérase saute autour du brin d'ADN et qu'il est peu probable que la polymérase puisse se re-clamper à un autre locus à quelques kilobases d'intervalle, cela est donc plus applicable aux répétitions courtes telles que les répétitions dinucléotidiques ou trinucléotidiques.

Gène de l'alpha-amylase

Chronologie du changement du régime alimentaire des hominidés au cours des périodes paléolithique, mésolithique et néolithique tardives. Comme on le voit, les légumes-racines riches en amidon sont consommés il y a environ 20 000 ans, lorsque le nombre de gènes diploïdes AMY1 devait augmenter.

L'amylase est une enzyme de la salive qui est responsable de la décomposition de l' amidon en monosaccharides , et un type d'amylase est codé par le gène de l'alpha-amylase (AMY1). Le locus AMY1, ainsi que l'enzyme amylase, est l'un des gènes les plus étudiés et séquencés du génome humain. Ses homologues se trouvent également chez d'autres primates et il est donc probable que le gène AMY1 du primate soit ancestral du gène humain AMY1 et qu'il ait été adapté au début de l'évolution des primates. AMY1 est l'un des gènes les mieux étudiés qui possède une large gamme de nombres variables de copies dans différentes populations humaines. Le gène AMY1 est également l'un des rares gènes étudiés à présenter des preuves convaincantes corrélant sa fonction protéique à son nombre de copies. Le nombre de copies est connu pour altérer la transcription ainsi que les niveaux de traduction d'un gène particulier, mais la recherche a montré que la relation entre les niveaux de protéines et le nombre de copies est variable. Dans les gènes AMY1 des Américains d'origine européenne, on constate que la concentration d'amylase salivaire est étroitement corrélée au nombre de copies du gène AMY1. En conséquence, il a été émis l'hypothèse que le nombre de copies du gène AMY1 est étroitement corrélé à sa fonction protéique, qui consiste à digérer l'amidon.

Le nombre de copies du gène AMY1 s'est avéré être corrélé à différents niveaux d'amidon dans les régimes alimentaires de différentes populations. 8 Les populations de différents continents ont été classées en régimes riches en amidon et en régimes pauvres en amidon et leur nombre de copies du gène AMY1 a été visualisé à l'aide de FISH et qPCR haute résolution . Il a été constaté que les populations à régime riche en amidon, qui comprennent les populations japonaises, Hadza et européennes américaines, avaient un nombre moyen de copies AMY1 significativement plus élevé (2 fois plus élevé) que les populations à faible régime en amidon, notamment les populations Biaka, Mbuti, Datog et Yakut. Il a été émis l'hypothèse que les niveaux d'amidon dans le régime alimentaire normal, le substrat d'AMY1, peuvent affecter directement le nombre de copies du gène AMY1. Depuis qu'il a été conclu que le nombre de copies d'AMY1 est directement corrélé à l'amylase salivaire, plus il y a d'amidon présent dans l'alimentation quotidienne de la population, plus il est favorable sur le plan de l'évolution d'avoir plusieurs copies du gène AMY1. Le gène AMY1 a été le premier gène à fournir des preuves solides de l'évolution au niveau de la génétique moléculaire . De plus, en utilisant l'hybridation génomique comparative , les variations du nombre de copies des génomes entiers de la population japonaise ont été comparées à celles de la population Yakut. Il a été constaté que la variation du nombre de copies du gène AMY1 était significativement différente de la variation du nombre de copies dans d'autres gènes ou régions du génome, suggérant que le gène AMY1 était soumis à une forte pression sélective qui n'avait que peu ou pas d'influence sur l'autre copie. variations de nombre. Enfin, la variabilité de longueur de 783 microsatellites entre les deux populations a été comparée à la variabilité du nombre de copies du gène AMY1. Il a été constaté que la plage du nombre de copies du gène AMY1 était plus large que celle de plus de 97 % des microsatellites examinés. Cela implique que la sélection naturelle a joué un rôle considérable dans la formation du nombre moyen de gènes AMY1 dans ces deux populations. Cependant, comme seules 6 populations ont été étudiées, il est important de considérer la possibilité qu'il puisse y avoir d'autres facteurs dans leur régime alimentaire ou leur culture qui ont influencé le nombre de copies AMY1 autres que l'amidon.

Arbre phylogénétique simplifié de la lignée des grands singes et nombre de gènes diploïdes AMY1 que possède chaque espèce. Le nombre de gènes AMY1 augmente après la scission avec la lignée des chimpanzés.

Bien qu'il ne soit pas clair quand le nombre de copies du gène AMY1 a commencé à augmenter, il est connu et confirmé que le gène AMY1 existait chez les premiers primates. Les chimpanzés , les parents évolutifs les plus proches de l'homme, se sont avérés avoir 2 copies diploïdes du gène AMY1 dont la longueur est identique au gène AMY1 humain, ce qui est significativement inférieur à celui des humains. D'autre part, les bonobos , également un proche parent de l'homme moderne, ont plus de 2 copies diploïdes du gène AMY1. Néanmoins, les gènes AMY1 des bonobos ont été séquencés et analysés, et il a été constaté que les séquences codantes des gènes AMY1 étaient perturbées, ce qui peut conduire à la production d'amylase salivaire dysfonctionnelle. On peut déduire des résultats que l'augmentation du nombre de copies des bonobos AMY1 n'est probablement pas corrélée à la quantité d'amidon dans leur alimentation. Il a en outre été émis l'hypothèse que l'augmentation du nombre de copies avait commencé récemment au début de l' évolution des hominidés, car aucun des grands singes n'avait plus de deux copies du gène AMY1 qui produisait une protéine fonctionnelle. En outre, il a été supposé que l'augmentation du nombre de copies d'AMY1 a commencé il y a environ 20 000 ans, lorsque les humains sont passés d'un mode de vie de chasseurs-cueilleurs à des sociétés agricoles , ce qui était également à l'époque où les humains dépendaient fortement des légumes-racines riches en amidon. Cette hypothèse, bien que logique, manque de preuves expérimentales en raison des difficultés à recueillir des informations sur l'évolution des régimes alimentaires humains, en particulier sur les légumes-racines riches en amidon car ils ne peuvent pas être directement observés ou testés. Des percées récentes dans le séquençage de l'ADN ont permis aux chercheurs de séquencer de l'ADN plus ancien comme celui des Néandertaliens avec un certain degré de précision. Peut-être que le séquençage de l'ADN de Néandertal peut fournir un marqueur temporel du moment où le nombre de copies du gène AMY1 a augmenté et offrir un aperçu du régime alimentaire humain et de l'évolution des gènes.

Actuellement, on ne sait pas quel mécanisme a donné lieu à la duplication initiale du gène de l'amylase, et cela peut impliquer que l'insertion des séquences rétrovirales était due à une jonction d'extrémités non homologues, qui a provoqué la duplication du gène AMY1. Cependant, il n'y a actuellement aucune preuve pour soutenir cette théorie et donc cette hypothèse reste conjecture. L'origine récente du gène AMY1 multicopie implique qu'en fonction de l'environnement, le nombre de copies du gène AMY1 peut augmenter et diminuer très rapidement par rapport aux gènes qui n'interagissent pas aussi directement avec l'environnement. Le gène AMY1 est un excellent exemple de la façon dont le dosage des gènes affecte la survie d'un organisme dans un environnement donné. Les multiples copies du gène AMY1 donnent à ceux qui dépendent davantage d'un régime riche en amidon un avantage évolutif, par conséquent le nombre élevé de copies du gène persiste dans la population.

Les cellules du cerveau

Parmi les neurones du cerveau humain , les variations somatiques du nombre de copies sont fréquentes. Les variations du nombre de copies montrent une grande variabilité (9 à 100 % des neurones du cerveau dans différentes études). La plupart des altérations ont une taille comprise entre 2 et 10 Mo avec des suppressions dépassant de loin les amplifications. Les variations du nombre de copies semblent être plus élevées dans les cellules du cerveau que dans les autres types de cellules. Une source probable de variation du nombre de copies est la réparation incorrecte des dommages à l'ADN .

La duplication génomique et la triplication du gène semblent être une cause rare de la maladie de Parkinson , bien que plus fréquente que les mutations ponctuelles.

Les variantes du nombre de copies dans le gène RCL1 sont associées à une gamme de phénotypes neuropsychiatriques chez les enfants.

Familles de gènes et sélection naturelle

Mécanisme possible de la façon dont plusieurs copies d'un gène peuvent conduire à une famille de protéines au fil des années avec la sélection naturelle. Ici, le gène X est le gène d'intérêt qui est dupliqué et le gène X1 et le gène X2 sont des gènes qui ont acquis des mutations et sont devenus fonctionnellement différents du gène X.

Récemment, il y avait eu des discussions reliant les variations du nombre de copies aux familles de gènes . Les familles de gènes sont définies comme un ensemble de gènes apparentés qui remplissent des fonctions similaires mais présentent des différences temporelles ou spatiales mineures et ces gènes sont probablement dérivés d'un gène ancestral . La principale raison pour laquelle les variations du nombre de copies sont liées aux familles de gènes est qu'il est possible que les gènes d'une famille proviennent d'un gène ancestral qui a été dupliqué en différentes copies. Les mutations s'accumulent au fil du temps dans les gènes et avec la sélection naturelle agissant sur les gènes, certaines mutations entraînent des avantages environnementaux permettant à ces gènes d'être hérités et, éventuellement, de séparer des familles de gènes claires. Un exemple d'une famille de gènes qui peut avoir été créée en raison de variations du nombre de copies est la famille de gènes de la globine . La famille des gènes de la globine est un réseau élaboré de gènes constitué de gènes d' alpha et de bêta- globine, y compris des gènes exprimés à la fois dans les embryons et les adultes ainsi que des pseudogènes . Ces gènes de la globine de la famille de la globine sont tous bien conservés et ne diffèrent que par une petite partie du gène, indiquant qu'ils sont dérivés d'un gène ancestral commun, peut-être en raison de la duplication du gène de la globine initial.

La recherche a montré que les variations du nombre de copies sont significativement plus courantes dans les gènes qui codent pour des protéines qui interagissent directement avec l'environnement que dans les protéines impliquées dans les activités cellulaires de base. Il a été suggéré que l'effet de dosage du gène accompagnant la variation du nombre de copies peut entraîner des effets néfastes si les fonctions cellulaires essentielles sont perturbées, par conséquent les protéines impliquées dans les voies cellulaires sont soumises à une forte sélection purificatrice . De plus, les protéines fonctionnent ensemble et interagissent avec les protéines d'autres voies, il est donc important de voir les effets de la sélection naturelle sur les voies biomoléculaires plutôt que sur les protéines individuelles. Cela étant dit, il a été constaté que les protéines à la périphérie de la voie sont enrichies en variations de nombre de copies alors que les protéines au centre des voies sont appauvries en variations de nombre de copies. Il a été expliqué que les protéines à la périphérie de la voie interagissent avec moins de protéines et qu'un changement de dosage de protéines affecté par un changement du nombre de copies peut donc avoir un effet moindre sur le résultat global de la voie cellulaire.

Au cours des dernières années, les chercheurs semblent avoir déplacé leur attention de la détection, de la localisation et du séquençage des variations du nombre de copies vers des analyses approfondies du rôle de ces variations du nombre de copies dans le génome humain et dans la nature en général. Des preuves sont nécessaires pour valider davantage la relation entre les variations du nombre de copies et les familles de gènes, ainsi que le rôle que joue la sélection naturelle dans la formation de ces relations et de ces changements. En outre, les chercheurs visent également à élucider les mécanismes moléculaires impliqués dans les variations du nombre de copies, car cela peut révéler des informations essentielles concernant les variations structurelles en général. En prenant du recul, le domaine de la variation structurelle du génome humain semble être un sujet de recherche en pleine croissance. Non seulement ces données de recherche peuvent fournir des preuves supplémentaires de l'évolution et de la sélection naturelle, mais elles peuvent également être utilisées pour développer des traitements pour un large éventail de maladies génétiques.

Voir également

Les références

Lectures complémentaires

Liens externes