Codon d'arrêt - Stop codon

Codon d'arrêt (point rouge) du gène MT-ATP8 de l'ADN mitochondrial humain et codon de démarrage (cercle bleu) du gène MT-ATP6 . Pour chaque triplet de nucléotides (crochets), l'acide aminé correspondant est indiqué (code à une lettre), soit dans le cadre de lecture +1 pour le MT-ATP8 (en rouge) soit dans le cadre +3 pour le MT-ATP6 (en bleu ). Dans cette région génomique, les deux gènes se chevauchent .

En biologie moléculaire (en particulier la biosynthèse des protéines ), un codon d'arrêt (ou codon de terminaison ) est un codon ( triplet de nucléotides dans l'ARN messager ) qui signale la fin du processus de traduction de la protéine actuelle . La plupart des codons dans l'ARN messager correspondent à l'ajout d'un acide aminé à une chaîne polypeptidique en croissance , qui peut finalement devenir une protéine ; Les codons stop signalent la fin de ce processus en liant les facteurs de libération , qui provoquent la dissociation des sous - unités ribosomiques , libérant la chaîne d'acides aminés.

Alors que les codons d' initiation ont besoin de séquences ou de facteurs d'initiation proches pour démarrer la traduction, un codon d'arrêt seul est suffisant pour initier la terminaison.

Propriétés

Codons standards

Dans le code génétique standard, il existe trois codons de terminaison différents :

Codon Code standard
(Table de traduction 1)
Nom
ADN ARN
ÉTIQUETER UAG STOP = Ter (*) "ambre"
AAT SAU STOP = Ter (*) "ocre"
ATG UGA STOP = Ter (*) "opale" (ou "ombre")

Codons stop alternatifs

Il existe des variantes du code génétique standard et des codons d'arrêt alternatifs ont été trouvés dans les génomes mitochondriaux des vertébrés , Scenedesmus obliquus et Thraustochytrium .

Tableau des codons stop alternatifs et comparaison avec le code génétique standard
Code génétique
Tableau de traduction
Codon Traduction
avec ce code
Traduction standard
ADN ARN
Mitochondriale de vertébré 2 AGA AGA STOP = Ter (*) Arg (D)
AGG AGG STOP = Ter (*) Arg (D)
Scenedesmus obliquus mitochondrial 22 TCA UCA STOP = Ter (*) Ser (S)
Thraustochytrium mitochondrial 23 TTA UUA STOP = Ter (*) Leu (G)
Propriétés biochimiques des acides aminés Non polaire Polaire De base Acide Terminaison : codon d'arrêt

Codons stop réaffectés

Le code génétique nucléaire est flexible, comme l'illustrent les codes génétiques variants qui réaffectent les codons d'arrêt standard aux acides aminés.

Tableau des codons stop conditionnels et comparaison avec le code génétique standard
Code génétique
Tableau de traduction
Codon
Traduction conditionnelle
Traduction standard
ADN ARN
Nucléaire caryorélique 27 ATG UGA Ter (*) ou Trp (W) Ter (*)
Condylostome nucléaire 28 AAT SAU Ter (*) ou Gln (Q) Ter (*)
ÉTIQUETER UAG Ter (*) ou Gln (Q) Ter (*)
ATG UGA Ter (*) ou Trp (W) Ter (*)
Blastocrithidia nucléaire 31 AAT SAU Ter (*) ou Glu (E) Ter (*)
ÉTIQUETER UAG Ter (*) ou Glu (E) Ter (*)

Traduction

En 1986, des preuves convaincantes ont été fournies que la sélénocystéine (Sec) a été incorporée de manière co-traductionnelle. De plus, le codon dirigeant partiellement son incorporation dans la chaîne polypeptidique a été identifié comme UGA également connu sous le nom de codon de terminaison opale . Différents mécanismes pour outrepasser la fonction de terminaison de ce codon ont été identifiés chez les procaryotes et les eucaryotes. Une différence particulière entre ces règnes est que les éléments cis semblent limités au voisinage du codon UAG chez les procaryotes alors que chez les eucaryotes, cette restriction n'est pas présente. Au lieu de cela, de tels emplacements semblent défavorisés bien que non interdits.

En 2003, un article historique a décrit l'identification de toutes les sélénoprotéines connues chez l'homme : 25 au total. Des analyses similaires ont été effectuées pour d'autres organismes.

Le codon UAG peut se traduire en pyrrolysine (Pyl) d'une manière similaire.

Distribution génomique

La distribution des codons stop dans le génome d'un organisme n'est pas aléatoire et peut être en corrélation avec le contenu en GC . Par exemple, le génome d' E. coli K-12 contient 2705 TAA (63 %), 1257 TGA (29 %) et 326 TAG (8 %) codons d'arrêt (teneur en GC 50,8 %). De plus, les substrats pour le facteur de libération des codons d'arrêt 1 ou le facteur de libération 2 sont fortement corrélés à l'abondance des codons d'arrêt. Une étude à grande échelle de bactéries avec une large gamme de teneurs en GC montre que si la fréquence d'apparition de TAA est négativement corrélée à la teneur en GC et que la fréquence d'apparition de TGA est positivement corrélée à la teneur en GC, la fréquence d'apparition du codon stop TAG, qui est souvent le codon stop le moins utilisé dans un génome, n'est pas influencé par la teneur en GC.

Reconnaissance

La reconnaissance des codons stop chez les bactéries a été associée à ce que l'on appelle « l'anticodon tripeptide », un motif d'acides aminés hautement conservé dans RF1 (PxT) et RF2 (SPF). Même si cela est soutenu par des études structurelles, il a été montré que l'hypothèse de l'anticodon tripeptide est une simplification excessive.

Nomenclature

Les codons d'arrêt ont historiquement reçu de nombreux noms différents, car ils correspondaient chacun à une classe distincte de mutants qui se comportaient tous de manière similaire. Ces mutants ont d'abord été isolés au sein de bactériophages ( T4 et lambda ), des virus qui infectent la bactérie Escherichia coli . Des mutations dans les gènes viraux ont affaibli leur capacité infectieuse, créant parfois des virus capables d'infecter et de se développer uniquement dans certaines variétés d' E . coli .

mutations ambre ( UAG )

Il s'agissait de la première série de mutations absurdes à être découvertes, isolées par Richard H. Epstein et Charles Steinberg et nommées d'après leur ami et étudiant diplômé de Caltech Harris Bernstein, dont le nom de famille signifie « ambre » en allemand ( cf. Bernstein ).

Les virus présentant des mutations ambres se caractérisent par leur capacité à infecter uniquement certaines souches de bactéries, appelées suppresseurs d'ambre. Ces bactéries portent leur propre mutation qui permet une reprise de fonction dans les virus mutants. Par exemple, une mutation dans l'ARNt qui reconnaît le codon d'arrêt ambre permet à la traduction de « lire à travers » le codon et de produire une protéine complète, récupérant ainsi la forme normale de la protéine et « supprimant » la mutation ambre. Ainsi, les mutants de l'ambre sont une classe entière de virus mutants qui peuvent se développer dans des bactéries contenant des mutations suppressives de l'ambre. Des suppresseurs similaires sont également connus pour les codons stop ocre et opale.

Les molécules d'ARNt portant des acides aminés non naturels ont été conçues pour reconnaître le codon stop ambre dans l'ARN bactérien. Cette technologie permet l'incorporation d'acides aminés orthogonaux (tels que la p-azidophénylalanine) à des emplacements spécifiques de la protéine cible.

mutations ocre ( UAA )

C'était la deuxième mutation du codon stop à être découverte. Rappelant la couleur jaune-orange-brun habituelle associée à l'ambre, ce deuxième codon stop a reçu le nom d' " ocre " , un pigment minéral orangé-brun-rougeâtre.

Les virus mutants ocre avaient une propriété similaire aux mutants ambrés en ce sens qu'ils récupéraient une capacité infectieuse au sein de certaines souches suppressives de bactéries. L'ensemble des suppresseurs d'ocre était distinct des suppresseurs d'ambre, de sorte que les mutants d'ocre ont été déduits pour correspondre à un triplet de nucléotides différent. Grâce à une série d'expériences de mutation comparant ces mutants entre eux et avec d'autres codons d'acides aminés connus, Sydney Brenner a conclu que les mutations ambre et ocre correspondaient aux triplets de nucléotides « UAG » et « UAA ».

mutations d' opale ou d' ombre ( UGA )

Le troisième et dernier codon stop du code génétique standard a été découvert peu après et correspond au triplet de nucléotides "UGA".

Pour continuer à correspondre au thème des minéraux colorés, le troisième codon absurde a été appelé " opale " , qui est un type de silice présentant une variété de couleurs. Les mutations non-sens qui ont créé ce codon d'arrêt prématuré ont ensuite été appelées mutations opales ou mutations umber .

Mutation

Absurdité

Les mutations non-sens sont des changements dans la séquence d'ADN qui introduisent un codon d'arrêt prématuré, provoquant un raccourcissement anormal de toute protéine résultante. Cela provoque souvent une perte de fonction de la protéine, car des parties critiques de la chaîne d'acides aminés ne sont plus assemblées. En raison de cette terminologie, les codons d'arrêt ont également été appelés codons non-sens .

Sans arrêt

Une mutation non-stop est une mutation ponctuelle qui se produit dans un codon d'arrêt. Les mutations non-stop provoquent la traduction continue d'un brin d' ARNm dans ce qui devrait être une région non traduite. La plupart des polypeptides résultant d'un gène avec une mutation non-stop sont non fonctionnels en raison de leur extrême longueur.

Les mutations non stop diffèrent des mutations non-sens en ce qu'elles ne créent pas de codon stop mais, à la place, en suppriment un. Les mutations non-stop diffèrent également des mutations faux-sens , qui sont des mutations ponctuelles où un seul nucléotide est modifié pour provoquer son remplacement par un autre acide aminé .

Des mutations non-stop ont été associées à plusieurs maladies congénitales, notamment l'hyperplasie congénitale des surrénales , la dysgénésie variable du segment antérieur , la mucoviscidose et l'encéphalomyopathie neuro-intestinale mitochondriale .

Arrêts cachés

Un exemple d'une délétion de base unique formant un codon d'arrêt.

Les arrêts cachés sont des codons non-stop qui seraient lus comme des codons d'arrêt s'ils étaient décalés de +1 ou -1. Ceux-ci mettent fin prématurément à la traduction si le décalage de cadre correspondant (comme en raison d'un glissement d'ARN ribosomique) se produit avant l'arrêt caché. Il est supposé que cela diminue le gaspillage de ressources sur les protéines non fonctionnelles et la production de cytotoxines potentielles . Des chercheurs de la Louisiana State University proposent l' hypothèse de l' embuscade , pour laquelle des arrêts cachés sont sélectionnés. Les codons qui peuvent former des arrêts cachés sont utilisés dans les génomes plus fréquemment que les codons synonymes qui coderaient autrement pour le même acide aminé. L' ARNr instable dans un organisme est en corrélation avec une fréquence plus élevée d'arrêts cachés. Cette hypothèse n'a cependant pas pu être validée avec un ensemble de données plus important.

Les codons d'arrêt et les arrêts cachés sont collectivement appelés signaux d'arrêt. Des chercheurs de l' Université de Memphis ont découvert que les rapports des signaux d'arrêt sur les trois cadres de lecture d'un génome (appelés rapport des signaux d'arrêt de la traduction ou TSSR) de bactéries génétiquement apparentées, malgré leurs grandes différences dans le contenu des gènes, sont très similaires. . Cette valeur génomique-TSSR presque identique des bactéries génétiquement apparentées peut suggérer que l'expansion du génome bactérien est limitée par leur biais unique de signaux d'arrêt de cette espèce bactérienne.

Lecture traductionnelle

La suppression du codon d'arrêt ou la lecture de la traduction se produit lorsqu'en traduction un codon d'arrêt est interprété comme un codon sens, c'est-à-dire lorsqu'un acide aminé (standard) est «codé» par le codon d'arrêt. Les ARNt mutés peuvent être à l'origine de readthrough, mais aussi de certains motifs nucléotidiques proches du codon stop. La lecture translationnelle est très courante chez les virus et les bactéries, et a également été trouvée comme principe de régulation des gènes chez les humains, les levures, les bactéries et la drosophile. Ce type de lecture traductionnelle endogène constitue une variation du code génétique , car un codon stop code pour un acide aminé. Dans le cas de la malate déshydrogénase humaine , le codon stop est lu avec une fréquence d'environ 4 %. L'acide aminé inséré au niveau du codon d'arrêt dépend de l'identité du codon d'arrêt lui-même : Gln, Tyr et Lys ont été trouvés pour les codons UAA et UAG, tandis que Cys, Trp et Arg pour le codon UGA ont été identifiés en masse spectrométrie. L'étendue de la lecture chez les mammifères a des étendues très variables et peut largement diversifier le protéome et affecter la progression du cancer

Utiliser comme filigrane

En 2010, lorsque Craig Venter a dévoilé la première cellule de reproduction entièrement fonctionnelle contrôlée par de l'ADN synthétique, il a décrit comment son équipe utilisait des codons d'arrêt fréquents pour créer des filigranes dans l'ARN et l'ADN afin de confirmer que les résultats étaient bien synthétiques (et non contaminés ou non), en utilisant pour encoder les noms d'auteurs et les adresses de sites Web.

Voir également

Les références