Code génétique étendu - Expanded genetic code

Il ne doit pas y avoir de diaphonie entre la nouvelle paire ARNt/synthase et les molécules ARNt/synthase existantes, uniquement avec les ribosomes

Un code génétique étendu est un code génétique modifié artificiellement dans lequel un ou plusieurs codons spécifiques ont été réalloués pour coder un acide aminé qui ne fait pas partie des 22 acides aminés protéinogènes encodés naturellement .

Les conditions préalables clés pour élargir le code génétique sont :

  • l' acide aminé non standard à coder,
  • un codon inutilisé à adopter,
  • un ARNt qui reconnaît ce codon, et
  • un ARNt synthétase qui reconnaît uniquement cet ARNt et uniquement l'acide aminé non standard.

L'expansion du code génétique est un domaine de recherche de la biologie synthétique , une discipline biologique appliquée dont le but est de concevoir des systèmes vivants à des fins utiles. L'expansion du code génétique enrichit le répertoire d'outils utiles disponibles pour la science.

En mai 2019, des chercheurs, dans un effort marquant, ont signalé la création d'une nouvelle forme synthétique (éventuellement artificielle ) de vie viable , une variante de la bactérie Escherichia coli , en réduisant le nombre naturel de 64 codons dans le génome bactérien à 61 codons. (éliminant deux des six codons codant pour la sérine et un des trois codons d'arrêt) - dont 59 utilisés pour encoder 20 acides aminés .

introduction

Il est à noter que le code génétique de tous les organismes est fondamentalement le même, de sorte que tous les êtres vivants utilisent le même « langage génétique ». En général, l'introduction de nouveaux acides aminés non naturels fonctionnels dans les protéines des cellules vivantes brise l'universalité du langage génétique, ce qui conduit idéalement à des formes de vie alternatives. Les protéines sont produites grâce aux molécules du système traductionnel, qui décodent les messages d'ARN en une chaîne d'acides aminés. La traduction de l'information génétique contenue dans l'ARN messager (ARNm) en une protéine est catalysée par les ribosomes . Les ARN de transfert (ARNt) sont utilisés comme clés pour décoder l' ARNm en son polypeptide codé . L'ARNt reconnaît un codon spécifique à trois nucléotides dans l'ARNm avec une séquence complémentaire appelée anticodon sur l'une de ses boucles. Chaque codon à trois nucléotides est traduit en l'un des vingt acides aminés naturels. Il existe au moins un ARNt pour chaque codon, et parfois plusieurs codons codent pour le même acide aminé. De nombreux ARNt sont compatibles avec plusieurs codons. Une enzyme appelée aminoacyl ARNt synthétase attache de manière covalente l'acide aminé à l'ARNt approprié. La plupart des cellules ont une synthétase différente pour chaque acide aminé (20 synthétases ou plus). D'autre part, certaines bactéries ont moins de 20 aminoacyl ARNt synthétases et introduisent le ou les acides aminés "manquants" par modification d'un acide aminé structurellement apparenté par une enzyme aminotransférase . Une caractéristique exploitée dans l'expansion du code génétique est le fait que l'aminoacyl ARNt synthétase ne reconnaît souvent pas l'anticodon, mais une autre partie de l'ARNt, ce qui signifie que si l'anticodon était muté, le codage de cet acide aminé changerait en un nouveau codon. Dans le ribosome, l'information contenue dans l'ARNm est traduite en un acide aminé spécifique lorsque le codon de l'ARNm correspond à l'anticodon complémentaire d'un ARNt, et l'acide aminé attaché est ajouté sur une chaîne polypeptidique en croissance. Lorsqu'elle est libérée du ribosome, la chaîne polypeptidique se replie en une protéine fonctionnelle.

Afin d'incorporer un nouvel acide aminé dans le code génétique, plusieurs changements sont nécessaires. Premièrement, pour une traduction réussie d'un nouvel acide aminé, le codon auquel le nouvel acide aminé est attribué ne peut pas déjà coder pour l'un des 20 acides aminés naturels. Habituellement, un codon non-sens (codon d' arrêt ) ou un codon à quatre bases sont utilisés. Deuxièmement, une nouvelle paire d'ARNt et d'aminoacyl ARNt synthétase est requise, on les appelle l'ensemble orthogonal. L'ensemble orthogonal ne doit pas se croiser avec les ensembles d'ARNt et de synthétase endogènes, tout en étant fonctionnellement compatible avec le ribosome et d'autres composants de l'appareil de traduction. Le site actif de la synthétase est modifié pour n'accepter que le nouvel acide aminé. Le plus souvent, une bibliothèque de synthétases mutantes est sélectionnée pour celle qui charge l'ARNt avec l'acide aminé souhaité. La synthétase est également modifiée pour ne reconnaître que l'ARNt orthogonal. La paire d'ARNt synthétase est souvent conçue dans d'autres bactéries ou cellules eucaryotes.

Dans ce domaine de recherche, les 20 acides aminés protéinogènes codés sont appelés acides aminés standard, ou encore acides aminés naturels ou canoniques, tandis que les acides aminés ajoutés sont appelés acides aminés non standard (NSAA) ou acides aminés non naturels ( uAAs ; terme non utilisé dans les articles traitant des acides aminés naturels non protéinogènes, tels que la phosphosérine ), ou des acides aminés non canoniques.

Acides aminés non standard

Tyrosine et certaines variantes de tyrosine synthétiques utilisées pour le marquage des protéines. Différentes variantes de la tyrosine ont été synthétisées et peuvent être incorporées dans des protéines à l'aide d'un code génétique étendu. Les variantes représentées ici sont toutes utilisées pour la liaison chimique ou photochimique. Cela signifie que l'AA incorporé réagit spécifiquement avec un groupe chimique particulier (tel que les hydrazides, les amines, les azotures ou les thiols) ou peut être activé par les UV pour se réticuler avec d'autres AA.

Le premier élément du système est l'acide aminé qui est ajouté au code génétique d'une certaine souche d'organisme.

Plus de 71 NSAA différents ont été ajoutés à différentes souches d' E. coli , de levure ou de cellules de mammifères. En raison de détails techniques (synthèse chimique plus facile des NSAA, moins de diaphonie et évolution plus facile de l'aminoacyl-ARNt synthase), les NSAA sont généralement plus gros que les acides aminés standard et ont le plus souvent un noyau phénylalanine mais avec une grande variété de substituants différents. Ceux-ci permettent un large répertoire de nouvelles fonctions, telles que le marquage (voir figure), en tant que rapporteur fluorescent ( par exemple dansylalanine) ou pour produire des protéines traductionnelles dans E. coli avec des modifications post-traductionnelles eucaryotes ( par exemple, phosphosérine, phosphothréonine et phosphotyrosine).

Le travail fondateur a été rapporté par Rolf Furtner, qui a utilisé à lui seul la paire d' ARNt Phe /PheRS de levure pour incorporer la p-iodophénylalanine dans E. coli .

Les acides aminés non naturels incorporés dans les protéines comprennent les acides aminés contenant des atomes lourds pour faciliter certaines études cristallographiques aux rayons X; acides aminés avec de nouvelles propriétés stériques/d'emballage et électroniques ; des acides aminés photoréticulants qui peuvent être utilisés pour sonder les interactions protéine-protéine in vitro ou in vivo ; des acides aminés contenant du céto, de l'acétylène, de l'azide et du boronate qui peuvent être utilisés pour introduire sélectivement un grand nombre de sondes biophysiques, de marqueurs et de nouveaux groupes fonctionnels chimiques dans des protéines in vitro ou in vivo ; des acides aminés redox actifs pour sonder et moduler le transfert d'électrons ; des acides aminés photocagés et photoisomérisables pour photoréguler les processus biologiques ; acides aminés liant les métaux pour la catalyse et la détection des ions métalliques; des acides aminés qui contiennent des chaînes latérales actives fluorescentes ou infrarouges pour sonder la structure et la dynamique des protéines ; les acides α-hydroxy et les acides D- aminés comme sondes de la conformation du squelette et des interactions de liaison hydrogène ; et des acides aminés sulfatés et des mimétiques d'acides aminés phosphorylés comme sondes de modifications post-traductionnelles.

La disponibilité de l'acide aminé non standard nécessite que l'organisme l'importe du milieu ou le biosynthétise. Dans le premier cas, l'acide aminé non naturel est d'abord synthétisé chimiquement sous sa forme L optiquement pure . Il est ensuite ajouté au milieu de croissance de la cellule. Une bibliothèque de composés est généralement testée pour une utilisation dans l'incorporation du nouvel acide aminé, mais cela n'est pas toujours nécessaire, par exemple, divers systèmes de transport peuvent gérer des acides aminés non naturels avec des chaînes latérales apolaires. Dans le second cas, une voie de biosynthèse doit être conçue, par exemple une souche d' E. coli qui biosynthétise un nouvel acide aminé (p-aminophénylalanine) à partir de sources de carbone basiques et l'inclut dans son code génétique. Autre exemple : la production de phosphosérine, un métabolite naturel, et par conséquent nécessitait une altération de sa voie de flux pour augmenter sa production.

Affectation des codons

Un autre élément du système est un codon à allouer au nouvel acide aminé.

Un problème majeur pour l'expansion du code génétique est qu'il n'y a pas de codons libres. Le code génétique a une disposition non aléatoire qui montre des signes révélateurs de diverses phases de l'évolution primordiale, cependant, il s'est depuis figé en place et est presque universellement conservé. Néanmoins, certains codons sont plus rares que d'autres. En effet, chez E. coli (et tous les organismes) l'usage des codons n'est pas égal, mais présente plusieurs codons rares (voir tableau), le plus rare étant le codon stop ambre (UAG).

Suppression du codon ambre

La possibilité de réaffecter des codons a été réalisée par Normanly et al. en 1990, lorsqu'une souche mutante viable d' E. coli a lu le codon d'arrêt UAG ("ambre") . Cela a été possible grâce à la rareté de ce codon et au fait que le facteur de libération 1 seul fait que le codon ambre termine la traduction. Plus tard, dans le laboratoire Schultz , la tRNATyr/tyrosyl-tRNA synthetase (TyrRS) de Methanococcus jannaschii , une archaebactérie, a été utilisée pour introduire une tyrosine à la place de STOP, la valeur par défaut du codon ambre. Cela a été possible en raison des différences entre les synthases bactériennes endogènes et la synthase archaéenne orthologue, qui ne se reconnaissent pas. Par la suite, le groupe a développé la paire orthologonale ARNt/synthase pour utiliser l'acide aminé non standard O- méthyltyrosine. Cela a été suivi par la plus grande naphtylalanine et la benzoylphénylalanine photoréticulante, qui ont prouvé l'utilité potentielle du système.

Le codon ambre est le codon le moins utilisé dans Escherichia coli , mais son détournement entraîne une perte substantielle de fitness. Une étude, en fait, a révélé qu'il y avait au moins 83 peptides principalement affectés par la lecture. De plus, l'étiquetage était incomplet. En conséquence, plusieurs souches ont été créées pour réduire le coût de remise en forme, y compris l'élimination de tous les codons ambre du génome. Dans la plupart des souches d' E. coli K-12 (à savoir Escherichia coli (biologie moléculaire) pour les pedigrees des souches), il existe 314 codons d'arrêt UAG. Par conséquent, un travail gigantesque a été consacré à leur remplacement. Une approche mise au point par le groupe du professeur George Church de Harvard, a été surnommée MAGE dans CAGE : elle reposait sur une transformation multiplex et une recombinaison de souches subséquente pour éliminer tous les codons UAG. Cette dernière partie présentait un point d'arrêt dans un premier article, mais surmonter. Cela a abouti à la souche E. coli C321.ΔA, qui manque de tous les codons UAG et RF1. Cela a permis de faire une expérience avec cette souche pour la rendre "accro" à l'acide aminé biphénylalanine en faisant évoluer plusieurs enzymes clés pour l'exiger structurellement, mettant ainsi son code génétique étendu sous sélection positive.

Réattribution de codon sens rare

En plus du codon ambre, des codons sens rares ont également été envisagés pour une utilisation. Le codon AGG code pour l'arginine, mais une souche a été modifiée avec succès pour le faire coder pour la 6- N -allyloxycarbonyl-lysine. Un autre candidat est le codon AUA, qui est inhabituel en ce que son ARNt respectif doit se différencier de l'AUG qui code pour la méthionine (principalement l'isoleucine, d'où sa localisation). Pour ce faire, l'ARNt AUA possède une base spéciale, la lysidine. La délétion de la synthase ( tilS ) a été possible grâce au remplacement de l'ARNt natif par celui de Mycoplasma mobile (pas de lysidine). La remise en forme réduite est une première étape pour faire pression sur la souche pour qu'elle perde toutes les instances d'AUA, lui permettant d'être utilisée pour l'expansion du code génétique.

Quatre codons de base

D'autres approches incluent l'ajout d'un appariement de bases supplémentaire ou l'utilisation de ribosomes orthologues qui acceptent, en plus du code génétique triplet régulier, des ARNt avec un code quadruple. Cela a permis l'utilisation simultanée de deux acides aminés non naturels, la p- azidophénylalanine (pAzF) et la N6-[(2-propynyloxy)carbonyl]lysine (CAK), qui se réticulent par cycloaddition de Huisgen . Le décodage quadruplé dans les souches de type sauvage non recodées est très inefficace. Cela provient du fait que l'interaction entre les ARNt modifiés avec des complexes ternaires ou d'autres composants de traduction n'est pas aussi favorable et forte qu'avec les éléments de traduction endogènes cellulaires. Ce problème peut être surmonté en concevant et en évoluant spécifiquement un ARNt capable de décoder des codons quadruplets dans des souches non recodées. Jusqu'à 4 paires ARNt/ARNt synthétase orthogonales quadruples différentes peuvent être générées de cette manière.

Paire ARNt/synthétase

Un autre élément clé est le couple ARNt/synthétase.

L'ensemble orthologue de synthétase et d'ARNt peut être muté et criblé par évolution dirigée pour charger l'ARNt avec un acide aminé différent, voire nouveau. Des mutations du plasmide contenant la paire peuvent être introduites par PCR sujette aux erreurs ou par des amorces dégénérées pour le site actif de la synthétase. La sélection implique plusieurs cycles d'un processus en deux étapes, où le plasmide est transféré dans des cellules exprimant la chloramphénicol acétyl transférase avec un codon ambre prématuré. En présence de chloramphénicol toxique et de l'acide aminé non naturel, les cellules survivantes auront remplacé le codon ambre en utilisant l'ARNt orthogonal aminoacylé avec les acides aminés standard ou l'acide non naturel. Pour éliminer le premier, le plasmide est inséré dans des cellules avec un gène barnase (toxique) avec un codon ambre prématuré mais sans l'acide aminé non naturel, supprimant toutes les synthases orthogonales qui ne reconnaissent pas spécifiquement l'acide aminé non naturel. En plus du recodage de l'ARNt en un codon différent, ils peuvent être mutés pour reconnaître un codon à quatre bases, permettant des options de codage gratuites supplémentaires. L'acide aminé non naturel, par conséquent, présente diverses propriétés physico-chimiques et biologiques afin d'être utilisé comme outil pour explorer la structure et la fonction des protéines ou pour créer une protéine nouvelle ou améliorée à des fins pratiques.

Plusieurs méthodes de sélection de la synthétase n'acceptant que l'acide aminé non naturel ont été développées. L'une d'elles consiste à utiliser une combinaison de sélection positive et négative

Ensembles orthogonaux dans des organismes modèles

Les paires orthogonales de synthétase et d'ARNt qui fonctionnent pour un organisme peuvent ne pas fonctionner pour un autre, car la synthétase peut mésaminoacyler les ARNt endogènes ou l'ARNt lui-même être mis-aminoacylé par une synthétase endogène. En conséquence, les ensembles créés à ce jour diffèrent selon les organismes.

Paire La source E. coli Levure Mammifères Notes et références
ARNt Tyr- TyrRS Methanococcus jannaschii Oui Non Non
ARNt Lys- LysRS Pyrococcus horikoshii Oui Non Non
ARNt Glu –GluRS Pyrococcus horikoshii Oui Non Non
ARNt Leu –LeuRS ARNt : mutant Halobacterium sp.
RS : Methanobacterium thermoautotrophicum
Oui Non Non
ARNt Ambre -PylRS Methanosarcina barkeri et Methanosarcina mazei Oui Oui Oui
ARNt Ambre - 3-iodotyrosyl -RS RS : variante Methanocaldococcus jannaschii aaRS Oui Non Non
ARNt Tyr/Ambre -TyrRS Escherichia coli Non Oui Non Signalé en 2003, mentionné en 2014 LeuRS
ARNt i Met -GlnRS ARNt :
RS humain : Escherichia coli
Non Oui Non Passé au codon ambre.
ARNt i fMet -TyrRS ARNt : Escherichia coli
RS : S. cerevisiae
Oui Oui Non Passé au codon ambre.
ARNt Leu/Ambre -LeuRS Escherichia coli Non Oui Oui Signalé en 2004 et muté pour l'acide 2-aminooctanoïque, l' o- méthyl tyrosine et l' o- nitrobenzyl cystéine. Évolué dans la levure pour la 4,5-diméthoxy-2-nitrobenzyl sérine, testé sur des souris et des cellules de mammifères avec la 4,5-diméthoxy-2-nitrobenzyl-cystéine photosensible.
ARNt Tyr- TyrRS Bacillus stearothermophilus Non Non Oui
ARNt Trp- TrpRS Bacillus subtilis , RS modifié Non Non Oui Le nouveau AA est le 5-OH Trp.

En 2017, une souris conçue avec un code génétique étendu qui peut produire des protéines avec des acides aminés non naturels a été signalée.

Ribosomes orthogonaux

De la même manière que les ARNt orthogonaux et les aminoacyl ARNt synthétases (aaRS), les ribosomes orthogonaux ont été conçus pour fonctionner en parallèle avec les ribosomes naturels. Les ribosomes orthogonaux utilisent idéalement des transcrits d'ARNm différents de leurs homologues naturels et devraient en fin de compte également s'appuyer sur un pool séparé d'ARNt. Cela devrait atténuer une partie de la perte d'aptitude qui résulte encore actuellement de techniques telles que la suppression du codon Amber. De plus, les ribosomes orthogonaux peuvent être mutés et optimisés pour des tâches particulières, comme la reconnaissance de codons quadruplés. Une telle optimisation n'est pas possible, ou très pénalisante pour les ribosomes naturels.

o-ribosome

En 2005, trois ensembles de ribosomes ont été publiés, qui ne reconnaissaient pas l'ARNm naturel, mais traduisaient à la place un pool séparé d'ARNm orthogonal (o-ARNm). Ceci a été réalisé en modifiant la séquence de reconnaissance de l'ARNm, la séquence Shine-Dalgarno , et la séquence de reconnaissance correspondante dans l'ARNr 16S des ribosomes, la soi-disant séquence Anti-Shine-Darlgarno. De cette façon, l'appariement des bases, qui est généralement perdu si l'une des séquences est mutée, reste disponible. Cependant, les mutations dans l'ARNr 16S n'étaient pas limitées aux nucléotides d'appariement de bases évidents de la séquence classique Anti-Shine-Darlgarno.

Ribo-X

En 2007, le groupe de Jason W. Chin a présenté un ribosome orthogonal, optimisé pour la suppression du codon Amber. L'ARNr 16S a été muté de telle manière qu'il liait le facteur de libération RF1 moins fortement que le ribosome naturel. Ce ribosome n'a pas éliminé le problème de l'aptitude cellulaire réduite causée par la suppression des codons d'arrêt dans les protéines naturelles. Cependant, grâce à la spécificité améliorée, il a considérablement augmenté les rendements de la protéine cible correctement synthétisée (de ~ 20% à > 60% pour un codon ambre à supprimer et forme < 1% à > 20% pour deux codons ambre).

Ribo-Q

En 2010, le groupe de Jason W. Chin a présenté une nouvelle version optimisée du ribosome orthogonal. Le Ribo-Q est un ARNr 16S optimisé pour reconnaître les ARNt, qui ont des anti-codons quadruplés pour reconnaître les codons quadruplés, au lieu des codons triplets naturels. Avec cette approche, le nombre de codons possibles passe de 64 à 256. Même en tenant compte d'une variété de codons d'arrêt, plus de 200 acides aminés différents pourraient potentiellement être codés de cette façon.

Agrafage des ribosomes

Les ribosomes orthogonaux décrits ci-dessus se concentrent tous sur l'optimisation de l'ARNr 16S. Jusqu'à présent, cet ARNr 16S optimisé a été combiné avec de grandes sous-unités naturelles pour former des ribosomes orthogonaux. Si l'ARNr 23S, le principal composant ARN de la grande sous-unité ribosomique, doit également être optimisé, il fallait s'assurer qu'il n'y avait pas de diaphonie dans l'assemblage des ribosomes orthogonaux et naturels (voir figure X B). Pour garantir que l'ARNr 23S optimisé se forme uniquement en ribosomes avec l'ARNr 16S optimisé, les deux ARNr ont été combinés en un seul transcrit. En insérant la séquence de l'ARNr 23S dans une région en boucle de la séquence d'ARNr 16S, les deux sous-unités adoptent toujours des replis fonctionnels. Étant donné que les deux ARNr sont liés et donc à proximité constante, ils se lient de préférence l'un à l'autre, et non à d'autres sous-unités ribosomiques flottantes.

Centre de peptidyl transférase modifié

En 2014, il a été montré qu'en modifiant le centre peptidyl transférase de l'ARNr 23S, des ribosomes pouvaient être créés qui s'appuyaient sur des pools orthogonaux d'ARNt. L'extrémité 3' des ARNt est universellement conservée pour être CCA. Les deux bases cytidines s'apparient à deux guanines l'ARNr 23S pour lier l'ARNt au ribosome. Cette interaction est requise pour la fidélité traductionnelle. Cependant, en comutant les nucléotides de liaison de telle manière qu'ils puissent encore s'apparier, la fidélité traductionnelle peut être conservée. L'extrémité 3' de l'ARNt est mutée de CCA en CGA, tandis que deux nucléotides de cytidine dans les sites A et P des ribosomes sont mutés en guanidine. Cela conduit à des ribosomes qui n'acceptent pas les ARNt naturels comme substrats et à des ARNt, qui ne peuvent pas être utilisés comme substrat par les ribosomes naturels.
Pour utiliser efficacement de tels ARNt, ils devraient être aminoacylés par des aaRS orthogonaux spécifiques. La plupart des aaRS naturels reconnaissent l'extrémité 3' de leur ARNt correspondant. Les aaRS pour ces ARNt mutés en 3' ne sont pas encore disponibles. Jusqu'à présent, il a été démontré que ce système ne fonctionnait que dans un cadre de traduction in vitro où l'aminoacylation de l'ARNt orthogonal était réalisée à l'aide de ce qu'on appelle des « flexizymes ».Les flexizymes sont des ribozymes avec une activité d'amino-aclylation d'ARNt.

Applications

Avec un code génétique étendu, l'acide aminé non naturel peut être génétiquement dirigé vers n'importe quel site choisi dans la protéine d'intérêt. La grande efficacité et fidélité de ce procédé permet un meilleur contrôle du placement de la modification par rapport à la modification post-traductionnelle de la protéine, qui, en général, ciblera tous les acides aminés du même type, tels que le groupe thiol de la cystéine et le groupe amino de la lysine. De plus, un code génétique étendu permet d'effectuer des modifications in vivo . La capacité de diriger spécifiquement vers un site des fragments chimiques synthétisés en laboratoire dans des protéines permet de nombreux types d'études qui seraient autrement extrêmement difficiles, telles que :

  • Sondage de la structure et de la fonction des protéines : en utilisant des acides aminés de taille légèrement différente, tels que l' O- méthyltyrosine ou la dansylalanine au lieu de la tyrosine, et en insérant des fragments rapporteurs génétiquement codés (à changement de couleur et/ou à effet spin) dans des sites protéiques sélectionnés, des informations chimiques sur la structure et la fonction de la protéine peuvent être mesurés.
  • Sonder le rôle des modifications post-traductionnelles dans la structure et la fonction des protéines : en utilisant des acides aminés qui imitent les modifications post-traductionnelles telles que la phosphosérine, une protéine biologiquement active peut être obtenue et la nature spécifique au site de l'incorporation d'acides aminés peut conduire à des informations sur la façon dont la position, la densité et la distribution de la phosphorylation des protéines affectent la fonction des protéines.
  • Identifier et réguler l'activité des protéines : En utilisant des acides aminés photocagés, la fonction des protéines peut être « activée » ou désactivée en éclairant l'organisme.
  • Changer le mode d'action d'une protéine : On peut commencer par le gène d'une protéine qui lie une certaine séquence d'ADN et, en insérant un acide aminé chimiquement actif dans le site de liaison, le convertir en une protéine qui coupe l'ADN plutôt que le lier.
  • Améliorer l'immunogénicité et surmonter l'auto-tolérance : en remplaçant les tyrosines stratégiquement choisies par la p- nitro phénylalanine, une auto-protéine tolérée peut être rendue immunogène.
  • Destruction sélective de composants cellulaires sélectionnés : en utilisant un code génétique étendu, des fragments chimiques destructeurs non naturels (parfois appelés « ogives chimiques ») peuvent être incorporés dans des protéines qui ciblent des composants cellulaires spécifiques.
  • Produire une meilleure protéine : l'évolution des bactériophages T7 sur une souche d' E. coli non évolutive qui code pour la 3-iodotyrosine sur le codon ambre, a entraîné une population plus adaptée que le type sauvage grâce à la présence d'iodotyrosine dans son protéome
  • Sonder la localisation des protéines et l'interaction protéine-protéine chez les bactéries.

Futur

L'expansion du code génétique en est encore à ses balbutiements. La méthodologie actuelle n'utilise qu'un seul acide aminé non standard à la fois, alors qu'idéalement plusieurs pourraient être utilisés. En fait, le groupe de Jason Chin a récemment battu le record d'une souche d' E.coli génétiquement recodée pouvant incorporer simultanément jusqu'à 4 acides aminés non naturels. De plus, des logiciels ont été développés pour permettre la combinaison de ribosomes orthogonaux et de paires ARNt/RS non naturelles afin d'améliorer le rendement et la fidélité des protéines.

Génome synthétique recodé

Une façon d'obtenir le codage de plusieurs acides aminés non naturels consiste à synthétiser un génome réécrit. En 2010, au coût de 40 millions de dollars, un organisme, Mycoplasma laboratorium , a été construit, contrôlé par un génome synthétique, mais non recodé. Le premier organisme génétiquement recodé a été créé par une collaboration entre les laboratoires de George Church et de Farren Isaacs, lorsque le type sauvage E.coli MG1655 a été recodé de telle sorte que les 321 codons d'arrêt connus (UAG) ont été remplacés par des codons UAA synonymes et libèrent le facteur 1 a été éliminé afin d'éliminer l'interaction avec le codon stop exogène et d'améliorer la synthèse protéique non naturelle. En 2019, Escherichia coli Syn61 a été créé, avec un génome recodé de 4 mégabases composé de seulement 61 codons au lieu des 64 naturels. En plus de l'élimination de l'utilisation de codons rares, la spécificité du système doit être augmentée autant d'ARNt reconnaître plusieurs codons

Alphabet génétique étendu

Une autre approche consiste à augmenter le nombre de nucléobases pour augmenter la capacité de codage.

Une paire de bases non naturelles (UBP) est une sous-unité conçue (ou nucléobase ) d' ADN qui est créée en laboratoire et qui n'existe pas dans la nature. Une démonstration d'UBP a été réalisée in vitro par le groupe d'Ichiro Hirao à l' institut RIKEN au Japon. En 2002, ils ont développé une paire de bases non naturelle entre la 2-amino-8-(2-thiényl)purine (s) et la pyridine-2-one (y) qui fonctionne in vitro dans la transcription et la traduction pour l'incorporation site-spécifique de non -acides aminés standards en protéines. En 2006, ils ont créé la 7-(2-thiényl)imidazo[4,5-b]pyridine (Ds) et le pyrrole-2-carbaldéhyde (Pa) comme troisième paire de bases pour la réplication et la transcription. Par la suite, Ds et 4-[3-(6-aminohexanamido)-1-propynyl]-2-nitropyrrole (Px) ont été découverts en tant que paire haute fidélité dans l'amplification PCR. En 2013, ils ont appliqué la paire Ds-Px à la génération d'aptamère d'ADN par sélection in vitro (SELEX) et ont démontré que l'expansion de l'alphabet génétique augmentait considérablement les affinités d'aptamère d'ADN pour les protéines cibles.

En 2012, un groupe de scientifiques américains dirigé par Floyd Romesberg, biologiste chimiste au Scripps Research Institute de San Diego, en Californie, a publié que son équipe avait conçu une paire de bases non naturelle (UBP). Les deux nouveaux nucléotides artificiels ou paires de bases non naturelles (UBP) ont été nommés « d5SICS » et « dNaM ». Plus techniquement, ces nucléotides artificiels portant des bases nucléiques hydrophobes , comportent deux cycles aromatiques fusionnés qui forment un complexe (d5SICS-dNaM) ou une paire de bases dans l'ADN. En 2014, la même équipe du Scripps Research Institute a rapporté qu'elle avait synthétisé un tronçon d'ADN circulaire connu sous le nom de plasmide contenant des paires de bases naturelles TA et CG ainsi que le laboratoire le plus performant de l'UBP Romesberg avait conçu, et l'avait inséré dans des cellules du commun bactérie E. coli qui a répliqué avec succès les paires de bases non naturelles sur plusieurs générations. C'est le premier exemple connu d'un organisme vivant transmettant un code génétique étendu aux générations suivantes. Ceci a été en partie réalisé par l'ajout d'un gène d'algue de soutien qui exprime un transporteur de nucléotide triphosphate qui importe efficacement les triphosphates de d5SICSTP et de dNaMTP dans les bactéries E. coli . Ensuite, les voies de réplication bactériennes naturelles les utilisent pour répliquer avec précision le plasmide contenant d5SICS-dNaM.

L'incorporation réussie d'une troisième paire de bases dans un micro-organisme vivant est une avancée significative vers l'objectif d'augmenter considérablement le nombre d' acides aminés qui peuvent être codés par l'ADN, augmentant ainsi le potentiel des organismes vivants à produire de nouvelles protéines . Les chaînes d'ADN artificielles ne codent encore pour rien, mais les scientifiques pensent qu'elles pourraient être conçues pour fabriquer de nouvelles protéines qui pourraient avoir des utilisations industrielles ou pharmaceutiques.

En mai 2014, les chercheurs ont annoncé qu'ils avaient introduit avec succès deux nouveaux nucléotides artificiels dans l'ADN bactérien et qu'en incluant des nucléotides artificiels individuels dans les milieux de culture, ils ont pu faire passer la bactérie 24 fois ; ils n'ont pas créé d'ARNm ou de protéines capables d'utiliser les nucléotides artificiels.

Méthodes associées

Méthode d'incorporation sélective par pression (SPI) pour la production d'alloprotéines

De nombreuses études ont produit des protéines avec des acides aminés non standard, mais elles ne modifient pas le code génétique. Ces protéines, appelées alloprotéines , sont fabriquées en incubant des cellules avec un acide aminé non naturel en l'absence d'un acide aminé codé similaire afin que le premier soit incorporé dans la protéine à la place du second, par exemple l'acide L -2-aminohexanoïque ( Ahx) pour la méthionine (Met).

Ces études reposent sur l' activité naturelle de l' aminoacyl ARNt synthétase pour ajouter à son ARNt cible un acide aminé non naturel (c'est-à-dire un analogue) similaire au substrat naturel, par exemple la méthionyl-ARNt synthase confondant l'isoleucine avec la méthionine. En cristallographie des protéines, par exemple, l'ajout de sélénométhionine à la presse d'une culture d'une souche auxotrophe de methionine dans les protéines contenant des résultats sélénométhionine , par opposition à la methionine ( à savoir. Dispersion anomale multi-longueurs d'onde pour la raison). Un autre exemple est que la photoleucine et la photométhionine sont ajoutées à la place de la leucine et de la méthionine pour marquer la protéine de manière croisée. De même, certains champignons tolérants au tellure peuvent incorporer de la tellurocystéine et de la tellurométhionine dans leur protéine au lieu de la cystéine et de la méthionine. L'objectif d'élargir le code génétique est plus radical car il ne remplace pas un acide aminé, mais il en ajoute un ou plusieurs au code. D'autre part, les remplacements à l'échelle du protéome sont effectués le plus efficacement par des substitutions globales d'acides aminés. Par exemple, des substitutions globales à l'échelle du protéome d'acides aminés naturels par des analogues fluorés ont été tentées dans E. coli et B. subtilis . Une substitution complète du tryptophane par la thiénopyrrole-alanine en réponse à 20899 codons UGG dans E. coli a été signalée en 2015 par Budisa et Söll . De plus, de nombreux phénomènes biologiques, tels que le repliement et la stabilité des protéines, sont basés sur des effets synergiques à de nombreuses positions dans la séquence protéique.

Dans ce contexte, la méthode SPI génère des variants de protéines recombinantes ou des alloprotéines directement par substitution d'acides aminés naturels par des contreparties non naturelles. Un hôte d'expression auxotrophe d'acides aminés est complété par un analogue d'acide aminé pendant l'expression de la protéine cible. Cette approche évite les pièges des méthodes basées sur la suppression et lui est supérieure en termes d'efficacité, de reproductibilité et d'un montage expérimental extrêmement simple. De nombreuses études ont démontré comment la substitution globale d'acides aminés canoniques par divers analogues isostériques provoquait des perturbations structurelles minimales, mais des changements spectaculaires dans les propriétés thermodynamiques, le repliement, les propriétés spectrales d'agrégation et l'activité enzymatique.

synthèse in vitro

L'expansion du code génétique décrite ci-dessus est in vivo . Une alternative est le changement de codage des expériences de traduction in vitro . Cela nécessite l'épuisement de tous les ARNt et la réintroduction sélective de certains ARNt aminoacylés, certains chimiquement aminoacylés.

Synthèse chimique

Il existe plusieurs techniques pour produire des peptides par voie chimique, généralement c'est par chimie de protection en phase solide. Cela signifie que n'importe quel acide aminé (protégé) peut être ajouté dans la séquence naissante.

En novembre 2017, une équipe du Scripps Research Institute a rapporté avoir construit un génome de bactérie E. coli semi-synthétique en utilisant six acides nucléiques différents (contre quatre trouvés dans la nature). Les deux "lettres" supplémentaires forment une troisième paire de bases non naturelle. Les organismes résultants ont pu prospérer et synthétiser des protéines en utilisant des "acides aminés non naturels". La paire de bases non naturelle utilisée est dNaM –dTPT3. Cette paire de bases non naturelle a été démontrée précédemment, mais il s'agit du premier rapport de transcription et de traduction de protéines utilisant une paire de bases non naturelle.

Voir également

Les références