Épissage de protéines - Protein splicing

mécanisme d'épissage des protéines impliquant les intéines
Le mécanisme d'épissage des protéines impliquant les intéines. Dans ce schéma, la N-extéine est représentée en rouge, l'intéine en noir et la C-extéine en bleu. X représente soit un atome d'oxygène soit un atome de soufre.

L'épissage des protéines est une réaction intramoléculaire d'une protéine particulière dans laquelle un segment de protéine interne (appelé intéine ) est retiré d'une protéine précurseur avec une ligature de protéines externes C-terminales et N-terminales (appelées extéines ) des deux côtés. La jonction d'épissage de la protéine précurseur est principalement une cystéine ou une sérine , qui sont des acides aminés contenant une chaîne latérale nucléophile . Les réactions d'épissage de protéines qui sont actuellement connues ne nécessitent pas de cofacteurs exogènes ou de sources d'énergie telles que l' adénosine triphosphate (ATP) ou la guanosine triphosphate (GTP). Normalement, l' épissage n'est associé qu'à l'épissage pré-ARNm . Cette protéine précurseur contient trois segments : une N-extéine suivie de l'intéine suivie d'une C-extéine . Après l'épissage, la protéine résultante contient l'extéine N liée à l'extéine C ; ce produit d'épissage est également appelé extéine.

Histoire

La première intéine a été découverte en 1988 par comparaison de séquences entre l' ATPase vacuolaire de Neurospora crassa et de carotte (sans intéine) et le gène homologue chez la levure (avec intéine) qui a été décrit pour la première fois comme un transporteur putatif d' ions calcium . En 1990 Hirata et al. ont démontré que la séquence supplémentaire dans le gène de levure était transcrite en ARNm et ne s'éliminait de la protéine hôte qu'après traduction. Depuis lors, des intéines ont été trouvées dans les trois domaines de la vie (eucaryotes, bactéries et archées) et dans les virus .

L'épissage des protéines était imprévu et ses mécanismes ont été découverts par deux groupes (Anraku et Stevens) en 1990. Ils ont tous deux découvert une Saccharomyces cerevisiae VMA1 dans un précurseur d'une enzyme vacuolaire H + - ATPase . La séquence d'acides aminés des terminaisons N et C correspondait à 70 % de la séquence d'ADN de celle d'une H + -ATPase vacuolaire d'autres organismes, tandis que la séquence d'acides aminés de la position centrale correspondait à 30 % de la séquence d'ADN totale de la nucléase HO de levure .

De nombreux gènes ont des segments codant pour l'intéine non apparentés insérés à différentes positions. Pour ces raisons et d'autres, les intéines (ou plus exactement, les segments de gènes codant pour les intéines) sont parfois appelées éléments génétiques égoïstes , mais il peut être plus précis de les appeler parasites . Selon la vision de l'évolution centrée sur les gènes, la plupart des gènes ne sont « égoïstes » que dans la mesure où ils entrent en compétition avec d'autres gènes ou allèles, mais ils remplissent généralement une fonction pour les organismes, alors que les « éléments génétiques parasites », au moins initialement, ne font pas un contribution positive à la condition physique de l'organisme.

Dans la base de données de toutes les intéines connues ( [1] ), 113 intéines connues sont présentes chez les eucaryotes avec une longueur minimale de 138 acides aminés et une longueur maximale de 844 acides aminés. La première intéine a été trouvée codée dans le gène VMA de Saccharomyces cerevisiae . Ils ont ensuite été retrouvés dans des champignons (ascomycètes, basidiomycètes, zygomycètes et chytrides) ainsi que dans diverses protéines. Une protéine apparentée de loin aux protéines contenant des intéines connues, mais étroitement apparentée aux protéines hedgehog de métazoaires , a été décrite comme ayant la séquence d'intéine de Glomeromycota. La plupart des intéines nouvellement décrites contiennent des endonucléases à tête chercheuse et certaines d'entre elles sont apparemment actives. L'abondance d'intéine dans les champignons indique un transfert latéral de gènes contenant l'intéine. Alors que dans les eubactéries et les archées, il existe 289 et 182 intéines actuellement connues. Il n'est pas surprenant que la plupart des intéines des eubactéries et des archées soient insérées dans les protéines métaboliques des acides nucléiques, comme les champignons.

Mécanisme

Le processus commence par un décalage NO ou NS lorsque la chaîne latérale du premier résidu (une sérine , une thréonine ou une cystéine ) de la partie intéine de la protéine précurseur attaque nucléophile la liaison peptidique du résidu immédiatement en amont (c'est-à-dire la dernière résidu de la N-extéine) pour former un intermédiaire ester (ou thioester ) linéaire . Une transestérification se produit lorsque la chaîne latérale du premier résidu de l'extéine C attaque le (thio)ester nouvellement formé pour libérer l' extrémité N-terminale de l'intéine. Cela forme un intermédiaire ramifié dans lequel la N-extéine et la C-extéine sont attachées, mais pas par l'intermédiaire d'une liaison peptidique. Le dernier résidu de l'intéine est toujours une asparagine , et l' atome d'azote d' amide de cette chaîne latérale sépare la liaison peptidique entre l'intéine et la C-extéine, ce qui donne un segment d'intéine libre avec un imide cyclique terminal . Enfin, le groupe amino libre de l'extéine C attaque maintenant le (thio)ester liant les extéines N et C entre elles. Un décalage ON ou SN produit une liaison peptidique et la protéine fonctionnelle ligaturée .

Le mécanisme de l'effet d'épissage est une analogie naturelle avec la technique de génération chimique de protéines de taille moyenne appelée ligature chimique native .

Intéin

Une intéine est un segment d'une protéine capable de s'exciser et de joindre les parties restantes (les extéines ) avec une liaison peptidique lors de l'épissage de la protéine. Les intéines ont également été appelées introns protéiques , par analogie avec les introns (ARN) .

Conventions de nommage

La première partie d'un nom d'intéine est basée sur le nom scientifique de l' organisme dans lequel il se trouve, et la seconde partie est basée sur le nom du gène ou de l'extéine correspondant. Par exemple, l'intéine trouvée dans Thermoplasma acidophilum et associée à la sous-unité A de l'ATPase vacuolaire (VMA) est appelée "Tac VMA".

Normalement, comme dans cet exemple, seulement trois lettres suffisent pour spécifier l'organisme, mais il existe des variations. Par exemple, des lettres supplémentaires peuvent être ajoutées pour indiquer une souche. Si plus d'une intéine est codée dans le gène correspondant, les intéines reçoivent un suffixe numérique commençant de 5' à 3' ou dans l'ordre de leur identification (par exemple, "Msm dnaB-1").

Le segment du gène qui code pour l'intéine porte généralement le même nom que l'intéine, mais pour éviter toute confusion, le nom de l'intéine proprement dit est généralement en majuscule ( p . ex. , Pfu RIR1-1), alors que le nom du segment de gène correspondant est en italique ( p . ex. , Pfu rir1-1 ).

Types d'intéines

Le type de protéines d'épissage est classé en quatre classes : maxi-intéine, mini-intéine, trans-épissage intéine et alanine intéine. Les maxi-intéines sont des domaines d'épissage N- et C-terminaux contenant un domaine d'endonucléase. Les mini-intéines sont des domaines d'épissage N- et C-terminaux typiques ; cependant, le domaine endonucléase n'est pas présent. Dans les intéines de trans-épissage, l'intéine est divisée en deux (ou peut-être plus) domaines, qui sont ensuite divisés en N-terminaux et C-terminaux. Les intéines d'alanine ont la jonction d'épissage d'une alanine au lieu d'une cystéine ou d'une sérine, dans lesquelles l'épissage des protéines se produit.

Intéines complètes et mini

Les intéines peuvent contenir un domaine de gène d'endonucléase de ralliement (HEG) en plus des domaines d'épissage. Ce domaine est responsable de la propagation de l'intéine en clivant l'ADN au niveau d'un allèle sans intéine sur le chromosome homologue , déclenchant le système de réparation de cassure double brin de l' ADN (DSBR), qui répare ensuite la cassure, copiant ainsi l'ADN codant pour l'intéine. dans un site auparavant intein-free. Le domaine HEG est pas nécessaire pour l' épissage intéine, et il peut donc être perdu, la formation d' un minimum ou un mini , intéine . Plusieurs études ont démontré la nature modulaire des intéines en ajoutant ou en supprimant des domaines HEG et en déterminant l'activité de la nouvelle construction.

Diviser les intéins

Parfois, l'intéine de la protéine précurseur provient de deux gènes. Dans ce cas, on dit que l'intéine est une intéine divisée . Par exemple, chez les cyanobactéries , DnaE , la sous-unité catalytique de l' ADN polymérase III , est codée par deux gènes distincts, dnaE-n et dnaE-c . Le dnaE-n produit séquence consiste en une N-extéine suivi d'un 123-AA intéine séquence, tandis que la dnaE-c produit consiste en une séquence d' intéine 36-AA suivie d'une séquence C-extéine.

Applications en biotechnologie

Les intéines sont très efficaces pour l'épissage des protéines, et elles ont donc trouvé un rôle important en biotechnologie . Il y a plus de 200 inteins identifiés à ce jour ; les tailles vont de 100 à 800 AA . Les intéines ont été conçues pour des applications particulières telles que la semisynthèse de protéines et le marquage sélectif de segments de protéines, ce qui est utile pour les études RMN de grandes protéines.

L'inhibition pharmaceutique de l'excision de l'intéine peut être un outil utile pour le développement de médicaments ; la protéine qui contient l'intéine ne remplira pas sa fonction normale si l'intéine n'est pas excisée, car sa structure sera perturbée.

Il a été suggéré que les intéines pourraient s'avérer utiles pour obtenir l' expression allotopique de certaines protéines hautement hydrophobes normalement codées par le génome mitochondrial , par exemple en thérapie génique . L'hydrophobie de ces protéines est un obstacle à leur importation dans les mitochondries. Par conséquent, l'insertion d'une intéine non hydrophobe peut permettre à cette importation de se dérouler. L'excision de l'intéine après l'importation restituerait alors la protéine au type sauvage .

Les étiquettes d'affinité ont été largement utilisées pour purifier les protéines recombinantes, car elles permettent l'accumulation de protéines recombinantes avec peu d'impuretés. Cependant, l'étiquette d'affinité doit être retirée par les protéases lors de l'étape de purification finale. L'étape de protéolyse supplémentaire soulève les problèmes de spécificité de protéase lors de l'élimination des marqueurs d'affinité de la protéine recombinante, et l'élimination du produit de digestion. Ce problème peut être évité en fusionnant une étiquette d'affinité à des intéines auto-clivables dans un environnement contrôlé. La première génération de vecteurs d'expression de ce type utilisait l' intéine modifiée de Saccharomyces cerevisiae VMA (Sce VMA). Chong et al. utilisé un domaine de liaison à la chitine (CBD) de Bacillus circulans comme marqueur d'affinité, et fusionné ce marqueur avec une intéine Sce VMA modifiée. L'intéine modifiée subit une réaction d'auto-clivage au niveau de sa liaison peptidique N-terminale avec du 1,4-dithiothréitol (DTT), du β-mercaptoéthanol (β-ME) ou de la cystine à basse température sur une large plage de pH. Après avoir exprimé la protéine recombinante, l'homogénat cellulaire est passé à travers la colonne contenant de la chitine . Cela permet au CBD de la protéine chimérique de se lier à la colonne. De plus, lorsque la température est abaissée et que les molécules décrites ci-dessus traversent la colonne, la protéine chimérique subit un auto-épissage et seule la protéine cible est éluée. Cette nouvelle technique élimine le besoin d'une étape de protéolyse, et le Sce VMA modifié reste en colonne attaché à la chitine par le CBD.

Récemment, les intéines ont été utilisées pour purifier des protéines à base de peptides auto-agrégés. Les polypeptides de type élastine (ELP) sont un outil utile en biotechnologie. Fusionnés avec la protéine cible, ils ont tendance à former des agrégats à l'intérieur des cellules. Cela élimine l'étape chromatographique nécessaire à la purification des protéines. Les étiquettes ELP ont été utilisées dans la protéine de fusion de l'intéine, de sorte que les agrégats peuvent être isolés sans chromatographie (par centrifugation), puis l'intéine et l'étiquette peuvent être clivées de manière contrôlée pour libérer la protéine cible en solution. Cet isolement de protéines peut être effectué en utilisant un flux de média continu, produisant des quantités élevées de protéines, ce qui rend ce processus plus économiquement efficace que les méthodes conventionnelles. Un autre groupe de chercheurs a utilisé des étiquettes auto-agrégées plus petites pour isoler la protéine cible. De petits peptides amphipathiques 18A et ELK16 (figure 5) ont été utilisés pour former une protéine d'agrégation auto-clivante.

Voir également

Les références

Lectures complémentaires

Liens externes