Margaret Oakley Dayhoff - Margaret Oakley Dayhoff

Margaret Oakley Dayhoff
Photo de Margaret Oakley Dayhoff.jpg
Née
Margaret Belle Oakley

( 1925-03-11 )11 mars 1925
Décédés 5 février 1983 (1983-02-05)(57 ans)
Nationalité États Unis
Connu pour Matrices de substitution
code à une lettre
Carrière scientifique
Des champs Bioinformatique
Établissements Université Columbia
Influences George Kimball

Margaret Belle ( Oakley ) Dayhoff (11 mars 1925 - 5 février 1983) était une physico-chimiste américaine et une pionnière dans le domaine de la bioinformatique . Dayhoff a été professeure au Georgetown University Medical Center et une biochimiste de renom à la National Biomedical Research Foundation (NBRF) où elle a été pionnière dans l'application des mathématiques et des méthodes informatiques au domaine de la biochimie. Elle a consacré sa carrière à l'application des technologies informatiques en évolution pour soutenir les progrès de la biologie et de la médecine, notamment la création de bases de données de protéines et d'acides nucléiques et d'outils pour interroger les bases de données. Elle est à l'origine de l'une des premières matrices de substitution , les mutations ponctuelles acceptées ( PAM ). Le code à une lettre utilisé pour les acides aminés a été développé par elle, reflétant une tentative de réduire la taille des fichiers de données utilisés pour décrire les séquences d'acides aminés à l'ère de l'informatique à cartes perforées.

Son doctorat a été obtenu à l'Université de Columbia dans le département de chimie, où elle a conçu des méthodes informatiques pour calculer les énergies de résonance moléculaire de plusieurs composés organiques. Elle a fait des études postdoctorales à l'Institut Rockefeller (maintenant l'Université Rockefeller ) et à l' Université du Maryland , et a rejoint la Fondation nationale de recherche biomédicale nouvellement créée en 1959. Elle a été la première femme à occuper un poste au sein de la Biophysical Society et la première personne à occuper le poste de à la fois secrétaire et éventuellement président.

Jeunesse

Washington Square Park , près de l'endroit où les travaux de premier cycle de Dayhoff ont été menés

Dayhoff est née fille unique à Philadelphie , mais a déménagé à New York quand elle avait dix ans. Sa promesse académique était évidente dès le début - elle a été major de promotion (promotion de 1942) au Bayside High School , Bayside, New York , et de là a reçu une bourse au Washington Square College de l'Université de New York , diplômée magna cum laude en mathématiques en 1945. et se faire élire à Phi Beta Kappa .

Recherche

Dayhoff a commencé un doctorat en chimie quantique sous la direction de George Kimball au département de chimie de l'Université Columbia . Dans sa thèse de doctorat, Dayhoff a été la pionnière de l'utilisation des capacités informatiques – c'est-à-dire le traitement des données de masse – à la chimie théorique ; Plus précisément, elle a conçu une méthode d'application de machines de bureau à cartes perforées pour calculer les énergies de résonance de plusieurs molécules organiques polycycliques . Sa gestion de ses données de recherche était si impressionnante qu'elle a reçu une bourse Watson Computing Laboratory. Dans le cadre de ce prix, elle a eu accès au « équipement de traitement de données électroniques IBM de pointe » au laboratoire.

Un exemple de système de carte perforée pré-informatique

Après avoir terminé son doctorat, Dayhoff a étudié l' électrochimie sous Duncan A. MacInnes au Rockefeller Institute de 1948 à 1951. En 1952, elle a déménagé dans le Maryland avec sa famille et a ensuite reçu des bourses de recherche de l' Université du Maryland (1957-1959), travaillant sur un modèle de liaison chimique avec Ellis Lippincott . Au Maryland, elle a découvert pour la première fois un nouvel ordinateur haute vitesse, le modèle IBM 7094. Après cela, elle a rejoint la National Biomedical Research Foundation en 1960 en tant que directrice associée (un poste qu'elle a occupé pendant 21 ans). À la NBRF, elle a commencé à travailler avec Robert Ledley , un dentiste qui avait obtenu un diplôme en physique et s'était intéressé aux possibilités d'appliquer des ressources informatiques aux problèmes biomédicaux. Il était l'auteur de l'une des premières études sur le calcul biomédical, «Rapport sur l'utilisation de l'ordinateur en biologie et en médecine». Grâce à leur expertise combinée, ils ont publié un article en 1962 intitulé "COMPROTEIN: A computer program to aid primary protein structure determination" qui décrivait un "programme informatique complet pour l' IBM 7090 " visant à convertir les digestions peptidiques en données de chaîne protéique. En fait, ils ont commencé ce travail en 1958, mais n'ont pu commencer à programmer qu'à la fin des années 1960.

Comparaison des compositions atmosphériques – Vénus , Mars , Terre (passé et présent)

Au début des années 1960, Dayhoff a également collaboré avec Ellis Lippincott et Carl Sagan pour développer des modèles thermodynamiques de systèmes cosmo-chimiques, y compris les atmosphères planétaires prébiologiques. Elle a développé un programme informatique permettant de calculer les concentrations d'équilibre des gaz dans une atmosphère planétaire, permettant l'étude des atmosphères de Vénus, Jupiter et Mars, en plus de l'atmosphère actuelle et de l'atmosphère terrestre primordiale. À l'aide de ce programme, elle a examiné si l'atmosphère primordiale avait les conditions nécessaires pour générer la vie. Bien qu'elle ait découvert que de nombreux petits composés biologiquement importants peuvent apparaître sans mécanisme spécial de non-équilibre pour expliquer leur présence, il y avait des composés nécessaires à la vie qui étaient rares dans le modèle d'équilibre (comme le ribose, l'adénine et la cytosine).

Dayhoff a également enseigné la physiologie et la biophysique au Georgetown University Medical Center pendant 13 ans, a été membre de l' American Association for the Advancement of Science et a été élu conseiller de la Société internationale pour l'étude des origines de la vie en 1980 après 8 ans de adhésion. Dayhoff a également siégé aux comités de rédaction de trois revues : DNA , Journal of Molecular Evolution et Computers in Biology and Medicine .

Un exemple de phylogénie générée par ordinateur pour MAPK

En 1966, Dayhoff a été le premier à utiliser des ordinateurs pour comparer les séquences de protéines et reconstruire leurs histoires évolutives à partir d' alignements de séquences . Pour effectuer ce travail, elle a créé le code d' acides aminés à une seule lettre afin de minimiser la taille du fichier de données pour chaque séquence. Ce travail, co-écrit avec Richard Eck, a été la première application des ordinateurs pour déduire des phylogénies à partir de séquences moléculaires. Il s'agissait de la première reconstruction d'une phylogénie ( arbre évolutif ) par ordinateur à partir de séquences moléculaires utilisant une méthode de parcimonie maximale . Au cours des années suivantes, elle a appliqué ces méthodes pour étudier un certain nombre de relations moléculaires, telles que la chaîne catalytique et la protéine kinase dépendante de l'AMP cyclique bovine et le produit du gène src des virus du sarcome murin aviaire de Rous et Moloney ; antithrombine-III, alpha-antitrypsine et ovalbumine; le facteur de croissance épidermique et la chaîne légère du facteur de coagulation X ; et les apolipoprotéines AI, A-II, CI et C-III.

Sur la base de ce travail, Dayhoff et ses collègues ont développé un ensemble de matrices de substitution appelées PAM (Percent Accepted Mutation), MDM (Mutation Data Matrix) ou Dayhoff Matrix. Ils sont dérivés d'alignements globaux de séquences protéiques étroitement apparentées. Le numéro d'identification inclus avec la matrice (ex. PAM40, PAM100) se réfère à la distance évolutive; des nombres plus grands correspondent à des distances plus grandes. Les matrices utilisant des distances évolutives plus grandes sont extrapolées de celles utilisées pour les plus petites. Pour produire une matrice Dayhoff, des paires d'acides aminés alignés dans des alignements vérifiés sont utilisées pour construire une matrice de comptage, qui est ensuite utilisée pour estimer la matrice de mutation à 1 PAM (considérée comme une unité évolutive). A partir de cette matrice de mutation, une matrice de notation de Dayhoff peut être construite. Avec un modèle d'événements indel, les alignements générés par ces méthodes peuvent être utilisés dans un processus itératif pour construire de nouvelles matrices de comptage jusqu'à la convergence.

L'une des contributions les plus importantes de Dayhoff à la bioinformatique a été son Atlas of Protein Sequence and Structure , un livre rapportant toutes les séquences de protéines connues (au total 65) qu'elle a publié en 1965. Ce livre a publié un codage dégénéré des acides aminés. Il a ensuite été réédité en plusieurs éditions. Cela a conduit à la base de données Protein Information Resource de séquences de protéines, le premier système de base de données en ligne accessible par ligne téléphonique et disponible pour interrogation par des ordinateurs distants. Le livre a depuis été cité près de 4 500 fois. Elle et l'effort parallèle de Walter Goad qui a conduit à la base de données GenBank de séquences d'acides nucléiques sont les origines jumelles des bases de données modernes de séquences moléculaires. L' Atlas a été organisé par familles de gènes , et elle est considérée comme une pionnière dans leur reconnaissance. La détermination par Frederick Sanger de la première séquence complète d'acides aminés d'une protéine (insuline) en 1955, a conduit un certain nombre de chercheurs à séquencer diverses protéines de différentes espèces. Au début des années 1960, une théorie a été développée selon laquelle de petites différences entre les séquences de protéines homologues (séquences avec une forte probabilité d'ascendance commune) pourraient indiquer le processus et le taux de changement évolutif au niveau moléculaire. L'idée qu'une telle analyse moléculaire pourrait aider les scientifiques à décoder les modèles évolutifs des organismes a été formalisée dans les articles publiés par Emile Zuckerkandl et Linus Pauling en 1962 et 1965.

Tableau de codage Dayhoff des acides aminés

Acides aminés Code à 1 lettre code à 3 lettres Propriété Dayhoff
Cystéine C Cys Polymérisation du soufre une
Glycine , Sérine , Thréonine , Alanine , Proline G, S, T, A, P Gly, Ser, Thr, Ala, Pro Petit b
L' acide aspartique , l' acide glutamique , asparagine , glutamine D, E, N, Q Asp, Glu, Asn, Gln Acide et amide c
Arginine , Histidine , Lysine R, H, K Arg, His, Lys De base
Leucine , Valine , Méthionine , Isoleucine L, V, M, I Leu, Val, Met, Ile Hydrophobe e
Tyrosine , Phénylalanine , Tryptophane O, F, W Tyr, Phe, Trp Aromatique F

David Lipman , directeur du National Center for Biotechnology Information , a qualifié Dayhoff de "mère et père de la bioinformatique".

Mariage et famille

Le mari de Dayhoff était Edward S. Dayhoff, un physicien expérimental qui travaillait avec la résonance magnétique et les lasers. Ils eurent deux filles qui devinrent physiciennes, Ruth et Judith.

Judith Dayhoff est titulaire d'un doctorat en biophysique mathématique de l' Université de Pennsylvanie et est l'auteur de Neural network architectures: An introduction et coauteur de Neural Networks and Pattern Recognition .

Ruth Dayhoff est diplômée summa cum laude en mathématiques de l' Université du Maryland et s'est concentrée sur l'informatique médicale tout en faisant son doctorat à la Georgetown University School of Medicine . Pendant ses études de médecine, elle a co-écrit un article et un chapitre dans The Atlas of Protein Sequence and Structure avec sa mère, décrivant une nouvelle façon de mesurer à quel point les protéines sont étroitement liées. Son mari Vincent Brannigan est professeur émérite de droit et de technologie à la faculté d'ingénierie de l'Université du Maryland. Ruth a été membre fondateur de l' American College of Medical Informatics . Elle a été la pionnière de l'intégration de l'imagerie médicale et a inventé le système d' imagerie Vista . Elle a été choisie pour le projet de la Bibliothèque nationale de médecine sur les 200 femmes médecins qui « ont changé le visage de la médecine ». Elle est directrice de l'imagerie numérique en médecine pour le département américain des Affaires des anciens combattants .

La vie plus tard

L' Atlas de Dayhoff est devenu un modèle pour de nombreux outils indispensables dans de grandes parties de la recherche biomédicale liée à l'ADN ou aux protéines. Malgré cet apport important, Dayhoff est marginalisé par la communauté des séquenceurs. Le contrat de gestion de GenBank (une technologie directement liée à ses recherches), attribué au début des années 1980 par le NIH, est allé à Walter Goad du Laboratoire national de Los Alamos . La raison de cette attitude était inconnue, avec des théories allant du sexisme à un conflit de valeurs avec la communauté scientifique expérimentale. Malgré le succès de l' Atlas de Dayhoff , les scientifiques expérimentaux et les chercheurs ont estimé que leurs informations de séquence étaient très précieuses et étaient souvent réticentes à les soumettre à une telle base de données accessible au public.

Au cours des dernières années de sa vie, elle s'est concentrée sur l'obtention d'un financement stable, adéquat et à long terme pour soutenir le maintien et le développement ultérieur de sa ressource d'information sur les protéines . Elle a imaginé un système en ligne de programmes informatiques et de bases de données, accessible aux scientifiques du monde entier, pour identifier les protéines à partir de données de séquence ou de composition en acides aminés, pour faire des prédictions basées sur des séquences et pour parcourir les informations connues. Moins d'une semaine avant sa mort, elle a soumis une proposition à la Division des ressources de recherche du NIH pour une ressource d'identification des protéines. Après sa mort, ses collègues ont travaillé pour faire de sa vision une réalité, et la base de données sur les protéines était pleinement opérationnelle au milieu de 1984.

Logo de la Société de biophysique

Dayhoff est décédée d'une crise cardiaque à l'âge de 57 ans le 5 février 1983. Un fonds a été créé après sa mort en 1984 pour doter le Margaret O. Dayhoff Award , l'un des plus grands honneurs nationaux en biophysique. Le prix est décerné à une femme qui « est très prometteuse ou a atteint une notoriété tout en développant les premières étapes d'une carrière dans la recherche biophysique relevant de la compétence et de l'intérêt de la Biophysical Society ». Il est présenté à l'assemblée annuelle de la Biophysical Society et comprend des honoraires de 2 000 $.

Elle laisse dans le deuil son mari, Edward S. Dayhoff de Silver Spring; deux filles, Ruth E. Dayhoff Brannigan de College Park et Judith E. Dayhoff de Silver Spring, et son père, Kenneth W. Oakley de Silver Spring.

Les références

Liens externes