Les concepteurs de protéines informatiques

[ad_1]

En concevant une protéine à partir de la base, les chercheurs peuvent créer des molécules avec des formes et des fonctions inconnues de la nature.Crédit: Brian DalBalcon

Le succès de Cassie Bryan dans la création d’une protéine qui a fonctionné comme elle le souhaitait tarde à se faire. Quand cela s’est finalement passé, après six longues années, elle est allée au bar et a célébré avec des bières – et une interprétation au karaoké de la «mauvaise réputation» de Joan Jett.

Bryan a rejoint le laboratoire de conception de protéines de David Baker en 2012 en tant qu'étudiant diplômé à l'Université de Washington, à Seattle. Son projet consistait à concevoir une protéine pouvant se lier à PD-1, une protéine à la surface des globules blancs qui étrangle l'activité du système immunitaire.

Au début, Bryan a fait ce que les ingénieurs en protéines font depuis longtemps: elle a peaufiné une protéine naturelle existante pour la lier à PD-1. Mais deux ans après le début de son projet, elle a décidé que cette approche n’allait nulle part. Et une explosion d'intérêt pour PD-1 en tant que cible d'immunothérapie anticancéreuse au cours de cette période a incité ses poteaux de but à rester en mouvement. Pendant ce temps, le laboratoire devenait de plus en plus apte à adopter une approche différente. Au lieu de modifier les protéines naturelles pour répondre à un besoin particulier, le laboratoire Baker a commencé à créer des protéines à partir de rien.

Bien que considérablement plus difficile que l’ingénierie des protéines conventionnelle, de novo La conception des protéines offre plusieurs avantages, déclare Brian Kuhlman, ingénieur en protéines à Chapel Hill, université de Caroline du Nord, qui a dirigé le premier laboratoire du laboratoire en 2003. de novo Succès, une molécule de 93 acides aminés appelée Top7. Les protéines naturelles sont difficiles à modifier sans perturber leur structure globale. Mais en fabriquant des protéines à partir de rien, les chercheurs peuvent concevoir des protéines plus tolérantes. Ils peuvent construire des enzymes ayant des activités inconnues de la nature, en utilisant des cofacteurs et des acides aminés qui ne font pas partie de la boîte à outils macromoléculaire standard. Et les scientifiques peuvent tester leur compréhension de la biologie des protéines afin de s’assurer qu’ils en comprennent réellement les principes fondamentaux.

«Nous inventons tout à partir de rien», déclare Baker. «C’est une règle très stricte en laboratoire: il n’est pas permis de commencer par quoi que ce soit qui existe dans la nature, car nous voulions pouvoir être sûr de tout comprendre et de tout concevoir à partir des principes de base.»

Pour la plupart, ces protéines artificielles sont ce que Baker appelle des «roches» – des protéines ultra-stables, telles que Top7, de forme définie sur lesquelles d’autres chercheurs peuvent s’appuyer. Au cours des dernières années, toutefois, les scientifiques sont devenus de plus en plus compétents pour conférer une fonction, allant des protéines fluorescentes et de signalisation cellulaire aux vaccins candidats. Mais ils sont minoritaires dans la communauté des concepteurs – Baker estime que 95 à 99% des activités d’ingénierie des protéines «se font toujours par mutation et sélection aléatoires». Et de novo l'ingénierie des protéines nécessite souvent des semaines de temps de calcul et des mois d'itération. Néanmoins, les progrès informatiques et l’élargissement de la base d’utilisateurs rendent le processus plus accessible.

«C’est une période formidable pour être dans ce domaine», déclare Donald Hilvert, chimiste spécialiste des protéines à l’ETH de Zurich, qui a travaillé avec Kuhlman à la création d’enzymes appelées estérases. «La combinaison du calcul, de la structure, de la biologie moléculaire, des mesures biophysiques détaillées – tout cela se marie de manière si belle."

C'est compliqué

Le repliement des protéines est compliqué. Construites sous forme de longues chaînes d’acides aminés, les protéines nouvellement formées s’effondrent rapidement en une forme pliée spécifique, à partir de laquelle les molécules tirent leur fonction. Les chercheurs savent depuis longtemps que la séquence d’une protéine définit sa forme. Et ils peuvent expérimentalement déterminer cette forme en utilisant la cristallographie aux rayons X et la microscopie cryo-électronique. Ce qu'ils ne pouvaient pas faire était de prédire la forme à partir de la séquence seule.

C’est parce que la structure d’une protéine est définie par plusieurs forces concurrentes. Une protéine est fondamentalement une longue chaîne de carbone, d'azote, d'oxygène et d'hydrogène, avec des chaînes latérales d'acides aminés qui pendent comme des breloques sur un bracelet moléculaire. La molécule ne peut toutefois pas prendre n'importe quelle forme – les possibilités sont limitées car différentes parties de la protéine se bousculent pour obtenir des forces attractives et répulsives de la position et de l'équilibre. Le truc dans la prévision du repliement des protéines est de déterminer ces forces, et donc les angles précis que prendront les liaisons protéiques.

Cassie Bryan de l’Université de Washington a mis au point une protéine qui se lie à la protéine PD-1 de la surface des cellules.Crédit: Brian DalBalcon

Le laboratoire Baker utilise une suite d'outils de modélisation moléculaire et de recherche appelée Rosetta, qui permet de calculer l'énergie d'une protéine repliée et de rechercher la séquence d'énergie la plus basse pour une structure donnée, ou la structure d'énergie la plus basse pour une séquence donnée. Baker a développé Rosetta à la fin des années 1990 en tant qu’outil de prévision de la structure. Le logiciel est en développement constant depuis, à la fois par les membres de son laboratoire et par une communauté de plusieurs centaines d'utilisateurs appelée Rosetta Commons, afin d'améliorer ses performances et ses capacités.

Par exemple, dans un projet visant à concevoir de courts peptides circulaires appelés macrocycles – pouvant avoir des propriétés antibiotiques et anticancéreuses – postdoctorants Baker Lab, Parisa Hosseinzadeh, Gaurav Bhardwaj et Vikram Mulligan (actuellement à la Simons Foundation à New York City) ont collaboré. apprendre à Rosetta à manipuler les acides d 'aminés. Il s’agit d’images en miroir chimiques des résidus «l» utilisés par les cellules et ont donc des propriétés différentes. Le concepteur de protéines Neil King, un ancien de Baker Lab, toujours à l'Université de Washington, a modifié Rosetta pour concevoir des nanoparticules de protéines à assemblage automatique.

Bien que chaque de novo projet dans son laboratoire est différent, Baker dit qu'ils suivent tous la même stratégie de base. Tout d’abord, choisissez une classe de structures désirée – un ‘idéal platonicien’ d’une forme, comme il le dit. Ensuite, utilisez Rosetta pour concevoir des dizaines de milliers de conformations dorsales potentielles correspondant à cette forme, personnalisez-les avec des résidus de chaîne latérale et testez le fait que les séquences calculées se plieront à la forme souhaitée. Enfin, synthétisez des gènes qui exprimeront les meilleures conceptions, les tester, les itérer et les répéter.

«Seule une très petite fraction des conformations dorsales possibles est réellement concevable», déclare Baker. Et les chercheurs devront peut-être explorer des millions de possibilités et des dizaines de protéines physiques avant de sélectionner le bon candidat. Zibo Chen, diplômé du laboratoire Baker et qui travaille actuellement au California Institute of Technology de Pasadena, a passé au crible quelque 87 millions de dorsales pour identifier 2 251 modèles capables d'interaction protéine-protéine. Le calcul a pris environ six semaines sur plusieurs centaines de cœurs de processeurs.

Inspiré par l’origami d’ADN – dans lequel les molécules d’ADN sont pliées en nanostructures – Chen souhaitait identifier des stratégies de liaison hydrogène lui permettant de concevoir des paires de protéines parfaitement orthogonales (protéines qui interagiraient uniquement avec un partenaire artificiel spécifié, mais pas avec d’autres protéines). Ces protéines pourraient être utilisées pour créer de nouveaux biocapteurs, des circuits génétiques ou simplement des formes fantaisistes. Chen a rejoint le laboratoire, explique-t-il, en partie parce qu'il voulait voir s'il pouvait recréer avec une protéine ce que les nanotechnologues en ADN avaient fabriqué avec des acides nucléiques: un emoji à visage souriant macromoléculaire. Plus tôt cette année, Chen a décrit le premier pas vers une telle conception: un tableau 2D auto-assemblé.. «J'étais assez naïf sur ce que je pouvais réaliser en cinq ans», dit-il.

Bryan a conçu sa protéine – ses 46 acides aminés, minuscule selon les normes protéiques – pour qu'elle s'interface avec et, espérons-le, régule la PD-1. La protéine, dit-elle, est simplement une surface plane – une feuille β – schafoldée par une hélice α unique en forme de tige. Sous forme de bande dessinée, il ressemble à un fer à repasser à l'ancienne utilisé pour presser les vêtements. "L'hélice est un peu comme une poignée, et la fin fonctionnelle est le fer qui colle au récepteur", explique-t-elle.

Bryan a d’abord essayé de modifier une protéine existante pour adopter cette forme, mais s’est rendu compte qu’elle ne pouvait pas la produire sous une forme utilisable. Alors, inspirée par la structure connue de la liaison de PD-1 à son ligand naturel PD-L2, elle a identifié trois résidus cruciaux, codé leurs positions dans Rosetta et a demandé au logiciel de construire une protéine qui la supporterait. Elle a prolongé une boucle essentielle de cinq acides aminés pour améliorer la liaison à la cible humaine. Et utilisant une stratégie de criblage à haut débit basée sur la cytométrie en flux (technique d’analyse cellulaire) et le séquençage de l’ADN, elle a testé chaque variante d’acide aminé à chaque position afin de pousser la structure vers des interactions toujours plus fortes. Sur le chemin de la création de sa protéine, Bryan a obtenu son diplôme, malgré un détour de trois ans lorsqu'elle a réalisé que sa protéine artificielle ne pouvait pas interagir avec son homologue humain en raison de certaines modifications cruciales apportées au sucre.

Enfin, Bryan a réalisé une avancée décisive: la protéine liée aux lymphocytes dans un cytomètre de flux. Avec tant de hauts et de bas, Bryan était sceptique quant à la nécessité de lire trop dans une expérience, dit-elle. Mais ces données de flux, fournies par ses collègues de l’immunologie, lui ont fait croire. "Ce sont ces collaborateurs de l'immunologie qui connaissent très bien les cellules T, et ils me disent que, sur de vrais lymphocytes T humains de vraies personnes, nous avons constaté cet effet puissant qui n'avait pas encore été observé avec des molécules similaires."

King, qui a conçu une nanoparticule à auto-assemblage qui pourrait servir de vaccin candidat contre le virus respiratoire syncytial, décrit le fait de guider une molécule du concept à la réalité comme surréaliste. "Vous inventez", dit-il. «C’est littéralement un fantasme informatique. Et quand cela fonctionne réellement dans le monde réel, c’est tout simplement magique. "

Et si Bryan a célébré, comme elle le dit, avec des bières et Joan Jett.

Concevoir pour la fonction

Selon Baker, les ingénieurs en protéines ne peuvent pratiquement rien faire pour le moment, du moins en ce qui concerne la forme. Mais la plupart des protéines n'existent pas simplement pour prendre une forme spécifique; c’est la fonction qui compte.

La fonction, telle que la capacité de catalyser une réaction chimique, complique la conception, explique Hosseinzadeh, car elle ajoute de nouvelles variables au problème. «Lorsque je choisis une forme, la seule chose qui m'importe, c'est l'énergie globale», dit-elle. «Mais lorsque vous concevez pour la fonction, il y a certaines autres choses qui entrent en ligne de compte – par exemple, cette molécule établit-elle de bons contacts avec la surface de la protéine que je veux cibler? Les chaînes latérales de ciblage sont-elles positionnées au bon endroit? Et couvre-t-il la surface (interaction)?

Anastassia Vorobieva, postdoctorante au laboratoire Baker's, et Jiayi Dou, actuellement à l’Université Stanford en Californie, ont décidé de créer un de novo analogue de la protéine fluorescente verte, les deux chercheurs sont venus au projet avec des ordres du jour différents. Vorobieva voulait créer un β-canon, un motif structurel commun qui n'avait pas encore été créé à partir de rien; Dou voulait construire une protéine capable de stabiliser une petite molécule, telle qu'un fluorophore.

Un tonneau β est une structure dans laquelle un bord d'une feuille β se connecte à l'autre, créant un pore creux ou une poche. Mais ils sont particulièrement difficiles à créer, dit Vorobieva, car les fils individuels de la feuille sont collants; Si la protéine n’est pas conçue de cette manière, elle se dégradera en un désordre inutile.

L’objectif de Vorobieva était de créer un fût avec une surface légèrement incurvée. Mais cette conception a exercé une pression inattendue sur le squelette peptidique. Quelques résidus de glycine bien placés conféraient une section transversale carrée, mais soulageaient suffisamment le stress pour que la conception réussisse. Vorobieva l'a montré avec une structure cristalline qui correspondait parfaitement à son concept. C'était «la dernière expérience forte qui a montré que nous faisions tout bien», dit-elle.

Pour rendre la protéine fonctionnelle, Dou a reproduit la conception originale de Vorobieva, mais avec des contraintes supplémentaires pour la stabilisation d’une molécule fluorescente. Elle travaillait avec Will Sheffler, chercheur au laboratoire Baker, qui était en train de concevoir un nouveau module Rosetta pour analyser les conformations de liaison possibles d'une petite molécule liée à une protéine. Dou équilibré stabilité et fonction en limitant délibérément le fluorophore au sommet du baril. Dou identifia 2 102 modèles candidats et en synthétisa 56. Deux fluorescentes en présence du substrat fluorescent, dont l'une fut ensuite modifiée pour maximiser la luminosité et valider son design, ce qui nécessitait de tester quelque 2 090 variants géniques.

Un modèle 3D d'une protéine. La séquence d'acides aminés dans une protéine définit sa forme.Crédit: Ian Hayden / Institut de conception de protéines

La conception des protéines implique presque toujours la sélection et l'itération, note Lynne Regan, chimiste spécialiste des protéines à l'Université d'Edimbourg, au Royaume-Uni. Les chercheurs ne peuvent pas encore s'asseoir devant un ordinateur et concevoir une protéine qui se lie à une autre molécule et la capter du premier coup; ils doivent faire quelque chose qui fonctionne dans une certaine mesure, puis l'améliorer.

Cela est dû en partie au fait que les chercheurs travaillent encore sur les minuties du repliement des protéines. Baker note, par exemple, que Rosetta dépend de sa «fonction énergie», un modèle qui estime l’énergie associée à chaque structure. Mais le fait que le programme indique qu'une molécule adoptera une forme particulière ne signifie pas qu’elle le fera réellement. Sharon Guffy, chercheuse en protéines dans la société de biotechnologie Pairwise à Durham, en Caroline du Nord, qui a effectué ses études supérieures avec Kuhlman, a déclaré qu’elle avait du mal à faire comprendre à Rosetta les propriétés électriques du zinc (et son impact sur les chaînes latérales voisines) lors de la création. une protéine liant les métaux. «Cela m'a coûté au moins un mois» de codage et de dépannage, dit-elle.

À l'Université de Californie à San Francisco, Marco Mravic, étudiant diplômé du laboratoire de l'ingénieur en protéines William DeGrado, concentre ses recherches sur les protéines membranaires, en particulier leur assemblage dans des complexes plus vastes. Il a choisi d'étudier une protéine cardiaque appelée phospholambane, qui comprend cinq hélices membranaires identiques. Qu'est-ce que Mravic voulait savoir, qui force ces hélices à se réunir si précisément?

Une partie du problème était structurelle. Personne ne savait réellement à quoi ressemblait le phospholamban. Mravic a exécuté une simulation de la protéine par dynamique moléculaire, suggérant que les splays complexes s’ouvrent à une extrémité comme une peau de banane. «C’était comme si cette simulation n’avait pas l’air correcte», dit Mravic. "Donc, je suis juste entré dans la molécule et je l'ai" réparé "."

En modifiant deux acides aminés épris de l’eau en résidus plus favorables à la membrane, Mravic a créé une variante plus compacte, qu’il a démontrée en résolvant la structure cristalline. Il a ensuite défini les caractéristiques qui permettaient ce compactage, identifiant ce qu’il appelle un «code stérique» – une configuration de quatre acides aminés sur la surface de l’hélice permettant aux chaînes latérales de clé de s’entrelacer comme un zip. Mravic a ensuite utilisé ce code pour concevoir des dérivés synthétiques qui adoptent des structures analogues à celles du phospholambane..

Fondations structurelles

Au-delà des nuances du repliement des protéines, de novo la conception permet aux chercheurs de repousser les limites de ce que les protéines peuvent faire. Par exemple, à l’Université de Birmingham, au Royaume-Uni, la chimiste Anna Peacock étudie des métallopeptides, protéines miniatures qui se lient aux ions métalliques. En biologie, de telles molécules se lient généralement au zinc, au manganèse ou au cuivre – «des choses que l'on trouve dissoutes dans l'eau de mer», dit-elle. Mais d'autres métaux pourraient permettre une chimie différente.

Paon a utilisé de novo les protéines comme des échafaudages pour créer des molécules capables de se lier au gadolinium, dont les complexes sont couramment utilisés comme agents de contraste pour l'imagerie par résonance magnétique. Elle élabore également des enzymes pouvant utiliser des métaux tels que le platine ou l'iridium pour explorer des réactions inconnues de la nature. "Personnellement, je ne vois pas l'intérêt de faire en sorte qu'une métalloprotéine artificielle fasse la même chimie qu'une enzyme peut déjà faire", dit-elle.

Lorsque chaque objectif de conception est atteint, il devient plus facile pour les autres de les imiter. Le laboratoire Baker a même développé une interface de jeu en ligne pour Rosetta, appelée FoldIt, qui met au défi les joueurs (dont peu de scientifiques) de créer des protéines. in silico. Dans une étude cette année analysant leur travail, les joueurs livrés. Selon Baker, ils ont construit de nouveaux modèles «complètement à partir de zéro», dont un pli jamais vu auparavant.

Bien entendu, peu de scientifiques ont le temps ou l'expertise pour concevoir une protéine à partir de la base. pour eux, de novo les dessins sont des fondations sur lesquelles bâtir. Mais dans le laboratoire Baker, le travail de conception se poursuit. À chaque succès, le laboratoire fête. Selon Baker, les post-doctorants et les étudiants qui effectuent le travail «l’euphorie« dure assez longtemps. Pour moi, ça dure un jour ou deux, puis ça s’efface et je me dis, ok, qu'est-ce qu'on va faire ensuite?

[ad_2]