Identification, l'analyse et le séquençage d'ADN clonée - Molecular Cell Biology - Bibliothèque NCBI
NCBI Bibliothèque. Un service de la Bibliothèque nationale de médecine, Institut national de la santé.
- En accord avec l'éditeur, ce livre est accessible par la fonction de recherche, mais ne peut pas être consulté.

Molecular Cell Biology. 4e édition.
Lodish H, Berk A, Zipursky SL, et al.
Supposons que vous avez isolé une protéine particulière et que vous voulez isoler le gène qui la code. Une génomique complète # X003bb; bibliothèque de mammifères contient au moins un million de clones différents; une banque d'ADNc doit contenir autant de clones pour inclure les séquences de rares ARNm. Comment sont des clones d'intérêt spécifiques identifiés dans ces grandes collections? La méthode la plus courante implique le criblage d'une bibliothèque par hybridation avec des sondes d'ADN ou d'ARN radiomarquées. Dans un autre procédé, un clone spécifique dans une banque d'ADN cloné est identifié sur base une propriété de sa protéine codée.
La caractérisation la plus complète d'un ADN cloné nécessite la détermination de sa séquence nucléotidique; à partir de cette séquence, la séquence d'acides aminés d'une protéine codée peut être déduite. La séquence d'ADN génomique comprend des introns, ainsi que des exons; il comprend également des régions qui contrôlent l'expression du gène en déterminant le type de cellule dans laquelle la protéine codée est exprimée, le stade de développement, il est exprimé, et la quantité de protéine produite. Genomic également ADNs origines de réplication et des séquences importantes pour déterminer comment les associés ADN avec des protéines dans les chromosomes. Dans les chapitres suivants, nous considérons comment les cellules utilisent des séquences d'ADN pour ces fonctions. Dans cette section, les techniques d'identification, la caractérisation, et enfin le séquençage d'ADN cloné sont décrits.
Les bibliothèques peuvent être criblées avec membrane de dosage Hybridation
essai d'hybridation de la membrane de détection d'acides nucléiques. Ce dosage peut être utilisé pour détecter à la fois l'ADN et l'ARN, et la sonde complémentaire radiomarquée peut être soit de l'ADN ou de l'ARN. Voir le texte pour les détails.
Identification d'un clone spécifique d'un # X003bb; banque de phages par hybridation sur membrane à une sonde radiomarquée. La position du signal sur l'autoradiogramme identifie la plaque désirée sur la plaque. Dans la pratique, dans le placage initial d'une bibliothèque (plus.)
L'apparition d'une tache sur l'autoradiogramme indique la présence d'un recombinant # X003bb; clone contenant l'ADN complémentaire de la sonde. La position du spot sur l'autoradiogramme correspond à la position de la boîte de Petri initial lorsque ce clone particulier formé d'une plaque. Depuis la boîte de pétri d'origine contient encore beaucoup de virions infectieux dans chaque plaque, les particules virales du clone identifié peuvent être récupérés pour réensemencement en alignant le autoradiogramme et le plat de petri et éliminer les particules virales du clone correspondant à la tache. Une technique similaire peut être appliquée pour le criblage d'une banque de plasmides dans des cellules de E. coli.
Les sondes oligonucléotidiques sont conçus en fonction des séquences de protéines partielles
Nous décrivons ici deux approches différentes pour la préparation de sondes d'oligonucléotides. Généralement, une sonde oligonucléotidique radiomarquée est utilisée pour cribler une # X003bb; la banque d'ADNc en utilisant la technique de membrane -hybridization. Une fois obtenue, la pleine longueur d'ADNc radiomarquées peuvent être utilisées d'un clone d'ADNc codant pour une protéine particulière pour sonder une banque génomique de clones contenant des fragments du gène codant pour la protéine.
Les sondes dégénérées
Un procédé de préparation d'une sonde spécifique est présenté sur la figure 7-19. La protéine purifiée d'intérêt est digéré avec une ou plusieurs protéases (par exemple la trypsine) dans des peptides spécifiques, et les séquences d'acides aminés N-terminaux d'un petit nombre de ces peptides est déterminée par dégradation d'Edman séquentielle ou spectrométrie de masse (voir les figures 3-46 et 3-47). Basé sur le code génétique. les séquences d'oligonucléotides codant pour les séquences peptidiques déterminées peuvent être prévus. Rappelons, cependant, que le code génétique est dégénéré; qui est, de nombreux acides aminés sont codés par plusieurs codons (voir tableau 4-2). Étant donné que les codons spécifiques utilisés pour coder la protéine d'intérêt ne sont pas connus, des oligonucléotides contenant toutes les combinaisons possibles de codons doivent être synthétisés pour assurer que l'un d'entre eux correspond parfaitement le gène.
Conception des sondes oligonucléotidiques basées sur la séquence de la protéine. Une protéine isolée est digéré par une protéase sélective telle que la trypsine, qui clive spécifiquement les liaisons peptidiques du côté carboxy-terminal des résidus de lysine et d'arginine. Le résultat (plus.)
Un mélange de tous les oligonucléotides qui peuvent coder pour une partie sélectionnée d'une séquence de peptide est appelé une sonde dégénérée. Un tel mélange peut être préparé en une seule fois en ajoutant plus d'un précurseur nucléotidique de la réaction de synthèse en ces points de la séquence qui peuvent être codées par des bases alternatives. L'étape finale dans la préparation de ce type de sonde est à radiomarquer les oligonucléotides, généralement par le transfert d'un groupe phosphate marqué au 32P de l'ATP à la 5 # x02032; fin de chaque oligonucléotide en utilisant la polynucleotide kinase (Figure 7-20). Projection d'un # X003bb; banque d'ADNc avec une sonde dégénérée en utilisant la technique membrane -hybridization permettra d'identifier les clones qui hybrident avec l'oligonucléotide parfaitement complémentaire présent dans le mélange de la sonde. Dans les conditions expérimentales usuelles, des oligonucléotides qui diffèrent de la séquence d'ADNc à une ou deux bases seront également hybrider.
Radiomarquage d'un oligonucléotide à l'extrémité 5 # x02032; et avec du phosphore-32. Les trois groupes phosphate de l'ATP sont désignés le # X003b1 ;, # X003b2 ;, et # X003b3; phosphates dans l'ordre de leur position éloignée de l'anneau de ribose de l'adénosine (Ad). ATP contenant (suite.)
Les sondes à base EST unique
Les programmes informatiques qui appliquent le code génétique sont utilisés pour convertir les séquences EST en séquences d'acides aminés partielle de la protéine. En utilisant des programmes qui ont été développés dans le but et un ordinateur personnel, un chercheur peut rechercher la base de données actuelle EST pour une EST qui code pour une séquence d'acides aminés partielle spécifique dans la protéine particulière à l'étude. Si une correspondance est trouvée, l'EST fournit la séquence d'ADN unique de cette partie de l'ADNc pleine longueur. Une sonde spécifique unique, jusqu'à # X02248; 100 bases de long qui est parfaitement complémentaire d'une partie de l'EST peut alors être synthétisé et radiomarqué. En variante, la réaction en chaîne par polymérase. décrit à la fin de ce chapitre, peut être utilisé pour synthétiser une sonde égale à la longueur totale de l'EST. A l'heure actuelle, la base de données EST humaine est si grande que ESTs peuvent être identifiés qui codent pour des séquences d'acides aminés partielles déterminées à partir de protéines humaines les plus isolées.
Clones spécifiques peuvent être identifiés en fonction des propriétés des protéines encodées
Les banques génomiques et d'ADNc peuvent également être criblés pour des propriétés d'une protéine spécifique codée dans l'ADN clone. Cette approche utilise des vecteurs de clonage spéciaux, appelés # X003bb; vecteurs d'expression. dans lequel l'ADN cloné est transcrit en ARNm, qui à son tour est traduit en la protéine codée. Par exemple, # X003bb; Les vecteurs de phage ont été construits de telle sorte que la jonction de l'ADN inséré est situé dans une région du vecteur qui est transcrite et traduite à un taux élevé. ADN clonée inséré à cette position est transcrit en ARNm dans toutes les cellules infectées par ce type de vecteur. Si l'ADN clone contient une séquence codant pour la protéine insérée dans le même cadre de lecture que la protéine vecteur, les cellules infectées produisent une protéine de fusion dans laquelle l'extrémité amino-terminale est codée par l'ADN du vecteur et le reste de la molécule par l'ADN clone ( Figure 7-21).
utilisation de # X003bb; clonage d'expression pour identifier un clone d'ADN sur la base de la liaison de la protéine codée à un anticorps spécifique. le # X003bb; vecteur gt11 a été conçu pour exprimer la protéine de E. coli # X003b2, à des niveaux élevés galactosidase. Le seul Eco RI (plus.)
Lorsque des filtres de nitrocellulose réplique sont préparées à partir d'une bibliothèque recombinante construite dans un # X003bb; vecteur d'expression. des protéines de fusion exprimées à partir de chaque clone individuel sont liés au filtre de nitrocellulose. Le filtre de réplique peut être criblée par des procédés capables de détecter des protéines de fusion spécifiques. Par exemple, un anticorps monoclonal spécifique pour une protéine d'intérêt peut être mis en incubation avec les filtres de réplique d'un # X003bb; banque d'expression d'ADNc. Si l'un des # X003bb; Les clones exprimant une protéine de fusion qui inclut la région de la protéine liée par cet anticorps monoclonal, des molécules d'anticorps se lient au filtre à la position de ce clone spécifique. Après lavage du filtre pour éliminer l'anticorps non lié, la position du clone spécifique est détectée par incubation avec un second anticorps marqué radioactivement qui reconnaît le premier anticorps, suivie d'une autoradiographie du filtre.
Dans ce procédé, appelé le clonage d'expression. toute molécule qui se lie à une protéine d'intérêt avec une grande affinité et spécificité peut être marqué et utilisé comme sonde pour identifier des clones exprimant la protéine d'interaction. Par exemple, le clonage d'expression est utile pour identifier des clones d'ADNc codant pour des protéines qui se lient à des séquences d'ADN spécifiques; beaucoup de ces protéines sont impliquées dans le contrôle de la transcription. Dans ce cas, une sonde d'ADN double brin synthétique marqué est mis en incubation avec les filtres de réplique préparées à partir d'une banque d'ADNc clone dans un # X003bb; vecteur d'expression. La liaison de l'ADN marqué par des protéines de fusion localise la position des clones désirés sur le filtre d'origine. Comme cela est décrit dans une autre section, d'autres types de vecteurs d'expression peuvent être utilisés pour produire de grandes quantités d'une protéine à partir d'un gène cloné.
L'électrophorèse sur gel Résout fragments d'ADN de différentes tailles
Une fois qu'un clone d'ADN spécifique a été isolé, l'ADN clone est séparé de l'ADN du vecteur par coupure avec l'enzyme de restriction utilisée pour former le plasmide recombinant. comme décrit précédemment. L'ADN de l'ADN et le vecteur cloné puis sont séparés par électrophorèse sur gel. une méthode puissante pour séparer les protéines en fonction de la taille (chapitre 3). L'électrophorèse sur gel est également utilisé pour séparer les molécules d'ADN et d'ARN par la taille et estimer la taille des molécules d'acide nucléique de longueur inconnue par comparaison avec la migration de molécules de longueur connue.
La séparation des fragments d'ADN de longueurs différentes par électrophorèse sur gel. On prépare un gel en versant un liquide contenant soit d'agarose ou d'acrylamide non polymérisé fondu entre deux plaques de verre à quelques millimètres de distance. Comme l'agarose se solidifie ou (plus).
Deux méthodes sont communes pour visualiser les bandes d'ADN ont été séparés sur un gel. Si l'ADN est non radiomarqué, le gel est incubé dans une solution contenant le colorant fluorescent éthidium:
Cette molécule plane se lie à l'ADN par intercalation entre les paires de bases. Les concentrés de liaison éthidium dans l'ADN et augmente également sa fluorescence intrinsèque. Par conséquent, lorsque le gel est illuminé avec de la lumière ultraviolette, les régions du gel contenant l'ADN fluorescence beaucoup plus vives que les régions du gel sans ADN (Figure 7-23a).
La visualisation des fragments de restriction séparés par électrophorèse sur gel. (A) Plusieurs clones de plasmide ont été digérés avec Eco RI et l'ADN digéré a été soumis à une électrophorèse sur gel d'agarose pour séparer les fragments clonés à partir du plasmide (plus).
ADN marqué radioactivement peut être visualisé par autoradiographie du gel. Dans ce cas, le gel est déposé sur une feuille de film photographique dans le noir, l'exposition du film au niveau des positions où l'ADN marqué est présent. Lorsque le film est développé, une image photographique de l'ADN est observée (Figure 7-23b). Radiomarqué bandes d'ADN peuvent également être détectées par la pose du gel contre un écran de phosphorimager, qui compte # X003b2; des particules libérées par des molécules marquées dans le gel. Les données obtenues sont stockées par un ordinateur et peut être converti en une image du gel qui ressemble beaucoup à un autoradiogramme.
Champ pulsé Electrophorèse Sépare De l'ADN Molécules
Lorsqu'un champ électrique est appliqué à de grandes molécules d'ADN dans un gel, les molécules migrent dans la direction du champ et aussi étirer la longueur. Si le courant est alors arrêté, les molécules commencent à # X0201c, détendez-vous # x0201d; en bobines aléatoires. Le temps nécessaire pour la relaxation est directement proportionnelle à la longueur d'une molécule. Le champ électrique est ensuite réappliquée à 90 # x000b0; ou 180 # x000b0; à la première direction. molécules plus détendent moins que les plus courtes pendant le temps le courant est éteint. Étant donné que les molécules doivent se détendre dans une bobine aléatoire avant de se déplacer dans une nouvelle direction, molécules plus longues commencent à se déplacer dans la direction imposée par le nouveau champ plus lentement que les plus courtes. l'alternance répétée de la direction du champ force progressivement grandes molécules d'ADN de différentes tailles de plus en plus espacées.
champ pulsé séparation électrophorétique de grosses molécules d'ADN. La piste 1 montre des molécules d'ADN individuelles; Chaque bande représente un chromosome de la levure S. cerevisiae. La piste 3 montre Not I fragments de restriction du chromosome de E. coli, qui sont (plus).
L'ADN purifié peut Molécules séquencer rapidement par deux méthodes
Pratiquement toutes les informations nécessaires à la croissance et le développement d'un organisme est codé dans l'ADN de son génome. La disponibilité des techniques pour produire et restriction d'ADN des fragments séparés quelques centaines de nucléotides conduit au développement de deux procédures pour déterminer la séquence nucléotidique exacte des segments d'ADN jusqu'à # X02248; 500 nucléotides. Ces méthodes de séquençage de l'ADN, ainsi que la technologie pour la construction d'une bibliothèque qui représente l'ensemble du génome d'un organisme, permettent de déterminer la séquence exacte de tout l'ADN de cet organisme.
Maxam-Gilbert Méthode
Dans les années 1970, A. M. Maxam et W. Gilbert mis au point la première méthode des fragments d'ADN de séquençage contenant jusqu'à # X02248; 500 nucléotides. Dans ce procédé, quatre échantillons d'un fragment de restriction de l'ADN marqué à l'extrémité sont chimiquement clivés à différents nucleotides spécifiques. Les sous-fragments résultants sont séparés par électrophorèse sur gel. et les fragments marqués sont détectés par autoradiographie. Comme le montre la figure 7-27. la séquence du fragment de restriction marquée à l'extrémité d'origine peut être déterminée directement à partir de électrophorétogrammes parallèles des quatre échantillons.
méthode de Maxam-Gilbert pour les fragments d'ADN de séquençage jusqu'à # X02248; 500 nucléotides. Le fragment double brin à séquencer est marqué à l'extrémité 5 # x02032; 32 se termine par P (voir Figure 7-20). L'étiquette (cercle rouge) est retiré de l'une des extrémités, et (plus).
Sanger (didésoxy) Méthode
Quelques années plus tard, F. Sanger et ses collègues ont développé une deuxième méthode de séquençage de l'ADN, qui est maintenant utilisé beaucoup plus fréquemment que la méthode Maxam-Gilbert. La méthode de Sanger est aussi appelé séquençage didésoxy parce qu'il implique l'utilisation de deux # x02032; 3 # x02032; triphosphates -dideoxynucleoside (ddNTP), qui manquent d'un 3 # x02032; -hydroxyle groupe (Figure 7-28). Dans ce procédé, l'ADN simple brin à séquencer sert de brin matrice pour la synthèse in vitro de l'ADN; un 5 # x02032 synthétique; oligodésoxynucléotide -end marqué est utilisé comme amorce.
Structures de ribonucléoside triphosphate (NTP), desoxyribonucléoside triphosphate (dNTP) et triphosphate didésoxyribonucléoside (ddNTP).
Comme le montre la figure 7-29. quatre réactions de polymérisation différents sont réalisés, chacun avec une faible concentration d'une des quatre ddNTP en plus des concentrations plus élevées des désoxynucléosides triphosphates (dNTP normaux). Dans chaque réaction, le ddNTP est incorporé de manière aléatoire aux positions du dNTP correspondant; une telle addition d'un ddNTP termine la polymérisation en raison de l'absence d'un 3 # x02032; hydroxyle empêche l'addition du nucléotide suivant. Le mélange de fragments à terminaison de chacune des quatre réactions est soumis à une électrophorèse sur gel de en parallèle; les fragments séparés sont détectés puis par autoradiographie. La séquence du brin matrice de l'ADN initial peut être lue directement à partir de l'autoradiogramme résultant (voir Figure 7-29c). Une fois que la séquence d'un fragment d'ADN clone particulier est déterminée, des amorces pour des fragments se chevauchant peuvent être synthétisés chimiquement sur la base de cette séquence. La séquence d'un long tronçon continu d'ADN peut ainsi être déterminée par séquençage individuellement les clones se chevauchant des fragments d'ADN qui le composent.
méthode de Sanger (didésoxy) pour les fragments d'ADN de séquençage. (A) Un seul brin de l'ADN à séquencer (ligne bleue) est hybridée à un 5 # x02032; amorce désoxyribonucléotide synthétique -fin marqué. L'amorce est allongée dans quatre mélanges réactionnels distincts (plus).