Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt

Sequenzanalyse erklärt: DNA-, RNA- und Proteinsequenzierung verständlich erläutert – Methoden, Interpretation und Anwendungen zur Aufklärung von Verwandtschaft und biologischen Zusammenhängen.

Autor: Leandro Alegsa Erstellt: 1. November 2021 Aktualisiert: 4. April 2026

Die Sequenzanalyse in der Molekularbiologie umfasst die Identifizierung der Sequenz von Nukleotiden in einer Nukleinsäure oder von Aminosäuren in einem Peptid oder Protein. Sobald eine Probe erhalten wurde, können DNA- oder RNA-Sequenzen automatisch von Sequenziergeräten erzeugt und die Rohdaten auf dem Computer angezeigt werden. Die Interpretation dieser Ergebnisse erfordert jedoch bioinformatische Verarbeitung und fachliche Bewertung durch Menschen; automatisierte Auswertungsschritte erleichtern die Arbeit, ersetzen die Expertise aber nicht vollständig.

Bildergalerie

3 Bilder

simple.wikipedia.org · Public domain

Grundprinzipien und Ablauf einer Sequenzanalyse

Probennahme und Aufbereitung: Qualität und Reinheit der Ausgangsprobe (z. B. Blut, Gewebe, mikrobielles Material) sind entscheidend. Bei DNA/RNA folgt oft eine Reinigung und Fragmentierung.
Library-Vorbereitung: An die Fragmente werden Adapter für die Sequenziermaschine angebracht; bei RNA-Analysen erfolgt zusätzlich eine Umwandlung in cDNA.
Sequenzierung: Das eigentliche Auslesen der Nukleotid- oder Aminosäurefolge durch ein Gerät (siehe Methoden unten).
Rohdatenverarbeitung: Basecalling, Qualitätskontrolle, Filterung und Korrektur von Fehlern.
Analyse: Alignment gegen Referenzsequenzen, De-novo-Assemblierung, Variantenerkennung, Funktions- und Annotationsschritte.
Interpretation: Biologische oder klinische Bewertung der Ergebnisse durch Expertinnen und Experten.

Hauptmethoden der Sequenzierung

Sanger-Sequenzierung: Klassische Methode mit hoher Genauigkeit für einzelne Fragmente (z. B. einzelne Gene, Validierung von Varianten).
Next-Generation Sequencing (NGS): Plattformen wie Illumina ermöglichen paralleles Sequenzieren von Millionen kurzer Fragmente; geeignet für ganze Genome, Exome oder RNA-Seq.
Third-Generation/ Langlese-Verfahren: Technologien wie PacBio oder Oxford Nanopore liefern sehr lange Reads (einfachere Assemblierung, Erkennung struktureller Varianten), haben aber unterschiedliche Fehlerraten und Einsatzgebiete.
Proteinsequenzierung: Direktsequenzierung von Proteinen ist selten; in der Proteomik werden meist Peptide mittels Massenspektrometrie (z. B. Tandem-MS) identifiziert. Historisch existiert die Edman-Abbau-Methode zur Aminosäuresequenzierung kürzerer Peptide.

Anwendungen

Phylogenie und Taxonomie: Vergleich von Sequenzen zeigt Verwandtschaftsverhältnisse zwischen Organismen.
Klinische Diagnostik: Erkennung von Krankheitserregern, Genmutationen in erblichen Erkrankungen, Krebsprofiling und Therapieentscheidungen.
Transkriptom-Analyse (RNA-Seq): Bestimmung der Genexpressionsprofile unter verschiedenen Bedingungen.
Metagenomik: Charakterisierung von mikrobiellen Gemeinschaften ohne Kultivierung.
Forensik und Abstammungsforschung: Identifikation von Individuen bzw. Verwandtschaftsanalysen.
Proteomik: Identifizierung von Proteinen, Post‑translationalen Modifikationen und deren Quantifizierung.

Datenanalyse und Interpretation

Sequenziergeräte liefern Rohdaten (z. B. FASTQ-Dateien), die in mehrstufigen Pipelines weiterverarbeitet werden. Typische Schritte sind Qualitätskontrolle (QC), Adapter-Entfernung, Alignment an eine Referenz oder De-novo-Assemblierung, Varianten‑/Mutationserkennung und funktionelle Annotation. Die Qualität der Ergebnisse hängt von read-Länge, Tiefe (Coverage), Fehlerrate und bioinformatischer Methodik ab. Ergebnisse, die klinisch relevant sind, werden häufig manuell überprüft und validiert.

Grenzen, Fehlerquellen und ethische Aspekte

Fehlerquellen: Probenkontamination, unvollständige Bibliotheksvorbereitung, Sequenzierfehler und fehlerhafte Auswertungsparameter können zu falschen Ergebnissen führen.
Technische Limitationen: Kurzread-NGS kann komplexe strukturelle Varianten schwieriger erfassen; Langlese-Methoden haben andere Fehlermuster.
Datensicherheit und Datenschutz: Menschliche Genomdaten sind sensibel. Speicherung, Weitergabe und Analyse unterliegen ethischen und rechtlichen Anforderungen.
Kosten und Ressourcen: Trotz sinkender Kosten erfordern umfangreiche Sequenzprojekte Rechenkapazität, Speicherplatz und Expertinnen/Experten.

Praktische Hinweise

Achten Sie auf gute Probenqualität und korrekte Protokolle bei der Library-Vorbereitung.
Wählen Sie die Sequenziermethode passend zur Fragestellung (z. B. Sanger für einzelne Fragmente, NGS für große Projekte, Long-Reads für komplexe Genome).
Planen Sie Bioinformatik und Validierungsschritte bereits vor dem Sequenzieren ein.
Berücksichtigen Sie ethische Vorgaben beim Umgang mit menschlichen Daten.

Insgesamt ist die Sequenzanalyse ein mächtiges Werkzeug der modernen Biologie und Medizin. Sie kombiniert Labortechnik, moderne Sequenzierplattformen und bioinformatische Auswertung, um aus biologischem Material verwertbare Informationen über Gene, Transkripte und Proteine zu gewinnen.

DNA-Basenpaar-Sequenz

Eine DNA-Sequenz ist die Abfolge von Nukleotiden in einem DNA-Molekül. Sie wird als eine Folge von Buchstaben geschrieben, die die Primärstruktur eines DNA-Moleküls oder -Strangs darstellen. Wenn sie funktionsfähig ist, trägt eine solche Sequenz Informationen für die Abfolge der Aminosäuren in einem Proteinmolekül. Die möglichen Buchstaben sind A, C, G und T, die für die vier Nukleotidbasen eines DNA-Strangs stehen - Adenin, Cytosin, Guanin, Thymin. Die Sequenzen sind lückenlos nebeneinander gedruckt, wie in der Sequenz AAAGTCTGAC.

Die Untersuchung von RNA und Proteinen ist komplexer. Die Gesamtstruktur der DNA ist einfach und vorhersehbar (Doppelhelix). Die Untersuchung von RNA und Proteinen muss eine Untersuchung ihrer 3-dimensionalen Struktur beinhalten, die variiert und ihre Funktionsweise beeinflusst. Bis zu einem gewissen Grad kann dies durch Computer unterstützt werden, muss aber in jedem Einzelfall überprüft werden.

Informationen zu Sequenzen werden in Datenbanken gehalten. Seit der Entwicklung der schnellen Produktion von Gen- und Proteinsequenzen in den 1990er Jahren nimmt die Rate der Aufnahme neuer Sequenzen in die Datenbanken ständig zu.

Partitur

Eine vollständige Genomanalyse wurde bei über 800 Arten und Stämmen durchgeführt. Die Arbeit wird von einer Maschine, dem DNA-Sequenzer, geleistet, der Lichtsignale von Fluorochromen analysiert, die an die Nukleotide gebunden sind. Diese Art von Arbeit wird allmählich kostengünstiger.

"Zurzeit [2009] gibt es mehr als 90 Wirbeltierarten mit ganzen Genomsequenzen, die fertig gestellt, in Bearbeitung oder im fortgeschrittenen Planungsstadium sind.

Grobe Gesamtzahlen

Bis Dezember 2012 ist die Analyse des gesamten Genoms von etwa 800 bis 900 lebenden Arten und Stämmen von Arten abgeschlossen. Die Zahlen sind annähernd und ändern sich.

Tiere: 111 Arten
Pflanzen: 53 Arten
Pilze: 81 Arten
Protisten: 50 Arten
Archaeen: 139 Arten und Stämme
Bakterien: ~4/500 Arten und Stämme

Menschliche DNA-Sequenz

Das menschliche Genom ist auf 23 Chromosomenpaaren im Zellkern und in der kleinen mitochondrialen DNA gespeichert. Über die Sequenzen der DNA, die sich auf unseren Chromosomen befinden, ist inzwischen eine Menge bekannt. Was die DNA tatsächlich macht, ist heute teilweise bekannt. Die Anwendung dieses Wissens in der Praxis hat gerade erst begonnen.

Das Human Genome Project (HGP) produzierte eine Referenzsequenz, die weltweit in Biologie und Medizin verwendet wird. Nature veröffentlichte den Bericht des öffentlich finanzierten Projekts, und Science veröffentlichte Celeras Arbeit. In diesen Papieren wurde beschrieben, wie der Entwurf der Sequenz erstellt wurde, und eine Analyse der Sequenz gegeben. Verbesserte Entwürfe wurden in den Jahren 2003 und 2005 angekündigt und füllten ≈92% der Sequenz aus.

Das neueste Projekt ENCODE untersucht die Art und Weise, wie die Gene kontrolliert werden.

Forensische Arbeit

Es ist nicht notwendig, ganze Genomsequenzen für forensische Arbeiten zu haben, wie z.B. die Identifizierung eines Verbrechers anhand von DNA-Spuren, die an einem Tatort hinterlassen wurden, oder für Vaterschaftsfälle. Gegenwärtig ist die Sequenzierung ganzer Genome noch sehr teuer, aber glücklicherweise stehen einfachere und billigere Methoden zur Verfügung.

Die Grundidee besteht darin, bestimmte Loci (Orte) im Genom zu betrachten, die zwischen Menschen sehr unterschiedlich sind. Etwa 10 bis 15 dieser Loci werden für eine Übereinstimmung benötigt, und die rechtlichen Details unterscheiden sich von Land zu Land. Eine Übereinstimmung zwischen einer Probe und einer verdächtigen Person macht es äußerst wahrscheinlich, dass die Person die Quelle der Probe war. Diese Beweise wären dann die Grundlage für die Strafverfolgung eines Verbrechens. Eine ähnliche Analyse würde zeigen, dass ein Mann sehr wahrscheinlich der Vater eines Kindes war. Dies ist wirklich eine moderne Art und Weise, das zu tun, was mit Blutgruppen gemacht wurde, bevor DNA-Details analysiert werden konnten. Die Methoden sind hauptsächlich durch die Arbeit von Alec Jeffreys entwickelt worden.

Die DNA jeder Person enthält zwei Allele eines bestimmten Gens oder "Markers": eines vom Vater und eines von der Mutter. Marker" sind Gene, die ausgewählt wurden, weil sie eine Reihe verschiedener Allele haben, die in der Bevölkerung häufig vorkommen. Die folgende Tabelle stammt aus einem kommerziellen DNA-Vaterschaftstestexperiment. Sie zeigt, wie die Verwandtschaft zwischen Eltern und Kind mit fünf Markern nachgewiesen wird:

DNA-Marker	Mutter	Kind	Angeblicher Vater
D21S11	28, 30	28, 31	29, 31
D7S820	9, 10	10, 11	11, 12
TH01	14, 15	14, 16	15, 16
D13S317	7, 8	7, 9	8, 9
D19S433	14, 16.2	14, 15	15, 17

Die Ergebnisse zeigen, dass die DNA des Kindes und die des mutmaßlichen Vaters bei diesen fünf Markern übereinstimmen. Die vollständigen Testergebnisse zeigten diese Korrelation bei 16 Markern zwischen dem Kind und dem getesteten Mann. Wenn ein Fall vor Gericht getestet wird, würde ein Gerichtsmediziner über die Wahrscheinlichkeit aussagen, dieses Ergebnis zufällig zu erhalten.

DNA-Tests in den USA

In allen 50 Bundesstaaten der Vereinigten Staaten gibt es einzelstaatliche Gesetze zur Erstellung von DNA-Profilen. Detaillierte Informationen zu den Datenbankgesetzen in den einzelnen Bundesstaaten finden Sie auf der Website der National Conference of State Legislatures.

Ein Chemiker der U.S. Customs and Border Protection liest ein DNA-Profil, um herauszufinden, woher eine Ware stammt.

Antike DNA

Alte DNA wurde aus einigen Quellen wiedergefunden. Der Rekord für das Überleben von DNA, die für die Sequenzanalyse geeignet ist, liegt bei 700.000 Jahren. Ein im Permafrost begrabenes Pferdeskelett hat Knochen mit etwas überlebender DNA geliefert. Die Sequenz war nur zu 70% vollständig, aber es reichte den Forschern aus, um zu sagen: "Es würde nicht wie ein Pferd aussehen, wie wir es kennen... aber wir würden erwarten, dass es ein einfüßiges Pferd ist". Zum Vergleich hatten die Forscher Zugang zu DNA-Sequenzen von modernen Pferden, Eseln und Przewalskis Pferd.

Autor

AlegsaOnline.com Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt Leandro Alegsa

URL: https://de.alegsaonline.com/art/88955

Diesen Artikel richtig zitieren

APA

Alegsa, L. (4. April 2026). Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt. AlegsaOnline.com. https://de.alegsaonline.com/art/88955

MLA

Alegsa, Leandro. “Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt.” AlegsaOnline.com, 4. April 2026, https://de.alegsaonline.com/art/88955.

Chicago

Alegsa, Leandro. “Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt.” AlegsaOnline.com. Aktualisiert 4. April 2026. https://de.alegsaonline.com/art/88955.

BibTeX

@misc{alegsaonline_88955,
  author = {Alegsa, Leandro},
  title = {Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt},
  year = {2026},
  howpublished = {AlegsaOnline.com},
  url = {https://de.alegsaonline.com/art/88955},
  note = {Aktualisiert: 4. April 2026; Language: de}
}

TXT

Leandro Alegsa. “Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt.” AlegsaOnline.com. Aktualisiert: 4. April 2026. https://de.alegsaonline.com/art/88955

Quellen

intlgenome.org : intlgenome.org/viewDatabase.cfm
ncbi.nlm.nih.gov : "Comparative biology of aging"
doi.org : 10.1093/gerona/gln060
pubmed.ncbi.nlm.nih.gov : 19223603
ncbi.nlm.nih.gov : "Entrez Genome Database Search"
nature.com : "Initial sequencing and analysis of the human genome"
doi.org : 10.1038/35057062
pubmed.ncbi.nlm.nih.gov : 11237011
sciencemag.org : "The sequence of the human genome"
ui.adsabs.harvard.edu : 2001Sci...291.1304V
doi.org : 10.1126/science.1058040
pubmed.ncbi.nlm.nih.gov : 11181995
nature.com : nature.com/articles/489046a?error=cookies_not_supported&code=d4894f7c-6c0e-44a7-aa48-3d32…
bbc.co.uk : bbc.co.uk/news/health-19202141

Sequenzanalyse (Molekularbiologie): DNA-, RNA- und Proteinsequenzierung erklärt

Bildergalerie

Grundprinzipien und Ablauf einer Sequenzanalyse

Hauptmethoden der Sequenzierung

Anwendungen

Datenanalyse und Interpretation

Grenzen, Fehlerquellen und ethische Aspekte

Praktische Hinweise

DNA-Basenpaar-Sequenz

Partitur

Grobe Gesamtzahlen

Menschliche DNA-Sequenz

Forensische Arbeit

DNA-Tests in den USA

Antike DNA

Verwandte Seiten

Verwandte Artikel

Autor

Bildergalerie

Grundprinzipien und Ablauf einer Sequenzanalyse

Hauptmethoden der Sequenzierung

Anwendungen

Datenanalyse und Interpretation

Grenzen, Fehlerquellen und ethische Aspekte

Praktische Hinweise

DNA-Basenpaar-Sequenz

Partitur

Grobe Gesamtzahlen

Menschliche DNA-Sequenz

Forensische Arbeit

DNA-Tests in den USA

Antike DNA

Verwandte Seiten

Verwandte Artikel

Autor

Teilen