Die Sequenzanalyse in der Molekularbiologie umfasst die Identifizierung der Sequenz von Nukleotiden in einer Nukleinsäure oder von Aminosäuren in einem Peptid oder Protein. Sobald eine Probe erhalten wurde, können DNA- oder RNA-Sequenzen automatisch von Sequenziergeräten erzeugt und die Rohdaten auf dem Computer angezeigt werden. Die Interpretation dieser Ergebnisse erfordert jedoch bioinformatische Verarbeitung und fachliche Bewertung durch Menschen; automatisierte Auswertungsschritte erleichtern die Arbeit, ersetzen die Expertise aber nicht vollständig.
Grundprinzipien und Ablauf einer Sequenzanalyse
- Probennahme und Aufbereitung: Qualität und Reinheit der Ausgangsprobe (z. B. Blut, Gewebe, mikrobielles Material) sind entscheidend. Bei DNA/RNA folgt oft eine Reinigung und Fragmentierung.
- Library-Vorbereitung: An die Fragmente werden Adapter für die Sequenziermaschine angebracht; bei RNA-Analysen erfolgt zusätzlich eine Umwandlung in cDNA.
- Sequenzierung: Das eigentliche Auslesen der Nukleotid- oder Aminosäurefolge durch ein Gerät (siehe Methoden unten).
- Rohdatenverarbeitung: Basecalling, Qualitätskontrolle, Filterung und Korrektur von Fehlern.
- Analyse: Alignment gegen Referenzsequenzen, De-novo-Assemblierung, Variantenerkennung, Funktions- und Annotationsschritte.
- Interpretation: Biologische oder klinische Bewertung der Ergebnisse durch Expertinnen und Experten.
Hauptmethoden der Sequenzierung
- Sanger-Sequenzierung: Klassische Methode mit hoher Genauigkeit für einzelne Fragmente (z. B. einzelne Gene, Validierung von Varianten).
- Next-Generation Sequencing (NGS): Plattformen wie Illumina ermöglichen paralleles Sequenzieren von Millionen kurzer Fragmente; geeignet für ganze Genome, Exome oder RNA-Seq.
- Third-Generation/ Langlese-Verfahren: Technologien wie PacBio oder Oxford Nanopore liefern sehr lange Reads (einfachere Assemblierung, Erkennung struktureller Varianten), haben aber unterschiedliche Fehlerraten und Einsatzgebiete.
- Proteinsequenzierung: Direktsequenzierung von Proteinen ist selten; in der Proteomik werden meist Peptide mittels Massenspektrometrie (z. B. Tandem-MS) identifiziert. Historisch existiert die Edman-Abbau-Methode zur Aminosäuresequenzierung kürzerer Peptide.
Anwendungen
- Phylogenie und Taxonomie: Vergleich von Sequenzen zeigt Verwandtschaftsverhältnisse zwischen Organismen.
- Klinische Diagnostik: Erkennung von Krankheitserregern, Genmutationen in erblichen Erkrankungen, Krebsprofiling und Therapieentscheidungen.
- Transkriptom-Analyse (RNA-Seq): Bestimmung der Genexpressionsprofile unter verschiedenen Bedingungen.
- Metagenomik: Charakterisierung von mikrobiellen Gemeinschaften ohne Kultivierung.
- Forensik und Abstammungsforschung: Identifikation von Individuen bzw. Verwandtschaftsanalysen.
- Proteomik: Identifizierung von Proteinen, Post‑translationalen Modifikationen und deren Quantifizierung.
Datenanalyse und Interpretation
Sequenziergeräte liefern Rohdaten (z. B. FASTQ-Dateien), die in mehrstufigen Pipelines weiterverarbeitet werden. Typische Schritte sind Qualitätskontrolle (QC), Adapter-Entfernung, Alignment an eine Referenz oder De-novo-Assemblierung, Varianten‑/Mutationserkennung und funktionelle Annotation. Die Qualität der Ergebnisse hängt von read-Länge, Tiefe (Coverage), Fehlerrate und bioinformatischer Methodik ab. Ergebnisse, die klinisch relevant sind, werden häufig manuell überprüft und validiert.
Grenzen, Fehlerquellen und ethische Aspekte
- Fehlerquellen: Probenkontamination, unvollständige Bibliotheksvorbereitung, Sequenzierfehler und fehlerhafte Auswertungsparameter können zu falschen Ergebnissen führen.
- Technische Limitationen: Kurzread-NGS kann komplexe strukturelle Varianten schwieriger erfassen; Langlese-Methoden haben andere Fehlermuster.
- Datensicherheit und Datenschutz: Menschliche Genomdaten sind sensibel. Speicherung, Weitergabe und Analyse unterliegen ethischen und rechtlichen Anforderungen.
- Kosten und Ressourcen: Trotz sinkender Kosten erfordern umfangreiche Sequenzprojekte Rechenkapazität, Speicherplatz und Expertinnen/Experten.
Praktische Hinweise
- Achten Sie auf gute Probenqualität und korrekte Protokolle bei der Library-Vorbereitung.
- Wählen Sie die Sequenziermethode passend zur Fragestellung (z. B. Sanger für einzelne Fragmente, NGS für große Projekte, Long-Reads für komplexe Genome).
- Planen Sie Bioinformatik und Validierungsschritte bereits vor dem Sequenzieren ein.
- Berücksichtigen Sie ethische Vorgaben beim Umgang mit menschlichen Daten.
Insgesamt ist die Sequenzanalyse ein mächtiges Werkzeug der modernen Biologie und Medizin. Sie kombiniert Labortechnik, moderne Sequenzierplattformen und bioinformatische Auswertung, um aus biologischem Material verwertbare Informationen über Gene, Transkripte und Proteine zu gewinnen.

