← Back to News List

Algorithmus für maschinelles Lernen bringt Long-Read-Sequenzierung in die Klinik

ScienceDaily | Mai 29, 2025
News Cover

SAVANA verwendet einen Algorithmus für maschinelles Lernen, um krebsspezifische Strukturvariationen und Abweichungen in der Kopienzahl in lang gelesenen DNA-Sequenzierungsdaten zu identifizieren. Aufgrund der komplexen Struktur von Krebsgenomen liefern Standardanalysetools falsch positive Ergebnisse, was zu falschen klinischen Interpretationen der Tumorbiologie führt. SAVANA reduziert solche Fehler deutlich. SAVANA bietet eine schnelle und zuverlässige Genomanalyse, um klinische Proben besser zu analysieren und so Krebsdiagnosen und therapeutische Interventionen zu unterstützen.

Long-Read-Sequenzierungstechnologien analysieren lange, kontinuierliche DNA-Abschnitte. Diese Methoden haben das Potenzial, die Fähigkeit von Forschern zu verbessern, komplexe genetische Veränderungen in Krebsgenomen zu erkennen. Die komplexe Struktur von Krebsgenomen führt jedoch dazu, dass Standardanalysetools, einschließlich bestehender Methoden, die speziell für die Analyse von Long-Read-Sequenzierungsdaten entwickelt wurden, oft nicht ausreichen, was zu falsch positiven Ergebnissen und unzuverlässigen Interpretationen der Daten führt. Diese irreführenden Ergebnisse können unser Verständnis darüber beeinträchtigen, wie sich Tumore entwickeln, auf die Behandlung ansprechen und letztendlich wie Patienten diagnostiziert und behandelt werden. Um dieser Herausforderung zu begegnen, haben Forscher SAVANA entwickelt, einen neuen Algorithmus, den sie kürzlich in der Fachzeitschrift Nature Methods beschrieben haben. SAVANA nutzt maschinelles Lernen, um strukturelle Varianten – große genomische Veränderungen wie Insertionen, Deletionen, Duplikationen oder Umlagerungen – und die daraus resultierenden Abweichungen in der Kopienzahl in Krebsgenomen genau zu identifizieren – mithilfe von Long-Read-Sequenzierungsdaten. Es ist wichtig, das richtige Werkzeug für die jeweilige Aufgabe zu haben. Sie können beispielsweise Suppe mit einer Gabel essen, das Ergebnis ist jedoch nicht so effektiv wie mit einem Löffel. SAVANA ist wie ein Löffel auf die Aufgabe zugeschnitten und darauf ausgelegt, effizient und zuverlässig Ergebnisse zu liefern. Dieser Algorithmus wurde von Forschern des European Bioinformatics Institute (EMBL-EBI) des EMBL und des Forschungs- und Entwicklungslabors von Genomics England in Zusammenarbeit mit klinischen Partnern am University College London (UCL), dem Royal National Orthopaedic Hospital (RNOH), dem Instituto de Medicina Molecular João Lobo Antunes und dem Boston Children's Hospital an 99 menschlichen Tumorproben entwickelt und getestet. „Da andere Analysetools nicht dafür entwickelt wurden, die Besonderheiten der Krebsgenomikdaten zu berücksichtigen, erfassen sie oft falsch-positive Ergebnisse, die zu falschen klinischen und biologischen Interpretationen führen könnten“, sagt er. sagte Isidro Cortes-Ciriano, Gruppenleiter am EMBL-EBI. „SAVANA ändert das.“ Indem wir den Algorithmus direkt auf Long-Read-Sequenzierungsdaten aus Krebsproben trainierten, haben wir eine neue Methode entwickelt, die den Unterschied zwischen echten krebsbedingten genomischen Veränderungen und Sequenzierungsartefakten erkennen kann und es uns so ermöglicht, die Mutationsprozesse, die Krebs zugrunde liegen, mithilfe von Long-Read-Sequenzierung mit beispielloser Auflösung aufzuklären.“ „Als wir SAVANA entwickelten, war unser Fokus klar: ein Werkzeug zu schaffen, das anspruchsvoll genug ist, um komplexe Krebsgenome zu charakterisieren, aber praktisch genug für den klinischen Einsatz“, sagt er. erklärte Hillary Elrick, ehemalige Predoctoral Fellow am EMBL-EBI und Postdoctoral Fellow am Francis Crick Institute. „Dadurch kann SAVANA somatische Strukturvarianten, Aberrationen der Kopienzahl, Tumorreinheit und Ploidie genau unterscheiden – alles entscheidend für das Verständnis der Tumorbiologie und die Steuerung klinischer Behandlungsentscheidungen“, sagte er. fügte Carolin Sauer, Postdoktorandin am EMBL-EBI, hinzu. Aufgrund seiner schnellen Analyse und robusten Fehlerkorrektur ist SAVANA gut für den klinischen Einsatz geeignet.

This article was originally published by ScienceDaily. For more details, images, and references:

Read Full Original Article ↗