تستخدم SAVANA خوارزمية التعلم الآلي لتحديد الاختلافات الهيكلية الخاصة بالسرطان ونسخ انحرافات الأرقام في بيانات تسلسل الحمض النووي طويلة القراءة. إن البنية المعقدة لجينومات السرطان تعني أن أدوات التحليل القياسية تعطي نتائج إيجابية كاذبة، مما يؤدي إلى تفسيرات سريرية خاطئة لبيولوجيا الورم. تعمل SAVANA على تقليل مثل هذه الأخطاء بشكل كبير. تقدم SAVANA تحليلًا جينيًا سريعًا وموثوقًا لتحليل العينات السريرية بشكل أفضل، وبالتالي توفير المعلومات اللازمة لتشخيص السرطان والتدخلات العلاجية.
تعمل تقنيات التسلسل طويل القراءة على تحليل الامتدادات الطويلة والمستمرة من الحمض النووي. هذه الأساليب لديها القدرة على تحسين قدرة الباحثين على اكتشاف التغيرات الجينية المعقدة في جينومات السرطان. ومع ذلك، فإن البنية المعقدة لجينومات السرطان تعني أن أدوات التحليل القياسية، بما في ذلك الأساليب الحالية التي تم تطويرها خصيصًا لتحليل بيانات التسلسل طويلة القراءة، غالبًا ما تكون قاصرة، مما يؤدي إلى نتائج إيجابية كاذبة وتفسيرات غير موثوقة للبيانات. يمكن لهذه النتائج المضللة أن تؤثر على فهمنا لكيفية تطور الأورام، والاستجابة للعلاج، وفي نهاية المطاف كيفية تشخيص المرضى وعلاجهم.
ولمواجهة هذا التحدي، طور الباحثون خوارزمية SAVANA الجديدة، والتي وصفوها مؤخرًا في مجلة Nature Methods. يستخدم SAVANA التعلم الآلي لتحديد المتغيرات الهيكلية بدقة - التعديلات الجينومية الكبيرة مثل عمليات الإدراج أو الحذف أو الازدواجية أو إعادة الترتيب - والانحرافات الناتجة في أرقام النسخ في جينومات السرطان - باستخدام بيانات التسلسل طويلة القراءة.
من المهم أن يكون لديك الأداة المناسبة لهذا المنصب. على سبيل المثال، يمكنك تناول الحساء بالشوكة، لكن النتيجة ليست فعالة مثل استخدام الملعقة. SAVANA، مثل الملعقة، مصممة خصيصًا لهذه المهمة ومصممة لتقديم نتائج موثوقة بكفاءة.
تم تطوير هذه الخوارزمية واختبارها عبر 99 عينة من الأورام البشرية من قبل باحثين في المعهد الأوروبي للمعلوماتية الحيوية (EMBL-EBI) التابع لـ EMBL ومختبر البحث والتطوير التابع لـ Genomics England، بالتعاون مع الشركاء السريريين في جامعة كوليدج لندن (UCL)، والمستشفى الملكي الوطني لجراحة العظام (RNOH)، ومعهد الطب الجزيئي جواتيلدو لوبو أنتونيس، ومستشفى بوسطن للأطفال.
"نظرًا لأن أدوات التحليل الأخرى لم يتم تطويرها لتأخذ في الاعتبار خصوصيات بيانات جينومات السرطان، فإنها غالبًا ما تلتقط نتائج إيجابية كاذبة يمكن أن تؤدي إلى تفسيرات سريرية وبيولوجية غير صحيحة". قال إيسيدرو كورتيس سيريانو، قائد المجموعة في EMBL-EBI. "سافانا تغير هذا. من خلال تدريب الخوارزمية مباشرة على بيانات التسلسل طويلة القراءة من عينات السرطان، أنشأنا طريقة جديدة يمكنها معرفة الفرق بين التغيرات الجينومية الحقيقية المرتبطة بالسرطان ومصنوعات التسلسل، وبالتالي تمكننا من توضيح العمليات الطفرية الكامنة وراء السرطان باستخدام التسلسل طويل القراءة بدقة غير مسبوقة.
"عندما قمنا بتطوير SAVANA، كان تركيزنا واضحًا: إنشاء أداة متطورة بما يكفي لتوصيف جينومات السرطان المعقدة ولكنها عملية بما يكفي للاستخدام السريري." أوضحت هيلاري إلريك، زميلة ما قبل الدكتوراه السابقة في EMBL-EBI وزميلة ما بعد الدكتوراه في معهد فرانسيس كريك.
"ونتيجة لذلك، يمكن لـ SAVANA التمييز بدقة بين المتغيرات الهيكلية الجسدية، وانحرافات عدد النسخ، ونقاء الورم، والصيغة الصبغية - وكلها عوامل أساسية لفهم بيولوجيا الورم وتوجيه قرارات العلاج السريري." وأضافت كارولين سوير، زميلة ما بعد الدكتوراه في EMBL-EBI.
إن تحليله السريع وتصحيح الأخطاء القوي يجعل من SAVANA مناسبًا تمامًا للاستخدام السريري.