Преди около седмица в npj Drug Discovery, издание на Nature, едно от най-престижните научни списания в света, излезе статия, която премина почти незабелязано покрай новините за AI. Без фанфари, без пресконференция, без Илон Мъск да туитва за нея. А може би е по-важна от повечето неща, за които сме чували през последните години.
Казва се MAMMAL. И ако работи така, както авторите твърдят, може да промени медицината фундаментално.
Защо правенето на лекарства е почти невъзможно
Представете си, че работите десет години по нещо. Харчите милиарди долари. И в края на краищата има 90% вероятност да сгрешите.
Точно толкова е провалът при разработката на нови лекарства. От момента, в който учените намерят обещаваща молекула, до момента, в който тя мине през клинични изпитвания и получи одобрение — девет от десет се проваляват. Не защото учените са некомпетентни. А защото тялото е невероятно сложна система и ние все още не я разбираме напълно.
За да разберете защо, трябва да знаете малко биология. Не много, но поне основите.
Всяко живо същество има ДНК. Това е нещо като строителен код — огромна инструкция за това как да функционира организмът. В тази инструкция има отделни секции, наречени гени. Всеки ген е рецепта за направата на конкретен протеин. А протеините са молекулярните машини, които вършат почти цялата работа в тялото — изпращат сигнали между клетките, изграждат тъкани, контролират имунната система, управляват клетъчното делене.
Когато нещо се обърка в тази верига — мутация в ДНК, неправилно активиран ген, дефектен протеин — може да се стигне до болест. Раковите клетки например често са резултат от мутация, която повреждат гена, контролиращ клетъчното делене. Клетката получава грешен сигнал: дели се, дели се, не спирай. Резултатът е тумор.
Логиката на лечението тогава е относително проста: намери виновния протеин и го блокирай. Като ключ и катинар — проектираш лекарство, което да се захване точно за него. Ако успееш, болестта спира.
Проблемът е, че тялото не е само един катинар. Има милиарди. И ключът, който блокира един, може случайно да отвори друг — с непредвидени и опасни последствия. Затова правенето на лекарства е толкова трудно: трябва да намериш молекула, достатъчно силна да спре болестта, достатъчно прецизна да не навреди на всичко останало, и достатъчно стабилна да работи в реалното човешко тяло.
Инструментите, с които разполагаме — и защо не стигат
Последните десетина години AI промени много неща в науката. Имаме модели, които четат ДНК последователности. Имаме AlphaFold от Google — система, получила Нобелова награда за химия, която може да предскаже как изглежда триизмерната структура на протеин. Имаме инструменти за анализ на химични съединения, за симулиране на клинични изпитвания, за разчитане на геномни данни.
Звучи внушително. И е такова. Но има един фундаментален проблем: всички тези инструменти са специалисти в своята тясна област и не разговарят помежду си.
Единият AI знае всичко за протеините, но нищо за гените. Другият разбира химията на малките молекули, но не и как те ще взаимодействат с имунната система. Третият анализира генна активност, но не може да я свърже с конкретно лекарство.
А болестта не се случва в отделни папки. Тя тече като река — от ДНК, през гените, към протеините, към клетките, към целия организъм. Ако гледаш само един участък от тази река, виждаш само парче от истината.
Представи си детектив, разследващ престъпление. Единият разполага само с пръстовите отпечатъци. Другият е видял само записа от охранителната камера. Третият е чел само аутопсионния доклад. Всяка улика е реална. Но никой от тях не вижда цялата картина — и случаят никога не се разкрива.
Какво направи IBM
Изследователите от IBM Research — екипи в Хайфа, Израел и Ню Йорк — решиха да направят точно обратното: да тренират един единствен AI модел на всичко едновременно.
Нарекоха го MAMMAL — Molecular Aligned Multi-Modal Architecture and Language. Претрениран е върху два милиарда примера от всички основни биологични бази данни в света — протеини, антитела, малки молекули, генна експресия. Не последователно, не по отделни модули, а всичко заедно, в общо пространство, където химията, генетиката и протеините се учат в контекст един на друг.
Техническото решение е елегантно: тъй като протеинова последователност изглежда съвсем различно от химична формула, а генна активност не прилича нито на едното, инженерите създадоха система с отделни речници за всеки домейн, но обща "стая", в която всичко се превежда и смесва. Резултатът е AI, който не просто знае факти за биологията, а разбира как различните й части се влияят взаимно.
Когато генералистът бие специалиста
Тук идва нещото, което накара учените да спрат и да се почешат по главата.
Имаше модел преди MAMMAL — казваше се MolFormer — трениран изключително и само върху химия. Милиард химични структури, нищо друго. Хиперспециалист. Логично би трябвало да е непобедим в химически задачи.
MAMMAL го победи.
Генералистът, разпръснал вниманието си между химия, гени и протеини, се оказа по-добър в предсказването на химично поведение от модела, който не е правил нищо друго. Защо? Защото малките молекули не съществуват изолирано — те взаимодействат с протеини, влияят върху генна активност, реагират на клетъчна среда. Ако разбираш само молекулата без контекста й, разбираш по-малко, отколкото си мислиш.
Аналогията е следната: представи си, че правиш вино. Можеш да изучиш гроздето изолирано — неговата захар, неговата киселинност, неговата структура. Или можеш да разбираш и почвата, и климата, и ферментационния процес, и взаимодействието с дъбовата бъчва. Вторият човек ще прави по-добро вино, дори ако технически знае "по-малко" за самото грозде.
Откритието, което обърна медицинската логика с главата надолу
Но истинският момент, за който трябва да се говори, е тестът с карфилзомиб.
Изследователите дават на MAMMAL четири лекарства, за които той не е виждал никаква информация по време на тренировката — напълно непознати молекули. Заедно с генетичните профили на над 800 вида ракови тумори — белодробен рак, рак на гърдата, дебелото черво и десетки други. И го молят да направи едно нещо: да нареди лекарствата от най-силно до най-слабо действие срещу тези тумори.
Карфилзомиб е класиран на първо място от всички четири. Най-потентното, твърди AI-ят, срещу по-голямата част от 805-те туморни типа.
Проблемът е, че онколозите знаят карфилзомиб много добре. Използва се от години — за лечение на рак на кръвта. Множествен миелом. И от десетилетия медицинската наука е категорична: срещу солидни тумори — тумори на белите дробове, гърдата, дебелото черво — лекарството е безполезно. Не работи. Никой сериозен лекар не би го предписал за тях.
MAMMAL казва обратното.
Изследователите правят реален лабораторен експеримент. Взимат физически ракови клетки. Тестват четирите лекарства. Измерват резултатите.
AI се оказва прав в 95% от случаите — наредждането на лекарствата по сила точно съвпада с лабораторния резултат. Не говорим за лечение на пациенти — говорим за ракови клетки в лаборатория. Но именно там всичко започва.
Какво означава това всъщност
Едно изследване, публикувано от авторите му, не е достатъчно. Науката изисква репликация — независими лаборатории да проверят същото. И IBM Research, колкото и уважавана институция да е, има интерес резултатите да изглеждат добре.
Но ако е вярно дори наполовина, последствията са огромни.
Имаме хиляди одобрени лекарства. Всяко от тях е преминало клинични изпитвания за конкретна болест. Но никой не е проверил систематично дали тези лекарства могат да работят срещу болести, за които никой не ги е мислел. Просто защото е невъзможно — тестването на всяко лекарство срещу всяка болест би изисквало стотици хиляди експерименти и десетилетия.
AI може да направи тези предсказания за часове. После учените могат да тестват само обещаващите. Вместо да разработвате ново лекарство от нулата — десет години и милиард долара — може би вече имате нужния инструмент в рафта на аптеката.
Освен това MAMMAL е проектиран да прави и обратното: не само да анализира съществуващи лекарства, но и да проектира напълно нови антитела от нулата. Да погледне генетичния профил на болест, да разбере кой протеин трябва да бъде блокиран, и да измисли молекулата, която ще го направи — по-добре от всеки предишен метод.
Диригентът
Ако трябва да опиша MAMMAL с една метафора, ще е тази.
Десетилетия наред науката е имала брилянтни музиканти — всеки перфектен в своя инструмент. Един знае всичко за химията. Друг — за протеините. Трети — за гените. Всеки свири отлично своята партия. Но никой не е чувал цялото произведение.
MAMMAL е първият диригент.
Не защото е по-умен от всеки отделен специалист. А защото е първият, който чете цялата партитура едновременно — и разбира как цигулката, виолончелото и пианото трябва да звучат заедно, за да се получи музика.
Статията е публично достъпна. Моделът е качен в интернет за безплатно ползване. Следващата стъпка е независимото научно потвърждение — и ако то дойде, може да сме в началото на нещо, за което ще говорим много дълго.
Коментари
Публикуване на коментар