Достовірно красиво: як ми зробили 3D-модель SARS-CoV-2

Молекулярний біолог Валерія Архипова і CGI художник Олексій Солодовников створили атомарну модель вірусу SARS-CoV-2 і анімували її. На прохання вони розповідають, як багато сил і часу зайняла у них ця робота і які дані їм знадобилися, щоб побудувати зображення, яке одночасно було б достовірним і при цьому красивим.

Наш вірус, крім молекул оболонки (про те, чому вони саме такі, докладніше розповімо нижче), зібраний з білків трьох типів і олігосахаридних залишків на їх поверхні.


S-білки (бірюзові), вони ж спайк-білки або білки шипа - їх вірус використовує для того, щоб прикріплюватися до клітин. Якщо ці білки свою роботу роблять добре, то вірус пробирається в клітку і переходить до розмноження всередині неї.

M-білки (зелені) відповідають за контроль складання нових віріонів у клітинах-господарях. Цей білок являє собою своєрідний каркас, на якому організовуються в новий віріон інші структурні білки, а також допомагає «новонародженому» віріону вибратися з клітини.

Е-білки (червоні), взаємодіють з іншими структурними білками, а також, будучи трансмембранними білками, утворюють іонний канал, тим самим допомагаючи збірці нових віріонів в комплексі Гольджі клітини-господаря.

А олігосахаридні залишки (помаранчеві) працюють «камуфляжем» для вірусу. Вірус, прикриваючись ними, ховається від імунної системи організму - клітинам імунітету складніше дізнатися обвішаного цукрами прибульця і, відповідно, почати вироблення антитіл проти нього.

Інші моделі

Зображення вірусу, які можна знайти у відкритому доступі, поділяються на два типи: художні ілюстрації без опори на молекулярну біологію і роботи вчених, де в пріоритеті - наукова достовірність, а не естетична привабливість.

Ми подумали, що можемо поєднати ці підходи: дотриматися достовірності і одночасно зробити зображення насиченим. Показати і складність, і красу.


Будь-яка модель вірусу може складатися з двох великих частин: зовнішня частина і внутрішня, в яка захована всередині віріона. Ми зробили тільки зовнішню частину (як і багато інших), наш вірус порожній всередині. Завдання щодо моделювання «начинки» складніше - про це ми поговоримо в кінці статті.

Звичайно, працювали ми не в інформаційному вакуумі. Є й інші моделі - вони нас надихали і вчили. Нам хотілося зробити не гірше або додати щось своє. Ось на які моделі ми звернули увагу, перш ніж зайнятися своєю:

Це відео показало, що ми можемо зробити нашу модель кольоровою, естетично привабливою. Виділити кольором різні частини вірусу, що покращує сприйняття зображення. Плюс тут ми вперше побачили рух вірусу - на зображеннях, які ми бачили до цього, вірус завжди виглядав статично.

Дана робота показала, що ми можемо уточнити структуру самого вірусу, зробити її атомарною. Це багаторазово підвищило складність моделі, але і її достовірність також зросла.

Тут ми побачили, що кількість ключових білків у вірусу може бути дуже різною. Ми прийняли рішення зосередитися на уточненні їх кількості, віддаючи перевагу самим новим джерелам.

Ця робота починається з 2D-ілюстрації вченого і художника Девіда Гудселла (David S. Goodsell). Ми побачили, наскільки важливо придумати і витримати колірне рішення моделі вірусу. У підсумку, перш ніж ми дійшли до фіналу, було відкинуто 11 різних колірних рішень.

І остання робота - це модель студії Visual Science. Ця модель показала, що наше рішення зробити атомарну модель вірусу - абсолютно правильне. Також ми зрозуміли, що число ключових білків на поверхні вірусу може сильно варіюватися. Ми прийняли рішення зосередитися на уточненні їх кількості, віддаючи перевагу найновішим науковим джерелам. Також ми побачили нове велике завдання - зробити модель внутрішньої частини вірусу. Це завдання ми оцінюємо, як більш складне і не менш важливе.


Всі моделі вище в більшості своїй зроблені великими науковими колективами із залученням значних обчислювальних ресурсів (хмари, ферми, кластера). Нам було цікаво, що може зробити наша команда з двох чоловік.

Джерела даних

Частину білків на нашій ілюстрації взято з бази Protein DataBase. Кожен білок - це окремий файл, всередині якого зберігаються координати атомів білка, а також додаткова інформація: хімічний склад, амінокислотний, інтенсивність коливань атомів тощо.

Для різних білків у Protein Database використовують різні підходи до приміщення атомів досліджуваної молекули в систему координат. Так, наприклад, у прямокутних декартових координатах вісь Z поєднується з максимальним значенням моменту інерції (для горизонтального розташування фрагмента білка) або збігається з мінімальним значенням моменту інерції (у разі вертикального розташування). Інший варіант використовують для дослідження довгих спіралевидних молекул: при цьому вісь X відповідає середньому значенню моменту інерції еліпсоїду. Також широко використовуються сферичні, циліндричні та інші системи координат, які потім перераховуються в декартови при створенні PDB-файлу.

По суті, формат PDB - це текстовий файл з даними про кожен атом. Ось як записують, наприклад, структуру Е-білка 5X29:

А ось як ця ж інформація виглядає вже в Houdini - програмі, в якій дані з pdb-файлів перетворюються на 3D-модель, а потім на ілюстрацію.


Таким чином ми отримали геометричну, атомарно правильну структуру вузлів вірусу.

PDB - дуже цінне джерело інформації, без нього у нас би нічого не вийшло. Це величезна - 178 938 біологічних макромолекулярних структур на червень 2021 року - міжнародна база, яку поповнюють вчені з усього світу, викладаючи дані своїх досліджень у відкритий доступ.

Молекул оболонки нового коронавірусу в повному вигляді в бібліотеці PBD немає. Ми взяли звідти ліпіди, з яких вона може складатися, і побудували її самостійно. Вірус збирає свою оболонку з фрагментів мембрани клітини-господаря - цей суперкапсид сприяє підвищенню заразності вірусу. Суперкапсид нашого вірусу побудований з ліпідів мембрани клітини епітелію.

Далі нам потрібно було визначити кількість об'єктів, з яких складається вірус, і передбачити їх рух. У нашій моделі ми відобразили всі атоми, які є у вихідних даних, без спрощення. Ось що у нас вийшло спочатку:

Потім нам вдалося отримати консультацію експертів. Це дозволило підвищити точність нашої моделі. Ми надзвичайно вдячні Миколі Нікітіну з кафедри вірусології МДУ та Софії Борисевич з лабораторії хімічної фізики Уфимського Інституту хімії РАН. Разом з ними ми уточнили кількість S-білків, яка залежить від розміру віріону (сам він становить 50-200 нанометрів). За останніми даними їх не 90, як було в першій версії нашої ілюстрації, а менше - від 26 до 41-го. На нашій моделі S-білків 38.


Також великим сюрпризом для нас виявилася рухливість S-білка:

У його «ніжки» два коліна, що дає їй великий ступінь свободи на вигин. Крім нахилів, шип може ще й обертатися навколо поздовжньої осі. Така ступінь свободи побічно підтверджує нашу гіпотезу, що віріон не може бути щільно всіяний S-білками, як було в нашій ранній моделі - тоді вони заважали б один одному. А якщо рухливість S-білка порушена, то йому складніше зв'язатися з рецептором ACE2. Обмеження рухливості S-білків, до речі, один із способів запобігти зараженню клітин вірусами.

Крім цього, ми з'ясували, що M-білки розташовані на оболонці набагато щільніше - їх стало близько 1000 штук на віріон. А E-білків, як мінорної компоненти, навпаки, дуже мало. У нашому випадку їх 15 штук на віріон.

Оболонка вірусу на перший погляд здається дуже жорстким панцирем, чимось близьким за своїми властивостями корпусу підводної міни. Але це не так: її форма, по-перше, не є правильною сферою, а крім того вона ще й постійно змінюється. Але хоча властивості оболонки і можна уявити як «рідкий кристал», S-білки жорстко в ній закріплені, їх «ніжки» нерухомі.

Як моделювали

Ось як виглядає 3D-модель вірусу в Houdini:


Houdini використовується для створення спецефектів в кіно і рекламі: вибухи, дим, вода, вогонь, руйнування. Підійшов він і для наших завдань. Зовнішня частина вірусу нашої моделі - приблизно 25 000 000 атомів. Прорахунок зображення з матеріалами і світлом виконувався на GPU рендері RedShift. Порівняно з CPU (16-ядерний AMD проти 3080 NVIDIA), приріст за швидкістю близько семи разів. Модель вірусу може бути порахована в дуже великих дозволах. Рендер для фрагмента, на якому добре видно атоми, зроблений в 8000х8000 пікселів, що еквівалентно 1300х1300 міліметрам при друку в 150 точок на дюйм.

Вірус рендерився в чорно-білому вигляді. І далі вже по масках фарбувався вручну в програмі для композитингу і монтажу - DaVinci Resolve. Такий підхід дозволив підібрати колірну гаму без перерахунку моделі. Всього було випробувано близько десяти варіантів колірних рішень. Нижче - не розфарбована модель вірусу.

А ось фрагмент вірусу, S-білок - трохи ближче.

SARS-CoV-2 не схожий на монолітний статут. Ми зробили анімацію, щоб показати, як вірус «дихає» - щоб таким чином підкреслити, що це досить м'яка структура. Також ми намагалися показати рух S-білків в діапазоні кутів, описаних в останніх наукових публікаціях.

Разом

Моделюванням внутрішньої структури вірусу ми не займалися. Це близько 30 000 нуклеотидів РНК, N-білків та інших елементів. Ця робота складніша, ніж моделювання зовнішнього вигляду вірусу. Багато в чому це пов'язано з відсутністю моделей білків і тим, що для цього потрібно вирішити нетривіальну задачу укладання нитки РНК в порожнині сфери вірусу.

Підвищити точність нашої моделі можна із залученням молекулярної динаміки. Тоді оболонку можна буде зобразити точніше, як і сам рух атомів. Молекулярна динаміка дозволяє отримати дуже точне уявлення про рух і взаємодію частин вірусу як один з одним, так і з зовнішнім середовищем. Але МД вимагає спеціальних навичок роботи і дуже вимоглива до обчислювальних ресурсів. У нас немає необхідних потужностей, щоб робота була виконана за прийнятні терміни. Тому рухи атомів і частин вірусу показані умовно.

У відкритих джерелах ми не знайшли інформації про структуру М-білка. Тому і він теж показаний умовно. Розміри атомів усереднені.

Вся робота зайняла у нас приблизно півроку: вона велася паралельно з іншими проектами, після основної роботи, домашніх справ, з перервами на хвороби і свята і поправкою на різні часові пояси.

Ми отримали модель вірусу, зображення з ним і анімацію його умовного руху. Що далі, що з цим робити і яка від цього користь?

По-перше, це красиво. По-друге, ми показуємо складність об'єктів на мікроскопічному, атомарному рівні. Наша робота дозволяє цю складність побачити. І останнє - мабуть, найважливіше. Наш проект показує, що і одна людина може зробити дуже багато. А значить, може кожен з нас. Дерзайте!

Список літератури

1. Surya, W., Li, Y., Torres, J. Structural model of the SARS coronavirus E channel in LMPG micelles. // Biochim. Biophys. Acta - Biomembr. – 2018. – Vol. 1860. – N. 6. – P. 1309–1317. 2. Koppisetti, R. K., Fulcher, Y. G., Jurkevich, A., Prior, S. H., Xu, J., Lenoir, M., Overduin, M., Van Doren, S. R. Ambidextrous binding of cell and membrane bilayers by soluble matrix metalloproteinase-12. // Nat. Commun. – 2014. – Vol. 5. – P. 1–14. 3. Hillen, H. S., Kokic, G., Farnung, L., Dienemann, C., Tegunov, D., Cramer, P. Structure of replicating SARS-CoV-2 polymerase. // Nature. – 2020. – Vol. 584. – N. 7819. – P. 154–156. 4. Harris, L. J., Larson, S. B., Hasel, K. W., McPherson, A. Refined structure of an intact IgG2a monoclonal antibody. // Biochemistry. – 1997. – Vol. 36. – N. 7. – P. 1581–1597. 5. Noreng, S., Bharadwaj, A., Posert, R., Yoshioka, C., Baconguis, I. Structure of the human epithelial sodium channel by cryo-electron microscopy. // Elife. – 2018. – Vol. 7. – P. 1–23. 6. Almond, A., DeAngelis, P. L., Blundell, C. D. Hyaluronan: The Local Solution Conformation Determined by NMR and Computer Modeling is Close to a Contracted Left-handed 4-Fold Helix. // J. Mol. Biol. – 2006. – Vol. 358. – N. 5. – P. 1256–1269. 7. Hurdiss, D. L., Drulyte, I., Lang, Y., Shamorkina, T. M., Pronker, M. F., van Kuppeveld, F. J. M., Snijder, J., de Groot, R. J. Cryo-EM structure of coronavirus-HKU1 haemagglutinin esterase reveals architectural changes arising from prolonged circulation in humans. // Nat. Commun. – 2020. – Vol. 11. – N. 1. – P. 1–10. 8. Yan, Renhong, Yuanyuan Zhang, Yaning Li, Lu Xia, Yingying Guo, Q. Z. Structural basis for the recognition of SARS-CoV-2 by full-length human ACE2. // Science (80-. ) . – 2020. – Vol. 3. – N. 3. – P. 1–8. 9. Javitt, G., Khmelnitsky, L., Albert, L., Bigman, L. S., Elad, N., Morgenstern, D., Ilani, T., Levy, Y., Diskin, R., Fass, D. Assembly Mechanism of Mucin and von Willebrand Factor Polymers. // Cell. – 2020. – Vol. 183. – N. 3. – P. 717-729.e16. 10. Daniel Wrapp, Nianshuang Wang, Kizzmekia S. Corbett, Jory A. Goldsmith, Ching-Lin Hsieh, Olubukola Abiona, B. S. G., McLellan, and J. S. Cryo-EM structure of the 2019-nCoV spike in the prefusion conformation. // Science (80-. ) . – 2020. – Vol. 21. – N. 1. – P. 1–9. 11. Wang, M. Y., Zhao, R., Gao, L. J., Gao, X. F., Wang, D. P., Cao, J. M. SARS-CoV-2: Structure, Biology, and Structure-Based Therapeutics Development. // Front. Cell. Infect. Microbiol. – 2020. – Vol. 10. – N. November. – P. 1–17. 12. Yao, H., Song, Y., Chen, Y., Wu, N., Xu, J., Sun, C., Zhang, J., Weng, T., Zhang, Z., Wu, Z., Cheng, L., Shi, D., Lu, X., Lei, J., Crispin, M., Shi, Y., Li, L., Li, S. Molecular Architecture of the SARS-CoV-2 Virus. // Cell. – 2020. – Vol. 183. – N. 3. – P. 730-738.e13. 13. Oostra, M., de Haan, C. A. M., de Groot, R. J., Rottier, P. J. M. Glycosylation of the Severe Acute Respiratory Syndrome Coronavirus Triple-Spanning Membrane Proteins 3a and M. // J. Virol. – 2006. – Vol. 80. – N. 5. – P. 2326–2336. 14. B.W. Neuman, M. J. B. Supramolecular Architecture of the Coronavirus Particle. // Adv. Virus Res. – 2020. – Vol. 96. – P. 1–27. 15. Neuman, B. W., Kiss, G., Kunding, A. H., Bhella, D., Baksh, M. F., Connelly, S., Droese, B., Klaus, J. P., Makino, S., Sawicki, S. G., Siddell, S. G., Stamou, D. G., Wilson, I. A., Kuhn, P., Buchmeier, M. J. A structural analysis of M protein in coronavirus assembly and morphology. // J. Struct. Biol. – 2011. – Vol. 174. – N. 1. – P. 11–22. 16. Yu, A., Pak, A. J., He, P., Monje-Galvan, V., Casalino, L., Gaieb, Z., Dommer, A. C., Amaro, R. E., Voth, G. A. A multiscale coarse-grained model of the SARS-CoV-2 virion. // Biophys. J. – 2021. – Vol. 120. – N. 6. – P. 1097–1104. 17. Yao, H., Song, Y., Chen, Y., Wu, N., Xu, J., Sun, C., Zhang, J., Wen

COM_SPPAGEBUILDER_NO_ITEMS_FOUND