Метагеноміка допомогла передбачити структури для 614 сімейств білків

Міжнародний колектив вчених з США і Саудівської Аравії за допомогою декількох обчислювальних методів і аналізу метагеномних послідовностей передбачив тривимірні структури 614 білкових сімейств, для яких цього раніше не вдавалося зробити експериментально. Дослідження опубліковано в .Ослідження структури білків залишається одним з найбільш затребуваних завдань в сучасній молекулярній біології, оскільки всі функції білків, параметри їх взаємодій один з одним та іншими речовинами так чи інакше визначаються саме просторовою структурою. Незважаючи на те, що первинну структуру (послідовність амінокислот у ланцюгу) дізнатися порівняно неважко, відновлення з неї третинної структури (як саме білок згорнуть у просторі) виявляється вкрай складним обчислювальним завданням. Експериментально для її вирішення застосовуються методи рентгеноструктурного аналізу або спектроскопія ядерного магнітного резонансу, проте далеко не у всіх випадках з їх допомогою вдається встановити структуру того чи іншого білка. Одним з підходів до вирішення цієї проблеми є гомологічне моделювання. Гомологами називають білки, що мають спільне походження і тому мають схожі фрагменти в амінокислотній послідовності. Два білки-гомологи зазвичай володіють схожою просторовою структурою за винятком невеликого числа відрізняються ділянок, які вже не так складно дозволити. Проблемою цього методу залишається той факт, що для багатьох білкових сімейств структура не відома, тому немає такого гомолога, з яким можна було б зрівнятися.


У тому випадку, коли про структуру цільового білка не відомо практично нічого, для її передбачення застосовуються обчислювальні методи, які намагаються хоча б вгадати третинну структуру на основі амінокислотної послідовності. Для цього необхідно врахувати всі взаємодії між усіма бічними амінокислотними радикалами, а потім знайти таку конфігурацію ланцюга, при якій енергія цих взаємодій мінімальна. Ця задача, якщо підходити до неї методом перебору, практично нерозв'язна навіть на сучасних суперкомп'ютерах за рахунок величезного числа варіантів укладання ланцюга. Однак це число можна значно зменшити, якщо врахувати багато локальних особливостей, характерних для більшості білкових ланцюгів. Наприклад, можна побудувати «карти», що вказують на те, які амінокислоти часто знаходяться поруч, а які - навпаки, прагнуть відштовхнутися.


Нещодавно дослідниками був запропонований один з найефективніших методів зменшення простору перебору укладання білкового ланцюга, який заснований на аналізі мутантних гомологічних послідовностей. Ідея методу полягає в тому, що досить часто випадкові мутації амінокислот у білковому ланцюгу супроводжуються виникненням інших, компенсаторних мутацій, які нівелюють негативний ефект вихідної мутації. Наприклад, поява в ланцюгу амінокислоти з великим боковим радикалом може компенсуватися зменшенням розміру радикала в сусідній області, що дозволяє зберегти загальне укладання ланцюга. Така еволюція в білковій послідовності може вказувати на те, що мутовані амінокислоти швидше за все контактують один з одним у просторі. Така інформація суттєво спрощує комп'ютерним системам перебір можливих варіантів структури.

Цей підхід вчені вже використовували для моделювання декількох білкових структур (1,2,3), проте досі він був обмежений послідовностями з відомих баз даних. Автори нового дослідження запропонували враховувати при комп'ютерному передбаченні структури невідомого білка результати метагеномних аналізів. Метагеноміка передбачає секвенування всієї виділеної з будь-якої живої спільноти ДНК (це можуть бути зразки морської води, вмісту кишківника тощо), що дозволяє дізнатися послідовності набагато більшого числа мікроорганізмів, ніж можна виростити в лабораторії. При аналізі білкових послідовностей такий підхід хороший ще й тим, що в «дикій» мікробній екосистемі одночасно присутня велика кількість близьких видів, що мають різні компенсаторні мутації.

Застосувавши новий метод до відомих амінокислотних послідовностей, вченим вдалося передбачити раніше не описані структури для білків з 614 сімейств, серед яких 206 були мембранними білками (їх структури біологам традиційно даються істотно важче). Багато з передбачених структур вдалося віднести до вже відомого типу третинної структури, проте для 137 білків пошук по найбільшій спеціалізованій базі Protein Data Bank не дав результатів, тобто вони являли собою нові типи згортки (нові фолди). Автори відзначають, що їх результати описують близько 12 відсотків від усіх білкових сімейств, для яких відома первинна, але не визначена третинна структура. Тим не менш, залишається ще велика кількість неописаних структур, які, як вважають вчені, вдасться передбачити на підставі метагеномних даних.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND