Біологія. 9 клас. Шаламов

§ 24. Генетичний код

Код — система умовних знаків для зберігання й обробки інформації

«Холмс уже кілька годин мовчки сидів, схилившись над хімічною пробіркою, де клекотіло якесь невимовно смердюче вариво. Голова його схилилася до грудей, і він нагадував мені чудернацького кістлявого птаха з тьмяно-сірими перами й чорним чубом». Так починається одне з оповідань Артура Конан Дойла — «Чоловічки в танці». У садибі Ридлінґ-Торп-Менор починають з’являтися дивні малюнки, на яких зображено вишикуваних у лінію чоловічків під час танцю. Ось приклад одного з таких малюнків.

Господар садиби звертається по допомогу до геніального детектива Шерлока Холмса. Той легко доходить висновку, що малюнки — це закодовані послання. Холмс береться за їх розшифрування, і виявляється, що кожна фігурка відповідає літері англійського алфавіту. Шерлок Холмс складає таблицю коду — таблицю відповідності між позами чоловічків і літерами.

Використавши цей код, можна розшифрувати, що в посланні написано: «приходь сюди терміново» (англ. «come here at once»)1. Цей код був розроблений ватажком чиказької мафії для того, щоб спілкуватися з підлеглими. Проте набагато цікавішу й складнішу роботу провели вчені для розгадування найважливішого коду в живій природі — генетичного коду. Але перш ніж перейти до розгляду цього феномену, дамо визначення поняття «код».

Код — це правило відповідності одному конкретному об’єкту чітко визначеної комбінації символів. Інакше кажучи, код — це правило, згідно з яким символи однієї системи (скажімо, літери) однозначно співвідносяться із символами іншої системи (скажімо, зображеннями чоловічків).

Генетичний код — кодування послідовності амінокислот у білках відповідно до послідовності нуклеотидів у нуклеїнових кислотах

Як ми вже згадували в попередньому параграфі, матрична РНК залучена до процесу біосинтезу білка. Саме вона містить інформацію про послідовність з’єднання амінокислотних залишків у ланцюжок білка. Цю інформацію вона отримала від молекули ДНК у процесі транскрипції. Але якщо у випадку транскрипції рибонуклеотиди мРНК потребують відповідності дезоксирибонуклеотидам згідно з принципом комплементарності, то для синтезу молекули білка клітині треба дібрати відповідно до нуклеотидів мРНК амінокислоти. Для цього має бути правило. Це правило й називається генетичним кодом.

1 В українському перекладі Володимира Панченка чоловічкам довелося виконувати ще й інші рухи, адже в нашій абетці більша кількість літер. Цікаво, який вигляд матиме цей код кхмерською мовою, у якій 72 літери?.

Негідник Аб Слені користувався кодом чиказької мафії для того, щоб приховати зміст своїх послань від стороннього ока. А клітина використовує генетичний код через необхідність, бо нуклеїнові кислоти та білки «розмовляють різними мовами»: нуклеїнові кислоти — мовою нуклеотидів, а білки — мовою амінокислот. Клітині доводиться перекладати з мови нуклеотидів на мову амінокислот приблизно так, як Шерлок Холмс перекладав із мови «чоловічків у танці» на англійську. Тут важлива одна деталь: фрази у вигляді чоловічків у танці також були записані англійською мовою, просто іншими символами. Можна сказати, що матрична РНК теж написана мовою білків, просто іншими символами — нуклеотидами. Неправильно розглядати переклад із мови нуклеїнових кислот на мову білків як переклад з англійської на українську.

Чиказьким бандитам довелося вигадати 27 поз, аби відобразити 27 літер англійського алфавіту. Перекладач Володимир Панченко вигадав додатково ще 6 поз, аби перекласти оповідання українською. Але клітина має тільки чотири нуклеотиди, аби закодувати 21 амінокислоту. Це нелегко, чи не так?

Проте цю проблему можна розв’язати, якщо добирати у відповідність амінокислоті комбінацію з нуклеотидів. Якщо кодувати амінокислоти двійками нуклеотидів, то вийде 4 х 4 = 16 комбінацій. Цього замало, щоб кодувати все різноманіття амінокислот (їх близько 20). Але якщо кодувати їх трійками, то вийде 4 х 4 х 4 = 64 комбінації, тобто цілком достатньо для кодування всіх амінокислот. І справді, для кодування амінокислот клітина використовує трійки нуклеотидів, так звані триплети. Таблиця 24.1 демонструє генетичний код клітини.

Таблиця 24.1. Таблиця генетичного коду (мРНК)

Нуклеотид

1-й

2-й

3-й

У

Ц

А

Г

У

Фенілаланін

Серин

Тирозин

Цистеїн

У

Фенілаланін

Серин

Тирозин

Цистеїн

Ц

Лейцин

Серин

Стоп-кодон

Стоп-кодон1

А

Лейцин

Серин

Стоп-кодон

Триптофан

Г

Ц

Лейцин

Пролін

Гістидин

Аргінін

У

Лейцин

Пролін

Гістидин

Аргінін

Ц

Лейцин

Пролін

Глутамін

Аргінін

А

Лейцин

Пролін

Глутамін

Аргінін

Г

А

Ізолейцин

Треонін

Аспарагін

Серин

У

Ізолейцин

Треонін

Аспарагін

Серин

Ц

Ізолейцин

Треонін

Лізин

Аргінін

А

Метіонін

Треонін

Лізин

Аргінін

Г

Г

Валін

Аланін

Аспарагінова кислота

Гліцин

У

Валін

Аланін

Аспарагінова кислота

Гліцин

Ц

Валін

Аланін

Глутамінова кислота

Гліцин

А

Валін

Аланін

Глутамінова кислота

Гліцин

Г

1 Цей триплет інколи використовується для кодування амінокислоти селеноцистеїну

Розглянувши цю таблицю, можна зробити такі висновки про властивості генетичного коду. По-перше, генетичний код триплетний, тобто трійка нуклеотидів кодує одну амінокислоту. По-друге, генетичний код надмірний: триплетів більше, ніж амінокислот. По-третє, генетичний код вироджений, тобто одна амінокислота може кодуватися більш ніж одним кодоном (кодоном називають комбінацію з трьох нуклеотидів — триплет). По-четверте, генетичний код однозначний: один кодон може кодувати тільки одну амінокислоту. По-п’яте, генетичний код містить розділові знаки: один «старт» і три «стопи», але при цьому код безперервний, тобто між кодонами немає пробілів.

На останній властивості варто зупинитися докладніше. Старт-кодон (АУГ) кодує також одну з амінокислот — метіонін. А отже, всі молекули білка починаються саме з метіоніну1. Проте часто метіонін розташований і всередині білкового ланцюга. Зазвичай як стартовий використовується перший кодон АУГ від початку матричної РНК, а решта розпізнаються просто як кодони метіоніну. Ще одна особливість: стоп-кодон УГА іноді кодує селеноцистеїн — ту саму 21-шу амінокислоту. Для того, щоб він був розпізнаний як кодон селеноцистеїну, а не «стоп», за ним має бути розташована особлива комбінація нуклеотидів.

Зауважимо ще одну властивість генетичного коду, на якій ми докладніше зупинимося в наступному параграфі. Генетичний код не перекривається: той самий нуклеотид не може входити до складу двох або трьох триплетів2.

Генетичний код універсальний

Генетичний код — це дуже жорстке правило. Його беззаперечно дотримується кожна клітина організму впродовж усього життя. Спочатку був розшифрований генетичний код кишкової палички, але потім з’ясувалося, що такий самий код мають і людина, і соняшник. Було постульовано універсальність генетичного коду: усі живі організми мають однаковий генетичний код. Виходить, що, виникнувши одного разу в спільного предка всіх живих організмів, генетичний код більше не змінювався.

Цей феномен має логічне пояснення: якщо у якогось організму виникає відхилення від генетичного коду, скажімо, триплет ААА починає замість лізину кодувати аргінін, то в усіх його білках майже в половині випадків замість лізину починає з’являтися аргінін (чому в половині випадків — спробуйте відповісти самі, уважно розглянувши таблицю генетичного коду). Це порушить структуру та функцію більшості з них і буде смертельним для істоти-винахідника.

Проте треба зробити кілька зауважень. По-перше, генетичний код виник не відразу. Найімовірніше, на ранніх етапах біологічної еволюції (можливо, ще до виникнення клітини) генетичний код еволюціонував. Зараз є всі підстави вважати, що спочатку генетичний код був дуплетним, тобто амінокислоти кодувалися двійками нуклеотидів (амінокислот було, таким чином, не більше 15), і лише потім став триплетним. Але можна впевнено сказати, що генетичний код останнього спільного предка всіх живих організмів був такий самий, як і в нас із вами.

По-друге, генетичний код усе ж змінюється, хоча й дуже повільно. Уперше відхилення від генетичного коду були виявлені в мітохондрій людини. У них триплет УГА (який у класичному коді зчитується як «стоп») кодує амінокислоту триптофан3, а триплет АУА (у класичному коді — ізолейцин) кодує метіонін. Потім було виявлено незначні відхилення в генетичному коді деяких бактерій і найпростіших, а також мітохондрій рослин і грибів. Однак ці зміни рідкісні та незначні, тому можна говорити про універсальність генетичного коду (чи майже універсальність або, як кажуть учені, квазіуніверсальність).

1 Часто він потім «зрізається» ферментами й у зрілій молекулі білка відсутній.

2 Це правило часто порушується у вірусів.

3 Це характерно для мітохондрій усіх досліджених організмів.

Як читати генетичний код?

Тепер, озброївшись даними таблиці генетичного коду, спробуємо розшифрувати послідовність білка, закодовану в нуклеотидній послідовності матричної РНК.

АУУАГУАУГГУГУУАУУЦЦЦАГУГГААГУГ

Спочатку визначимося, де початок цього послання: це не обов’язково перший нуклеотид! Нам потрібно знайти «старт» — кодон АУГ. Позначимо положення першого АУГ.

АУУАГУАУГГУГУУАУУЦЦЦАГУГГААГГЦ

Він кодує метіонін. Далі, якщо послідовно підставити амінокислоти з таблиці генетичного коду відповідно до триплетів нуклеотидів, то вийде ланцюжок: метіонін (АУГ) — валін (ГУГ) — лейцин (УУА) — фенілаланін (УУЦ) — пролін (ЦЦА) — валін (ГУГ) — глутамінова кислота (ГАА) — гліцин (ГГЦ).

Це тільки початок одного з амінокислотних ланцюжків білка. Такі ланцюги можуть містити сотні амінокислот, а синтез одного з них триває в клітині кілька хвилин. Як вона це робить, ми розглянемо в наступному параграфі.

Поміркуймо

Знайдіть одну правильну відповідь

1. Те, що існує 64 триплети нуклеотидів мРНК, а амінокислот усього лише 21, веде до

  • А виродженості генетичного коду
  • Б триплетності генетичного коду
  • В універсальності генетичного коду
  • Г однозначності генетичного коду
  • Д безперервності генетичного коду

2. Усі три стоп-кодони — це

  • А УАГ, УГА, УУУ
  • Б АУГ, УАГ, УГА
  • В УАА, АУГ, УГГ
  • Г УАА, УУУ, УГГ
  • Д УГА, УАГ, УАА

3. Якщо на мРНК міститься три триплети АУЦ, то білок

  • А міститиме три залишки ізолейцину
  • Б міститиме три залишки метіоніну
  • В міститиме три залишки ізолейцину й синтезуватиметься тричі
  • Г міститиме два залишки ізолейцину й один залишок метіоніну
  • Д міститиме три амінокислотні залишки

4. Послідовність нуклеотидів ААА-УГУ-АЦГ-ЦЦУ відповідає послідовності амінокислот

  • А аспарагін-цистеїн-треонін-пролін
  • Б лізин-фенілаланін-пролін-треонін
  • В лізин-цистеїн-пролін-треонін
  • Г лізин-цистеїн-треонін-пролін
  • Д аспарагін-триптофан-пролін-треонін

5. Метіонін і триптофан, на відміну від інших амінокислот, кодуються лише одним кодоном. Стосовно цих амінокислот НЕ реалізується така властивість генетичного коду, як

  • А виродженість
  • Б триплетність
  • В універсальність
  • Г однозначність
  • Д неперекривність

Сформулюйте відповідь кількома реченнями

6. Генетичний код забезпечує відповідність між послідовністю нуклеотидів та амінокислот білка. Схарактеризуйте основні ознаки цієї відповідності.

7. Стоп-кодони ще називають нонсенс-кодонами (від лат. non — немає та sensus — зміст). Чому в них така друга назва? Наскільки вона виправдана?

8. Що є недоліками триплетного коду? Чому живі організми не можуть використовувати дуплетний генетичний код?

9. Як пояснити те, що в бактерій, рослин і тварин ідентичний генетичний код? Чому генетичний код вважають квазіуніверсальним?

Знайди відповідь і наблизься до розуміння природи

11. Як розшифрування генетичного коду змінило сприйняття навколишнього світу? Які можливості та технології відкрило?

12. Для багатьох організмів характерне явище «перекосу за кодонами». При цьому з кількох триплетів, що кодують певну амінокислоту, деякі використовуються частіше, ніж інші. Як і для чого може використовуватися таке дивне явище?

Дізнайся самостійно та розкажи іншим

13. Виродженість і надмірність генетичного коду дають деякі переваги організмам порівняно із ситуацією, коли кількість амінокислот і триплетів збігалася б. У чому виявляються ці переваги? Чому, як правило, відрізняється третій нуклеотид кодону?

14. Френсіс Крік колись висунув гіпотезу «замороженого випадку» щодо того, що співвідношення триплетів і кодованих ними амінокислот є першою, випадково зафіксованою системою. Які властивості генетичного коду спростовують таку гіпотезу?

Доповнення VI

Денис Кузьмін

Закінчив Харківський фізико-математичний ліцей № 27 у 2002 році. Переможець всеукраїнських олімпіад і турнірів з біології. Навчався в Московському державному університеті. Захистив дисертацію на здобуття наукового ступеня кандидата біологічних наук в Інституті біоорганічної хімії. Зараз працює науковим співробітником цього ж інституту.

Як розшифрували генетичний код?

Структура й активність будь-якого білка в організмі залежать від послідовності амінокислот, що є в його молекулі. До складу білка входить близько 20 амінокислот. Джеймс Вотсон і Френсіс Крік 1953 року виявили, що ДНК складається з двох ланцюгів нуклеотидів, нітрогеновмісні основи яких (А, Т, Г, Ц) з’єднуються водневими зв’язками й утворюють спіраль. Було відомо, що ДНК відповідає за спадкові властивості, що вона у якийсь спосіб кодує білки в організмі. Залишалося незрозумілим, як структурні одиниці білка — амінокислоти — відповідають структурним одиницям ДНК, що кодують їх, — чотирьом нуклеотидам. Учені припустили, що існує якийсь спеціальний код.

Рис. VI.1. Схема дослідів, що допомогли розшифрувати генетичний код

Фізик Георгій Гамов 1954 року звернув увагу на те, що в такому разі одну амінокислоту мають кодувати щонайменше три нуклеотиди. Якби одному нуклеотидові відповідала одна амінокислота, то можна було б закодувати лише 4 амінокислоти. Якби два нуклеотиди відповідали за одну амінокислоту, то з чотирьох нуклеотидів можна було б скласти 42 = 16 дволітерних комбінацій і закодувати лише 16 амінокислот, а їх більше. Отже, код, як мінімум, трилітерний, тобто триплетний.

1961 року Френсіс Крік зі співробітниками досліджували мутації в бактеріофагів, обробивши їх мутагеном — акридином. За допомогою цих дослідів вони підтвердили, що кодони триплетні, між ними немає розділових знаків («ком»); гени, що кодують структуру білків, мають фіксований початок, заданий напрямок і фіксований кінець; існує невелика кількість некодувальних триплетів. Було спростоване раніше висунуте теоретичне припущення, що код є таким, що перекривається: код не перекривається, кожний нуклеотид є частиною одного кодону-триплету й займає в ньому певну позицію.

Генетичний код кишкової палички був розшифрований у безклітинній системі в 1960-х рр. Маршаллом Ніренбергом і Генріхом Маттеї. Клітинний екстракт бактерій містив усе необхідне для синтезу білка: рибосоми для збирання білка, амінокислоти, ферменти, джерело енергії. Дослідники додавали до системи суміш амінокислот і ланцюги нуклеотидів із заздалегідь відомою структурою (рис. VI.1). У кожній із 20-ти проб у суміші амінокислот була радіоактивно мічена лише одна. Так, наприклад, при додаванні поліуридилової кислоти (містить тільки урацил) як матриці РНК, утворювався амінокислотний ланцюжок, що містив радіоактивно мічений фенілаланін. За допомогою простого підбору було встановлено, що триплет УУУ кодує тільки фенілаланін. Але триплети нуклеотидів із заданою послідовністю отримувати поки що не вміли.

Американський біолог Гар Гобінд Корана до 1965 року навчився синтезувати короткі фрагменти РНК із заданою послідовністю — спочатку дуплети (динуклеотиди), а потім триплети (тринуклеотиди). Після цього почали запускати до системи триплети з відомою структурою. Наприклад, додавши триплети, що містять 2 У та 1 Г, встановили, що валін кодується кодоном ГУУ, а не УГУ та УУГ, і так далі. Так, послідовно, кодон за кодоном, було повністю розшифровано генетичний код кишкової палички.