Kod genetyczny: opis, charakterystyka, historia badań. Biosynteza białek i kwasów nukleinowych

Wykład 5. Kod genetyczny

Definicja pojęcia

Kod genetyczny to system zapisu informacji o sekwencji aminokwasów w białkach na podstawie sekwencji nukleotydów w DNA.

Ponieważ DNA nie bierze bezpośredniego udziału w syntezie białek, kod jest napisany w języku RNA. RNA zawiera uracyl zamiast tyminy.

Właściwości kodu genetycznego

1. Potrójny

Każdy aminokwas jest kodowany przez sekwencję 3 nukleotydów.

Definicja: triplet lub kodon to sekwencja trzech nukleotydów kodujących jeden aminokwas.

Kod nie może być monopletowy, ponieważ 4 (liczba różnych nukleotydów w DNA) jest mniejsza niż 20. Kodu nie można dublować, ponieważ 16 (liczba kombinacji i permutacji 4 nukleotydów po 2) jest mniejsza niż 20. Kod może być trójkowy, ponieważ 64 (liczba kombinacji i permutacji od 4 do 3) jest większa niż 20.

2. Degeneracja.

Wszystkie aminokwasy, z wyjątkiem metioniny i tryptofanu, są kodowane przez więcej niż jedną trójkę:

2 AK za 1 trójkę = 2.

9 AK, po 2 trójki = 18.

1 AK 3 trójki = 3.

5 AK z 4 trójek = 20.

3 AK z 6 trójek = 18.

W sumie 61 trójek koduje 20 aminokwasów.

3. Obecność międzygenicznych znaków interpunkcyjnych.

Definicja:

Gen - odcinek DNA kodujący jeden łańcuch polipeptydowy lub jedną cząsteczkę tRNA, RRNA lubsRNA.

GenytRNA, rRNA, sRNAbiałka nie są kodowane.

Na końcu każdego genu kodującego polipeptyd znajduje się co najmniej jeden z 3 tripletów kodujących kodony stop RNA, czyli sygnały stop. W mRNA mają one następującą postać: UAA, UAG, UGA . Kończą (kończą) transmisję.

Konwencjonalnie kodon należy również do znaków interpunkcyjnych SIERPIEŃ - pierwszy po sekwencji lidera. (Patrz Wykład 8) Pełni funkcję dużej litery. W tej pozycji koduje formylometioninę (u prokariotów).

4. Jednoznaczność.

Każdy triplet koduje tylko jeden aminokwas lub jest terminatorem translacji.

Wyjątkiem jest kodon SIERPIEŃ . U prokariotów na pierwszej pozycji (duża litera) koduje formylometioninę, a na każdej innej pozycji koduje metioninę.

5. Zwartość, czyli brak wewnątrzgenowych znaków interpunkcyjnych.
W genie każdy nukleotyd jest częścią znaczącego kodonu.

W 1961 roku Seymour Benzer i Francis Crick eksperymentalnie udowodnili potrójną naturę kodu i jego zwartość.

Istota doświadczenia: Mutacja „+” - insercja jednego nukleotydu. Mutacja „-” – utrata jednego nukleotydu. Pojedyncza mutacja „+” lub „-” na początku genu psuje cały gen. Podwójna mutacja „+” lub „-” również psuje cały gen.

Potrójna mutacja „+” lub „-” na początku genu psuje tylko jego część. Poczwórna mutacja „+” lub „-” ponownie psuje cały gen.

Eksperyment to potwierdza Kod jest transkrybowany i wewnątrz genu nie ma żadnych znaków interpunkcyjnych. Doświadczenie przeprowadzono na dwóch sąsiednich genach fagów i dodatkowo wykazano, że obecność znaków interpunkcyjnych pomiędzy genami.

6. Wszechstronność.

Kod genetyczny jest taki sam dla wszystkich stworzeń żyjących na Ziemi.

W 1979 roku otwarto Burrell ideał kod ludzkich mitochondriów.

Definicja:

„Idealny” to kod genetyczny, w którym spełniona jest zasada degeneracji kodu quasi-dubletowego: Jeżeli w dwóch trójkach pierwsze dwa nukleotydy pokrywają się, a trzeci nukleotyd należy do tej samej klasy (oba są purynami lub oba są pirymidynami) , wówczas te triplety kodują ten sam aminokwas .

W kodzie uniwersalnym istnieją dwa wyjątki od tej reguły. Obydwa odchylenia od idealnego kodu w uniwersalnym odnoszą się do podstawowych punktów: początku i końca syntezy białek:

Kodon

uniwersalny

kod

Kody mitochondrialne

Kręgowce

Bezkręgowce

Drożdże

Rośliny

ZATRZYMYWAĆ SIĘ

ZATRZYMYWAĆ SIĘ

Z UA

AGA

ZATRZYMYWAĆ SIĘ

ZATRZYMYWAĆ SIĘ

230 podstawień nie zmienia klasy kodowanego aminokwasu. na rozrywalność.

W 1956 roku Georgiy Gamow zaproponował wariant nakładającego się kodu. Zgodnie z kodem Gamowa każdy nukleotyd, począwszy od trzeciego w genie, jest częścią 3 kodonów. Po rozszyfrowaniu kodu genetycznego okazało się, że nie nakłada się on na siebie, tj. Każdy nukleotyd jest częścią tylko jednego kodonu.

Zalety nakładającego się kodu genetycznego: zwartość, mniejsza zależność struktury białka od insercji lub delecji nukleotydu.

Wada: struktura białka jest w dużym stopniu zależna od wymiany nukleotydów i ograniczeń nałożonych na sąsiadów.

W 1976 roku zsekwencjonowano DNA faga φX174. Ma jednoniciowy kolisty DNA składający się z 5375 nukleotydów. Wiadomo było, że fag koduje 9 białek. W przypadku 6 z nich zidentyfikowano geny zlokalizowane jeden po drugim.

Okazało się, że zachodzi nakładanie się. Gen E znajduje się w całości w obrębie genu D . Jego kodon start wynika z przesunięcia ramki odczytu o jeden nukleotyd. Gen J zaczyna się tam, gdzie kończy się gen D . Kodon startowy genu J pokrywa się z kodonem stop genu D w wyniku przesunięcia dwóch nukleotydów. Konstrukcja ta nazywana jest „przesunięciem ramki odczytu” ze względu na liczbę nukleotydów, a nie wielokrotność trzech. Do tej pory nakładanie się pokazano tylko w przypadku kilku fagów.

Pojemność informacyjna DNA

Na Ziemi żyje 6 miliardów ludzi. Informacje dziedziczne na ich temat
zamknięty w 6x10 9 plemnikach. Według różnych szacunków człowiek ma od 30 do 50 lat
tysiąc genów. Wszyscy ludzie mają ~30x10 13 genów lub 30x10 16 par zasad, które tworzą 10 17 kodonów. Przeciętna strona książki zawiera 25x10 2 znaków. DNA plemnika 6x10 9 zawiera informację o objętości równej w przybliżeniu

4x10 13 stron książki. Strony te zajęłyby przestrzeń 6 budynków NSU. 6x10 9 plemników zajmuje pół naparstka. Ich DNA zajmuje mniej niż jedną czwartą naparstka.

Kod genetyczny to sposób kodowania sekwencji aminokwasów w cząsteczce białka przy użyciu sekwencji nukleotydów w cząsteczce kwasu nukleinowego. Właściwości kodu genetycznego wynikają z cech tego kodowania.

Każdy aminokwas białkowy jest dopasowany do trzech kolejnych nukleotydów kwasu nukleinowego - tryplet, Lub kodon. Każdy nukleotyd może zawierać jedną z czterech zasad azotowych. W RNA tak adenina(A), uracyl(U), guanina(G), cytozyna(C). Łącząc zasady azotowe (w tym przypadku zawierające je nukleotydy) na różne sposoby, można uzyskać wiele różnych trójek: AAA, GAU, UCC, GCA, AUC itp. Całkowita liczba możliwych kombinacji wynosi 64, tj. 4 3 .

Białka organizmów żywych zawierają około 20 aminokwasów. Gdyby natura „zaplanowała” kodowanie każdego aminokwasu nie trzema, ale dwoma nukleotydami, wówczas różnorodność takich par nie byłaby wystarczająca, ponieważ byłoby ich tylko 16, tj. 4 2.

Zatem, główną właściwością kodu genetycznego jest jego potrójność. Każdy aminokwas jest kodowany przez triplet nukleotydów.

Ponieważ istnieje znacznie więcej możliwych różnych trójek niż aminokwasy stosowane w cząsteczkach biologicznych, w żywej przyrodzie zrealizowano następującą właściwość: nadmierność kod genetyczny. Wiele aminokwasów zaczęto kodować nie przez jeden kodon, ale przez kilka. Na przykład aminokwas glicyna jest kodowany przez cztery różne kodony: GGU, GGC, GGA, GGG. Redundancja jest również nazywana degeneracja.

Zależność pomiędzy aminokwasami i kodonami pokazano w tabelach. Na przykład te:

W odniesieniu do nukleotydów kod genetyczny ma następującą właściwość: jednoznaczność(Lub specyficzność): każdy kodon odpowiada tylko jednemu aminokwasowi. Na przykład kodon GGU może kodować tylko glicynę i żaden inny aminokwas.

Ponownie. Redundancja oznacza, że ​​kilka trójek może kodować ten sam aminokwas. Specyficzność – każdy specyficzny kodon może kodować tylko jeden aminokwas.

W kodzie genetycznym nie ma specjalnych znaków interpunkcyjnych (z wyjątkiem kodonów stop, które wskazują koniec syntezy polipeptydu). Funkcję znaków interpunkcyjnych pełnią same trójki - koniec jednej oznacza, że ​​następna zacznie się kolejna. Oznacza to następujące dwie właściwości kodu genetycznego: ciągłość I nie nakładające się. Ciągłość odnosi się do czytania trójek bezpośrednio po sobie. Brak nakładania się oznacza, że ​​każdy nukleotyd może być częścią tylko jednej trójki. Zatem pierwszy nukleotyd następnego tripletu zawsze następuje po trzecim nukleotydzie poprzedniego tripletu. Kodon nie może zaczynać się od drugiego lub trzeciego nukleotydu poprzedniego kodonu. Innymi słowy, kod nie nakłada się.

Kod genetyczny ma tę właściwość wszechstronność. To samo dotyczy wszystkich organizmów na Ziemi, co wskazuje na jedność pochodzenia życia. Istnieją od tego bardzo rzadkie wyjątki. Na przykład niektóre trojaczki w mitochondriach i chloroplastach kodują aminokwasy inne niż ich zwykłe aminokwasy. Może to sugerować, że u zarania życia istniały nieco inne odmiany kodu genetycznego.

Wreszcie kod genetyczny tak ma odporność na hałas, co jest konsekwencją jego własności jako redundancji. Mutacje punktowe, które czasami występują w DNA, zwykle skutkują zastąpieniem jednej zasady azotowej inną. To zmienia trójkę. Na przykład było to AAA, ale po mutacji stało się AAG. Jednakże takie zmiany nie zawsze prowadzą do zmiany aminokwasu w syntetyzowanym polipeptydzie, ponieważ obie trójki, ze względu na właściwość redundancji kodu genetycznego, mogą odpowiadać jednemu aminokwasowi. Biorąc pod uwagę, że mutacje są często szkodliwe, przydatna jest właściwość odporności na szum.

Wcześniej podkreślaliśmy, że nukleotydy mają ważną cechę dla powstawania życia na Ziemi - w obecności jednego łańcucha polinukleotydowego w roztworze proces tworzenia drugiego (równoległego) łańcucha następuje samoistnie w oparciu o komplementarne połączenie powiązanych ze sobą nukleotydów . Niezbędnym warunkiem realizacji tego typu reakcji jest jednakowa liczba nukleotydów w obu łańcuchach oraz ich powinowactwo chemiczne. Jednak podczas syntezy białek, kiedy do struktury białka wprowadzana jest informacja z mRNA, nie można mówić o przestrzeganiu zasady komplementarności. Wynika to z faktu, że w mRNA i w syntetyzowanym białku różni się nie tylko liczba monomerów, ale także, co szczególnie ważne, nie ma między nimi podobieństwa strukturalnego (nukleotydy z jednej strony, aminokwasy z drugiej ). Oczywiste jest, że w tym przypadku istnieje potrzeba stworzenia nowej zasady dokładnego przekładania informacji z polinukleotydu na strukturę polipeptydu. W ewolucji powstała taka zasada, a jej podstawą był kod genetyczny.

Kod genetyczny to system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydów w DNA lub RNA, tworząc kodony odpowiadające aminokwasom w białku.

Kod genetyczny ma kilka właściwości.

    Potrójność.

    Degeneracja lub redundancja.

    Jednoznaczność.

    Biegunowość.

    Nie nakładające się.

    Ścisłość.

    Wszechstronność.

Należy zaznaczyć, że niektórzy autorzy proponują także inne właściwości kodu związane z charakterystyką chemiczną nukleotydów zawartych w kodzie czy częstotliwością występowania poszczególnych aminokwasów w białkach organizmu itp. Właściwości te wynikają jednak z właściwości wymienionych powyżej, dlatego rozważymy je tam.

A. Potrójność. Kod genetyczny, podobnie jak wiele skomplikowanych systemów, ma najmniejszą jednostkę strukturalną i najmniejszą funkcjonalną. Trójka jest najmniejszą jednostką strukturalną kodu genetycznego. Składa się z trzech nukleotydów. Kodon jest najmniejszą jednostką funkcjonalną kodu genetycznego. Zwykle trójki mRNA nazywane są kodonami. W kodzie genetycznym kodon pełni kilka funkcji. Po pierwsze, jego główną funkcją jest kodowanie pojedynczego aminokwasu. Po drugie, kodon może nie kodować aminokwasu, ale w tym przypadku pełni inną funkcję (patrz poniżej). Jak widać z definicji, trójka jest pojęciem charakteryzującym podstawowy jednostka strukturalna kod genetyczny (trzy nukleotydy). Kodon – charakteryzuje elementarna jednostka semantyczna genom - trzy nukleotydy decydują o przyłączeniu jednego aminokwasu do łańcucha polipeptydowego.

Elementarną jednostkę strukturalną najpierw rozszyfrowano teoretycznie, a następnie jej istnienie potwierdzono eksperymentalnie. Rzeczywiście, 20 aminokwasów nie może być kodowanych za pomocą jednego lub dwóch nukleotydów, ponieważ tych ostatnich jest tylko 4. Trzy z czterech nukleotydów dają 4 3 = 64 warianty, co przekracza liczbę aminokwasów dostępnych w organizmach żywych (patrz tabela 1).

Kombinacje 64 nukleotydów przedstawione w tabeli mają dwie cechy. Po pierwsze, z 64 wariantów tripletów tylko 61 to kodony kodujące dowolny aminokwas; nazywane są one kodony zmysłowe. Trzy trójki nie kodują

Tabela 1.

Kodony informacyjnego RNA i odpowiadające im aminokwasy

FUNDACJA KODONOWA

Nonsens

Nonsens

Nonsens

Met

Wał

aminokwasy a są sygnałami stopu wskazującymi koniec translacji. Istnieją trzy takie trojaczki - UAA, UAG, UGA, nazywane są także „bezsensownymi” (kodonami nonsensownymi). W wyniku mutacji, która jest związana z zastąpieniem jednego nukleotydu w triplecie innym, z kodonu sensownego może powstać kodon nonsensowny. Ten typ mutacji nazywa się bezsensowna mutacja. Jeżeli taki sygnał stopu powstanie wewnątrz genu (w jego części informacyjnej), to podczas syntezy białka w tym miejscu proces będzie stale przerywany – syntetyzowana będzie jedynie pierwsza (przed sygnałem stop) część białka. Osoba z tą patologią odczuje brak białka i doświadczy objawów związanych z tym niedoborem. Na przykład tego rodzaju mutację zidentyfikowano w genie kodującym łańcuch beta hemoglobiny. Syntetyzowany jest skrócony, nieaktywny łańcuch hemoglobiny, który szybko ulega zniszczeniu. W rezultacie powstaje cząsteczka hemoglobiny pozbawiona łańcucha beta. Oczywiste jest, że jest mało prawdopodobne, aby taka cząsteczka w pełni spełniła swoje obowiązki. Występuje poważna choroba, która rozwija się jako niedokrwistość hemolityczna (talasemia beta-zero, od greckiego słowa „Thalas” – Morze Śródziemne, gdzie po raz pierwszy odkryto tę chorobę).

Mechanizm działania kodonów stop różni się od mechanizmu działania kodonów sensownych. Wynika to z faktu, że dla wszystkich kodonów kodujących aminokwasy znaleziono odpowiadające im tRNA. Nie znaleziono tRNA dla kodonów nonsensownych. W związku z tym tRNA nie bierze udziału w procesie zatrzymywania syntezy białek.

KodonSIERPIEŃ (czasami GUG u bakterii) nie tylko kodują aminokwasy metioninę i walinę, ale są takżeinicjator transmisji .

B. Degeneracja lub redundancja.

61 z 64 trójek koduje 20 aminokwasów. Ten trzykrotny nadmiar liczby trójek nad liczbą aminokwasów sugeruje, że w przekazywaniu informacji można zastosować dwie opcje kodowania. Po pierwsze, nie wszystkie 64 kodony mogą być zaangażowane w kodowanie 20 aminokwasów, ale tylko 20, a po drugie, aminokwasy mogą być kodowane przez kilka kodonów. Badania wykazały, że natura skorzystała z tej drugiej opcji.

Jego preferencje są oczywiste. Jeżeli z 64 wariantów trójek tylko 20 było zaangażowanych w kodowanie aminokwasów, wówczas 44 trójki (z 64) pozostałyby niekodujące, tj. bezsensowne (bezsensowne kodony). Już wcześniej wskazywaliśmy, jak niebezpieczne dla życia komórki jest przekształcenie w wyniku mutacji tripletu kodującego w kodon nonsensowny – znacząco zakłóca to normalne funkcjonowanie polimerazy RNA, ostatecznie prowadząc do rozwoju chorób. Obecnie trzy kodony w naszym genomie to nonsens, ale teraz wyobraźmy sobie, co by się stało, gdyby liczba kodonów nonsensownych wzrosła około 15 razy. Jest oczywiste, że w takiej sytuacji przejście kodonów normalnych do kodonów nonsensownych będzie nieporównywalnie wyższe.

Kod, w którym jeden aminokwas jest kodowany przez kilka trójek, nazywa się zdegenerowanym lub zbędnym. Prawie każdy aminokwas ma kilka kodonów. Zatem aminokwas leucyna może być kodowany przez sześć trójek - UUA, UUG, TSUU, TsUC, TsUA, TsUG. Walina jest kodowana przez cztery trójki, fenyloalanina przez dwie i tylko tryptofan i metionina kodowane przez jeden kodon. Właściwość związana z zapisywaniem tej samej informacji za pomocą różnych symboli nazywa się degeneracja.

Liczba kodonów przypisanych do jednego aminokwasu dobrze koreluje z częstotliwością występowania tego aminokwasu w białkach.

I najprawdopodobniej nie jest to przypadkowe. Im większa częstotliwość występowania aminokwasu w białku, im częściej kodon tego aminokwasu jest reprezentowany w genomie, tym większe jest prawdopodobieństwo jego uszkodzenia przez czynniki mutagenne. Dlatego jasne jest, że zmutowany kodon ma większą szansę na kodowanie tego samego aminokwasu, jeśli jest wysoce zdegenerowany. Z tej perspektywy degeneracja kodu genetycznego jest mechanizmem chroniącym ludzki genom przed uszkodzeniami.

Należy zauważyć, że termin „degeneracja” jest używany w genetyce molekularnej w innym znaczeniu. Zatem większość informacji w kodonie zawarta jest w pierwszych dwóch nukleotydach; zasada na trzeciej pozycji kodonu okazuje się mało istotna. Zjawisko to nazywa się „degeneracją trzeciej podstawy”. Ta ostatnia cecha minimalizuje wpływ mutacji. Wiadomo na przykład, że główną funkcją czerwonych krwinek jest transport tlenu z płuc do tkanek i dwutlenku węgla z tkanek do płuc. Funkcję tę pełni barwnik oddechowy – hemoglobina, który wypełnia całą cytoplazmę erytrocytu. Składa się z części białkowej – globiny, która jest kodowana przez odpowiedni gen. Oprócz białka cząsteczka hemoglobiny zawiera hem, który zawiera żelazo. Mutacje w genach globiny prowadzą do pojawienia się różnych wariantów hemoglobiny. Najczęściej mutacje są związane z zastąpienie jednego nukleotydu innym i pojawienie się nowego kodonu w genie, który może kodować nowy aminokwas w łańcuchu polipeptydowym hemoglobiny. W triplecie w wyniku mutacji można zastąpić dowolny nukleotyd - pierwszy, drugi lub trzeci. Znanych jest kilkaset mutacji wpływających na integralność genów globiny. W pobliżu 400 z których są związane z zastąpieniem pojedynczych nukleotydów w genie i odpowiadającym zastąpieniem aminokwasów w polipeptydzie. Tylko z tych 100 zamienniki prowadzą do niestabilności hemoglobiny i różnego rodzaju chorób od łagodnych do bardzo ciężkich. 300 (około 64%) mutacji substytucyjnych nie wpływa na funkcję hemoglobiny i nie prowadzi do patologii. Jedną z przyczyn tego jest wspomniana powyżej „degeneracja trzeciej zasady”, gdy zastąpienie trzeciego nukleotydu w triplecie kodującym serynę, leucynę, prolinę, argininę i niektóre inne aminokwasy prowadzi do pojawienia się kodonu synonimicznego kodujące ten sam aminokwas. Taka mutacja nie będzie objawiać się fenotypowo. Natomiast jakakolwiek wymiana pierwszego lub drugiego nukleotydu w trójce w 100% przypadków prowadzi do pojawienia się nowego wariantu hemoglobiny. Ale nawet w tym przypadku mogą nie wystąpić poważne zaburzenia fenotypowe. Powodem tego jest zastąpienie aminokwasu w hemoglobinie innym, podobnym do pierwszego pod względem właściwości fizykochemicznych. Na przykład, jeśli aminokwas o właściwościach hydrofilowych zostanie zastąpiony innym aminokwasem, ale o tych samych właściwościach.

Hemoglobina składa się z grupy żelaza porfirynowego hemu (do którego przyłączone są cząsteczki tlenu i dwutlenku węgla) oraz białka - globiny. Hemoglobina u dorosłych (HbA) zawiera dwa identyczne-łańcuchy i dwa-więzy. Cząsteczka-łańcuch zawiera 141 reszt aminokwasowych,-łańcuch - 146,- I-łańcuchy różnią się wieloma resztami aminokwasowymi. Sekwencja aminokwasowa każdego łańcucha globiny jest kodowana przez jego własny gen. Kodowanie genów-łańcuch znajduje się na krótkim ramieniu chromosomu 16,-gen - w krótkim ramieniu chromosomu 11. Substytucja w kodzie genu-łańcuch hemoglobiny pierwszego lub drugiego nukleotydu prawie zawsze prowadzi do pojawienia się nowych aminokwasów w białku, zakłócenia funkcji hemoglobiny i poważnych konsekwencji dla pacjenta. Przykładowo zastąpienie „C” w jednej z trójek CAU (histydyna) przez „Y” doprowadzi do pojawienia się nowej trójki UAU, kodującej inny aminokwas – tyrozynę. Fenotypowo przejawi się to ciężką chorobą. podobna zamiana w pozycji 63-łańcuch polipeptydu histydynowego do tyrozyny doprowadzi do destabilizacji hemoglobiny. Rozwija się choroba methemoglobinemia. Zastąpienie w wyniku mutacji kwasu glutaminowego waliną na 6 pozycji-łańcuch jest przyczyną najcięższej choroby - anemii sierpowatokrwinkowej. Nie kontynuujmy smutnej listy. Zauważmy tylko, że przy wymianie dwóch pierwszych nukleotydów może pojawić się aminokwas o właściwościach fizykochemicznych podobnych do poprzedniego. Zatem zastąpienie drugiego nukleotydu w jednej z trójek kodujących kwas glutaminowy (GAA) w-łańcuch z „U” prowadzi do pojawienia się nowego tripletu (GUA), kodującego walinę, a zastąpienie pierwszego nukleotydu przez „A” tworzy triplet AAA, kodujący aminokwas lizynę. Kwas glutaminowy i lizyna mają podobne właściwości fizykochemiczne - oba są hydrofilowe. Walina jest aminokwasem hydrofobowym. Dlatego zastąpienie hydrofilowego kwasu glutaminowego hydrofobową waliną znacząco zmienia właściwości hemoglobiny, co ostatecznie prowadzi do rozwoju anemii sierpowatokrwinkowej, natomiast zastąpienie hydrofilowego kwasu glutaminowego hydrofilową lizyną w mniejszym stopniu zmienia funkcję hemoglobiny – u pacjentów rozwija się postać łagodna anemii. W wyniku zamiany trzeciej zasady, nowa trójka może kodować te same aminokwasy, co poprzednia. Przykładowo, jeśli w triplecie CAC uracyl został zastąpiony cytozyną i pojawił się triplet CAC, to u człowieka praktycznie nie zostaną wykryte żadne zmiany fenotypowe. Jest to zrozumiałe, ponieważ obie trójki kodują ten sam aminokwas – histydynę.

Podsumowując, należy podkreślić, że degeneracja kodu genetycznego i degeneracja trzeciej zasady z ogólnego biologicznego punktu widzenia to mechanizmy ochronne nieodłącznie związane z ewolucją w unikalnej strukturze DNA i RNA.

V. Jednoznaczność.

Każda trójka (z wyjątkiem nonsensu) koduje tylko jeden aminokwas. Zatem w kierunku kodon - aminokwas kod genetyczny jest jednoznaczny, w kierunku aminokwas - kodon jest niejednoznaczny (zdegenerowany).

Niedwuznaczny

Kodon aminokwasu

Zdegenerowany

I w tym przypadku potrzeba jednoznaczności w kodzie genetycznym jest oczywista. W innej opcji, podczas translacji tego samego kodonu, do łańcucha białkowego zostaną wstawione różne aminokwasy, w wyniku czego powstaną białka o różnych strukturach pierwszorzędowych i różnych funkcjach. Metabolizm komórkowy przestawiłby się na tryb działania „jeden gen – kilka polipeptydów”. Jest oczywiste, że w takiej sytuacji funkcja regulacyjna genów zostałaby całkowicie utracona.

g. Polaryzacja

Odczyt informacji z DNA i mRNA następuje tylko w jednym kierunku. Polaryzacja jest ważna przy definiowaniu struktur wyższego rzędu (wtórnych, trzeciorzędnych itp.). Wcześniej mówiliśmy o tym, jak struktury niższego rzędu determinują struktury wyższego rzędu. Struktura trzeciorzędowa i struktury wyższego rzędu w białkach powstają, gdy tylko zsyntetyzowany łańcuch RNA opuszcza cząsteczkę DNA lub łańcuch polipeptydowy opuszcza rybosom. Podczas gdy wolny koniec RNA lub polipeptydu uzyskuje strukturę trzeciorzędową, drugi koniec łańcucha jest w dalszym ciągu syntetyzowany na DNA (w przypadku transkrypcji RNA) lub rybosomie (w przypadku transkrypcji polipeptydu).

Dlatego jednokierunkowy proces odczytywania informacji (podczas syntezy RNA i białka) jest niezbędny nie tylko do ustalenia sekwencji nukleotydów czy aminokwasów w syntetyzowanej substancji, ale także do ścisłego określenia drugorzędowej, trzeciorzędowej itp. Struktury.

d. Brak nakładania się.

Kod może się nakładać lub nie. Większość organizmów ma nienakładający się kod. W niektórych fagach można znaleźć nakładający się kod.

Istotą kodu niezachodzącego na siebie jest to, że nukleotyd jednego kodonu nie może być jednocześnie nukleotydem innego kodonu. Gdyby kody nakładały się, wówczas sekwencja siedmiu nukleotydów (GCUGCUG) mogłaby kodować nie dwa aminokwasy (alanina-alanina) (ryc. 33, A) jak w przypadku kodu niezachodzącego na siebie, ale trzy (jeśli jest jeden wspólny nukleotyd) (ryc. 33, B) lub pięć (jeśli wspólne są dwa nukleotydy) (patrz ryc. 33, C). W dwóch ostatnich przypadkach mutacja dowolnego nukleotydu doprowadziłaby do naruszenia sekwencji dwóch, trzech itd. aminokwasy.

Ustalono jednak, że mutacja jednego nukleotydu zawsze zakłóca włączenie jednego aminokwasu do polipeptydu. Jest to istotny argument świadczący o tym, że kod się nie nakłada.

Wyjaśnijmy to na rysunku 34. Pogrubione linie pokazują trójki kodujące aminokwasy w przypadku kodu nienakładającego się i nakładającego się. Eksperymenty wyraźnie wykazały, że kod genetyczny nie nakłada się. Nie wchodząc w szczegóły eksperymentu, zauważamy, że jeśli zastąpisz trzeci nukleotyd w sekwencji nukleotydów (patrz ryc. 34)U (oznaczone gwiazdką) na inną rzecz:

1. W przypadku niezachodzącego na siebie kodu białko kontrolowane przez tę sekwencję będzie miało substytucję jednego (pierwszego) aminokwasu (oznaczonego gwiazdkami).

2. W przypadku nakładającego się kodu w opcji A podstawienie nastąpi w dwóch (pierwszym i drugim) aminokwasach (oznaczonych gwiazdkami). W opcji B zastąpienie dotyczyłoby trzech aminokwasów (oznaczonych gwiazdkami).

Jednakże liczne eksperymenty wykazały, że w przypadku przerwania jednego nukleotydu w DNA, zaburzenie w białku zawsze dotyczy tylko jednego aminokwasu, co jest typowe dla kodu niezachodzącego na siebie.

GZUGZUG GZUGZUG GZUGZUG

GCU GCU GCU UGC GCU GCU GCU UGC GCU GCU GCU

*** *** *** *** *** ***

Alanin - Alanin Ala - Cis - Ley Ala - Ley - Ley - Ala - Ley

A B C

Kod nienakładający się Kod nakładający się

Ryż. 34. Schemat wyjaśniający obecność nienakładającego się na siebie kodu w genomie (objaśnienie w tekście).

Nienakładanie się kodu genetycznego wiąże się z jeszcze jedną właściwością – odczytywanie informacji rozpoczyna się od pewnego momentu – sygnału inicjującego. Takim sygnałem inicjacji w mRNA jest kodon kodujący metioninę AUG.

Należy zauważyć, że dana osoba nadal ma niewielką liczbę genów, które odbiegają od ogólnej zasady i nakładają się.

e. Zwartość.

Pomiędzy kodonami nie ma znaków interpunkcyjnych. Inaczej mówiąc, trojaczki nie są od siebie oddzielone np. jednym nic nie znaczącym nukleotydem. Eksperymentalnie udowodniono brak „znaków interpunkcyjnych” w kodzie genetycznym.

I. Wszechstronność.

Kod jest taki sam dla wszystkich organizmów żyjących na Ziemi. Bezpośredni dowód uniwersalności kodu genetycznego uzyskano poprzez porównanie sekwencji DNA z odpowiadającymi im sekwencjami białek. Okazało się, że wszystkie genomy bakteryjne i eukariotyczne korzystają z tych samych zestawów wartości kodowych. Są wyjątki, ale nie jest ich wiele.

Pierwsze wyjątki od uniwersalności kodu genetycznego znaleziono w mitochondriach niektórych gatunków zwierząt. Dotyczyło to kodonu terminatora UGA, który brzmi tak samo jak kodon UGG, kodujący aminokwas tryptofan. Stwierdzono także inne, rzadsze odchylenia od uniwersalności.

MZ. Kod genetyczny to system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydowych w DNA lub RNA tworzących kodony,

odpowiadające aminokwasom w białku.Kod genetyczny ma kilka właściwości.

Stosowane są te same nukleotydy, z wyjątkiem nukleotydu zawierającego tyminę, który jest zastępowany podobnym nukleotydem zawierającym uracyl, który jest oznaczony literą (w literaturze rosyjskojęzycznej). W cząsteczkach DNA i RNA nukleotydy układają się w łańcuchy i w ten sposób uzyskuje się sekwencje liter genetycznych.

Białka prawie wszystkich żywych organizmów zbudowane są z zaledwie 20 rodzajów aminokwasów. Aminokwasy te nazywane są kanonicznymi. Każde białko to łańcuch lub kilka łańcuchów aminokwasów połączonych w ściśle określoną sekwencję. Sekwencja ta determinuje strukturę białka, a co za tym idzie, wszystkie jego właściwości biologiczne.

Jednak już na początku lat 60. XX w. nowe dane ujawniły niespójność hipotezy „kodu bez przecinków”. Następnie eksperymenty wykazały, że kodony, uważane przez Cricka za bezsensowne, mogą prowokować syntezę białek in vitro i do 1965 roku ustalono znaczenie wszystkich 64 trójek. Okazało się, że niektóre kodony są po prostu zbędne, czyli cała seria aminokwasów jest kodowana przez dwie, cztery, a nawet sześć trójek.

Nieruchomości

Tabele zgodności między kodonami mRNA i aminokwasami

Kod genetyczny wspólny dla większości pro- i eukariontów. Tabela pokazuje wszystkie 64 kodony i odpowiadające im aminokwasy. Kolejność zasad przebiega od końca 5” do końca 3” mRNA.

Standardowy kod genetyczny
1
baza
2. baza 3
baza
U C A G
U UUU (Phe/F) Fenyloalanina UCU (Ser/S) Serin UAU (Tyr/Y) Tyrozyna UGU (Cys/C) Cysteina U
UUC UKC UAC UGC C
UUA (Leu/L) Leucyna UCA UAA Zatrzymywać się ( Ochra) UGA Zatrzymywać się ( Opal) A
UUG UCG UAG Zatrzymywać się ( Bursztyn) UGG (Trp/W) Tryptofan G
C CUU CCU (Pro/P) Prolina CAU (His/H) Histydyna CGU (Arg/R) Arginina U
CUC CCC C.A.C. C.G.C. C
CUA CSW CAA (Gln/Q) Glutamina CGA A
C.U.G. CCG CAG CGG G
A AUU (Ile/I) Izoleucyna ACU (Thr/T) Treonina AAU (Asn/N) Asparagina AGU (Ser/S) Serin U
AUC AKC AAC A.G.C. C
AUA ACTA AAA (Lys/K) Lizyna AGA. (Arg/R) Arginina A
SIERPIEŃ (Met/M) Metionina ACG AAG AGG G
G GUU (Val/V) Walina G.C.U. (Ala/A) Alanina GAU (Asp/D) Kwas asparaginowy GGU (Gly/G) Glicyna U
GUC GCC GAC GGC C
GUA GCA GAA (Glu/E) Kwas glutaminowy GGA A
G.U.G. GCG KNEBEL GGG G
Kodon AUG koduje metioninę i jest także miejscem inicjacji translacji: pierwszy kodon AUG w regionie kodującym mRNA służy jako początek syntezy białka. Odwrotna tabela (pokazano kodony dla każdego aminokwasu, a także kodony stop)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
As/N AAU, AAC Met/M SIERPIEŃ
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Rekwizyt CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Klej GAA, GAG Pr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
Jego/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Wartość/V GUU, GUC, GUA, GUG
POCZĄTEK SIERPIEŃ ZATRZYMYWAĆ SIĘ UAG, UGA, UAA

Różnice w standardowym kodzie genetycznym

Pierwszy przykład odchylenia od standardowego kodu genetycznego odkryto w 1979 roku podczas badań ludzkich genów mitochondrialnych. Od tego czasu odkryto kilka podobnych wariantów, w tym różne alternatywne kody mitochondrialne, na przykład odczytujące kodon stop UGA jako kodon określający tryptofan w mykoplazmach. U bakterii i archeonów HUG i UUG są często używane jako kodony startowe. W niektórych przypadkach geny zaczynają kodować białko od kodonu start, który różni się od tego zwykle używanego przez gatunek.

W niektórych białkach niestandardowe aminokwasy, takie jak selenocysteina i pirolizyna, są wstawiane przez rybosom odczytujący kodon stop, w zależności od sekwencji w mRNA. Selenocysteina jest obecnie uważana za 21., a pirolizyna za 22. aminokwas tworzący białka.

Pomimo tych wyjątków wszystkie żywe organizmy mają wspólne kody genetyczne: kodony składają się z trzech nukleotydów, przy czym decydujące są dwa pierwsze; kodony są tłumaczone przez tRNA i rybosomy na sekwencję aminokwasów.

Odchylenia od standardowego kodu genetycznego.
Przykład Kodon Normalne znaczenie Brzmi jak:
Niektóre rodzaje drożdży Candida C.U.G. Leucyna Serin
W szczególności mitochondria Saccharomyces cerevisiae CU(U, C, A, G) Leucyna Serin
Mitochondria roślin wyższych CGG Arginina Tryptofan
Mitochondria (we wszystkich badanych organizmach bez wyjątku) UGA Zatrzymywać się Tryptofan
Genom jądrowy orzęsków Euplotes UGA Zatrzymywać się Cysteina lub selenocysteina
Mitochondria ssaków, Drosophila, S. cerevisiae i wiele pierwotniaków AUA Izoleucyna Metionina = Start
Prokarioty G.U.G. Walin Początek
Eukarionty (rzadko) C.U.G. Leucyna Początek
Eukarionty (rzadko) G.U.G. Walin Początek
Prokarioty (rzadko) UUG Leucyna Początek
Eukarionty (rzadko) ACG Treonina Początek
Mitochondria ssaków AGC, AGU Serin Zatrzymywać się
Mitochondria Drosophila AGA. Arginina Zatrzymywać się
Mitochondria ssaków AG(A,G) Arginina Zatrzymywać się

Ewolucja

Uważa się, że kod trójkowy rozwinął się dość wcześnie w ewolucji życia. Ale istnienie różnic w niektórych organizmach, które pojawiły się na różnych etapach ewolucji, wskazuje, że nie zawsze tak było.

Według niektórych modeli kod istniał najpierw w prymitywnej formie, gdy niewielka liczba kodonów oznaczała stosunkowo niewielką liczbę aminokwasów. Bardziej precyzyjne znaczenia kodonów i więcej aminokwasów można będzie wprowadzić później. Początkowo do rozpoznania można było wykorzystać tylko dwie pierwsze z trzech zasad [co zależy od struktury tRNA].

- Lewina B. Geny. M.: 1987. s. 62.

Zobacz też

Notatki

  1. Sanger F. (1952). „Układ aminokwasów w białkach.” Adw. Chemia białka. 7 : 1-67. PMID.
  2. Ichas M. Kod biologiczny. - M.: Mir, 1971.
  3. Watson JD, Crick FH (kwiecień 1953). „Struktura molekularna kwasów nukleinowych; struktura kwasu nukleinowego dezoksyrybozy.” Natura. 171 : 737-738. PMID. odniesienie)
  4. Watson JD, Crick FH (maj 1953). „Genetyczne implikacje struktury kwasu dezoksyrybonukleinowego.” Natura. 171 : 964-967. PMID. Używa przestarzałego parametru |month= ( pomoc )
  5. Crick FH (kwiecień 1966). „Kod genetyczny – wczoraj, dziś i jutro.” Harb zimnej wiosny. Symp. Ilość. Biol.: 1-9. PMID. Używa przestarzałego parametru |month= ( pomoc )
  6. Gamow G. (luty 1954). „Możliwy związek między kwasem dezoksyrybonukleinowym a strukturami białkowymi.” Natura. 173 : 318. DOI:10.1038/173318a0. PMID. Używa przestarzałego parametru |month= ( pomoc )
  7. Gamow G., Rich A., Ycas M. (1956). „Zagadnienie transferu informacji z kwasów nukleinowych do białek.” Adw. Bio.l Med. Fiz.. 4 : 23-68. PMID.
  8. Gamow G, Ycas M. (1955). „Statystyczna korelacja składu białka i kwasu rybonukleinowego”. Proc. Natl. Acad. Nauka. USA.. 41 : 1011-1019. PMID.
  9. Crick F. H., Griffith J. S., Orgel LE (1957).

Jest to metoda, w której informacja o sekwencji dwudziestu aminokwasów jest kodowana przy użyciu sekwencji czterech nukleotydów.

Właściwości kodu genowego

1) Potrójny
Jeden aminokwas jest kodowany przez trzy nukleotydy. W DNA nazywane są tripletami, w mRNA – kodonem, w tRNA – antykodonem. W sumie jest ich 64 tripletów, 61 z nich koduje aminokwasy, a 3 to sygnały stopu - wskazują rybosomowi miejsce, w którym powinna zakończyć się synteza białek.

2) Degeneracja (redundancja)
Istnieje 61 kodonów kodujących aminokwasy, ale tylko 20 aminokwasów, więc większość aminokwasów jest kodowana przez wiele kodonów. Na przykład aminokwas alanina jest kodowany przez cztery kodony - HCU, HCC, HCA, HCH. Wyjątkiem jest metionina, kodowana jest przez jeden kodon AUG – u eukariontów jest to kodon startowy podczas translacji.

3) Jednoznaczność
Każdy kodon koduje tylko jeden aminokwas. Przykładowo kodon HCU koduje tylko jeden aminokwas – alaninę.

4) Ciągłość
Pomiędzy poszczególnymi trójkami nie ma żadnych separatorów („znaków interpunkcyjnych”). Z tego powodu, gdy jeden nukleotyd zostanie usunięty lub wstawiony, następuje „przesunięcie ramki odczytu”: zaczynając od miejsca mutacji, odczyt kodu tripletowego zostaje zakłócony i syntetyzowane jest zupełnie inne białko.

5) Wszechstronność
Kod genetyczny jest taki sam dla wszystkich żywych organizmów na Ziemi.