Pięćdziesiąt procent homologii

24Lu10
Siedzę właśnie na seminarium i znowu usłyszałem z ust prelegenta zdanie o genach, które są „bardzo homologiczne”, a za chwilę — że dwa geny mają „pięćdziesiąt procent homologii”.
Hemoglobina α i hemoglobina β to białka wchodzące w skład kompletnej cząsteczki ludzkiej hemoglobiny. Są homologami, a ich sekwencje są podobne. U góry: porównanie (alignment) obu sekwencji; poniżej: struktury obu hemoglobin są podobne, ale widać też różnice.

Mowa o podobieństwach między sekwencjami genów i białek. Sekwencje to ciągi kilkudziesięciu, kilkuset a może nawet kilku tysięcy liter z ograniczonego alfabetu, A, C, G i T w przypadku genów (sekwencji nukleotydowych), dwudziestu liter oznaczających dwadzieścia aminokwasów w przypadku białek.

Sekwencje są z definicji homologiczne wtedy i tylko wtedy, jeśli mają wspólnego przodka. Sekwencje ludzkiej hemoglobiny α są homologiczne do sekwencji ludzkiej β i do sekwencji hemoglobin szympansa, bo pochodzą od wspólnego przodka. Jeśli nie pochodzą, to nie są homologiczne. Nie ma miejsca na „bardziej” i „mniej”.

No dobrze, ale skąd możemy wiedzieć, czy sekwencje miały wspólnego przodka? Pomijając bardzo specyficzne sytuacje, taka wiedza nie jest nam bezpośrednio dana. Jednak homologia dla dwóch genów pociąga za sobą pewne konsekwencje (czytaj: falsyfikowalne przewidywania) — na przykład dotyczące podobnej funkcji genów, ich pozycji w drzewie filogenetycznym, modelu ewolucji. A także na temat podobieństwa sekwencji.

Hipotezy na temat homologii różnych sekwencji stawia się więc często w oparciu o ich podobieństwo. Jeśli są bardzo podobne, to uznajemy, że są homologiczne. A ściślej rzecz biorąc — zależnie od kontekstu, albo stawiamy hipotezę, albo testujemy hipotezę uprzednio postawioną.

Sformułowanie „pięćdziesiąt procent homologii” najczęściej więc nie ma sensu — możemy powiedzieć, że dwa geny mają 50% identycznych nukleotydów albo 50% podobnych bądź identycznych aminokwasów, i na tej podstawie odrzucić bądź przyjąć hipotezę dotyczącą ich homologii. Na przykład, możemy stwierdzić, że jest mało prawdopodobne, by dwie przypadkowe sekwencje miały tyle podobieństw.

Zależność między podobieństwem a homologią nie jest prosta; istnieje wiele przykładów na podobieństwa między białkami, które są bardzo podobne, ale ich podobieństwo wynika z konwergencji, a nie homologii. Vice versa, istnieją sekwencje, których homologię można dobrze udokumentować badając ich filogenezę, funkcję, strukturę w kontekście innych, podobnych sekwencji, ale które — jeśli porównamy je tylko ze sobą — będą się bardzo różnić.

Mitochondrialna transhydrogenaza NAD(P) to u bakterii dwa enzymy — produkty dwóch genów, które razem tworzą jeden kompleks białkowy. U eukariontów dwa geny zastąpione są jednym, który koduje obie funkcjonalne części (tzw. domeny).

Istnieje jednak pewien szczególny przypadek, w którym jedna sekwencja może rzeczywiście być w połowie homologiczna do drugiej — a w połowie nie. Jednym z ważniejszych mechanizmów ewolucyjnych jest, jak się obecnie wydaje, fuzja dwóch genów prowadząca do utworzenia jednego genu, kodującego jedno, długie białko odpowiadające dwóm białkom kodowanym przez geny, które uległy fuzji. Takie białka nazywa się czasem „białkami z Rosetty” (Rosetta stone proteins). Jeśli bowiem dwa geny A i B w jednym organizmie odpowiadają jednemu, dłuższemu genowi AB w drugim, to często okazuje się, że A i B w pierwszym organizmie mają powiązane ze sobą funkcje.

W takiej, i tylko takiej sytuacji możemy powiedzieć, że „gen AB jest w pięćdziesięciu procentach homologiczny do genu A”.

Literatura



%d bloggers like this: