nacija.hr

Programiranje života

Zaljubljenik u zadivljujući svijet molekularne biologije, genetike i biokemije, u ovom stručnom članku iznosi novootkrivene činjenice prirodnih znanosti koje pokazuju kako su sva divota i tehnološki sjaj naših inteligentno dizajniranih informatičkih sustava samo blijedi odsjaj informatičkog sustava skrivenom u biološkom svijetu koji nas okružuje i izgrađuje. Autor jasno pokazuje da je to podsjetnik na činjenicu da smo stvoreni na sliku Božju i da smo sposobni za stvaralaštvo i oblikovanje svijeta po istim principima logike i mudrosti koja nam je darovana od našega Boga Stvoritelja. Stoga se, kaže autor, ne treba čuditi da ćemo uz određene probleme u informatici doći do istih rješenja kakva susrećemo kada pogledamo pod mikroskop. Novi rezultati istraživanja u biologiji pokazuju da biološka informacija i život na Zemlji nisu mogli nastajati evolucijom.

Tekst: Marko P

Uvod

Svaki dodir tipkovnice računala pokreće nebrojene operacije, logičke ili matematičke funkcije i slanje tisuće kodiranih podataka. Ako se i malo zamislimo nad kompleksnosti cjelokupnog računalnog svijeta, ne možemo se ne diviti rezultatu zbroja milijuna inteligentnih umova kroz zadnjih četrdesetak godina na svim znanstvenim poljima: matematike, informatike, elektronike, računalstva, komunikacija i ostalih. Pa ipak, sva ta divota i tehnološki sjaj samo su blijedi odsjaj informatičkog sustava skrivenom u biološkom svijetu koji nas okružuje i izgrađuje. Podsjetnik su na činjenicu da smo stvoreni na sliku Božju i da smo sposobni za stvaralaštvo i oblikovanje svijeta, po istim principima logike i mudrosti koja nam je darovana. Stoga se ne treba čuditi da ćemo uz određene probleme u informatici doći do istih rješenja kakva susrećemo kada pogledamo pod mikroskop.

Informacije

I najmanja stanica našeg svijeta sadrži nezamislivo složeni sustav: s nekoliko slojeva informacija, čitanja, kopiranja, provjere i prevođenja kodiranih poruka, izrade i zamjene vlastitih komponenti, komunikacije, hijerarhijske mreže upravljanja, regulacije i interakcija, kao i sposobnost replikacije. Kao što vidimo neke od navedenih odlika naš računalni sustav ne sadrži. Teško da bi se i mogao mjeriti s kompleksnošću biološkog sustava čiji je krajnji rezultat život, ali ga navodimo za usporedbu jer trenutno ne raspolažemo boljim primjerom. Prva odlika prepoznavanja rezultata djelovanja inteligencije nad nekom materijom je informacija. Od slučajnog niza znakova informacija se razlikuje porukom koju nosi, a zapisana pomoću simbola može služiti za prijenos ako pošiljatelj i primalac jednako prevode istu poruku. Kada u pustinji pronađemo kamenu ploču s uklesanim znakovima, nećemo niti na trenutak posumnjati da se ne radi o rezultatu djelovanja inteligencije. Teško da bi tko povjerovao da se radi o djelovanju prirodnih sila vjetra i kiše koji bi kroz tisuće godina erodirali materijal na način da se na ploči pojave tisuće simbola u smislenom nizu. Informacija kao takva nije materijalna već je materija samo sredstvo pohrane informacije, a uzrok pojave informacije je uvijek aktivnost inteligentnog agenta. U biološkom svijetu informacija odvaja živi od neživog svijeta. Informacija pohranjena unutar DNK lanca prokariotskih i eukariotskih organizama nosi poruku života, dok entiteti na granici života, npr. virusi prenose potrebne informacije koje sami ne mogu dekodirati i upotrijebiti, već ovise o živim organizmima koje imaju za to potrebne dekodere. Kakva je ironija da se ogromne količine novčanih sredstava izdvaja za traženje inteligencije u svemiru (hvatanje signala u obliku kodirane informacije, npr. aperiodički radio val), za koju nemamo nikakvih naznaka da postoji, dok ogromne količine puno složenijih informacija pohranjenih u biološkim sustavima znanstvenici ne žele pripisati rezultatu djelovanja Inteligencije. Informacija se prema složenosti mjeri sljedećim odlikama:

1. Statistika

2. Kodiranje i sintaksa

3. Semantika

4. Pragmatika

5. Apobetika

Statistika predstavlja statističko pojavljivanje znakova u informaciji, kodiranje se odnosi na slaganje pojedinih znakova u riječi dok sintaksa predstavlja pravila slaganja uzastopnih znakova. Semantika predstavlja značenje samog zapisa. Pragmatika se odnosi na više razrede informacije koje uzrokuju akciju, tako npr. u računalnom jeziku pojedina riječ predstavlja komandu koja započinje neku elektroničku akciju u samom računalu. Sve nabrojane slojeve informacije standardni genetski kod sadrži, a glavna svrha (Apobetika) tog biološkog koda je život. Ljudi su tijekom povijesti na razne načine pokušavali zapisati informacije, od simboličkih pisama, raznih abeceda, pa do raznih brojevnih baza za prikaz brojeva i danas svih informacija (na računalima sve informacije digitalizirane kao brojevi). Kada se promotri optimalna baza (minimalna površina koja se dobije množenjem broja simbola s brojevnom bazom) dobiva se da je Eulerov broj e=2,718 , zaokruženo na cijeli broj 3, najbolji za prikaz podataka (brojevni sustav koji je informacijski najgušći). Dakle abeceda od tri znaka je za kodiranje podataka bolja od našeg dekadskog sustava, abecede nekog jezika, ili pak binarnog sustava koji koriste sva računala (odabranim iz razloga tehnološkog ograničenja tranzistora koji mogu pamtiti samo dva stanja i mogućnosti izvršavanja logičkih operacija). Ako informaciju zapisanu s tri simbola želimo zaštititi na način da simbole spojimo u parove, dobivamo abecedu s četiri simbola koji međusobno štite informaciju (1. znak štiti 2. znak, 3. štiti 4.).

Upravo to je ono što vidimo na DNA traci podataka, čitav projekt genoma zapisan zaštićenim načinom pohrane podataka, s uparenim znakovima na traci koja je pogodna za čuvanje podataka na dulje vrijeme. Vodikove veze između baznih parova A-T i C-G su jake, što čini DNK traku u hladim i suhim uvjetima pogodnim za pohranu podataka i do 10.000 godina, a zbog zaštite znakova uparivanjem, enzimi prepravljači u stanicama lagano ispravljaju oštećenja (pogrešne znakove) do kojih dolazi prepisivanjem informacije. Zamislimo ijedan današnji medij za pohranu podataka, poput trake, DVD-a ili memorijske kartice, s kojeg se čitalo bezbroj puta, nakon 10.000 godina. Koliko bi se podataka dalo pročitati, s kojom točnošću? Zapis kakav imamo na DNA lancu, gdje su informacije i upravljačke instrukcije zapisane na istu traku, uz čitač (RNA ili DNA polimerazu) kao logički sklop koji obrađuje te podatke, zove se u računalstvu univerzalno računalo, koncept koji je osmislio matematičar Turing 1936. godine (http://hr.wikipedia.org/wiki/Turingov_stroj). Ironija je da se njega smatra ocem računalstva i da se dodjeljuju nagrade koje nose njegovo ime kada puno složeniji informatički sustav odavno postoji u svakoj stanici našeg tijela.

Dolazimo do glavnog i teoriji evolucije nerješivog problema kojeg je još 1971. godine izrekao Jacques Monod, francuski biolog i dobitnik Nobelove nagrade iz medicine: „Glavni je problem porijeklo genetskog koda i mehanizama translacije tog koda. Prije bi se moglo zvati zagonetkom nego problemom. Kod je besmislen dok se ne prevede. Translacijski mehanizmi modernih stanica sastoje se od najmanje pedeset makromolekularnih dijelova koji su i sami kodirani unutar DNK; kod se ne može prevesti ni na koji drugi način osim pomoću samih produkata translacije. Za to danas koristimo izraz omne vivum ex ovo [sve što živi (dolazi) iz jajeta]. Kada i kako se taj krug zatvorio? To je jako teško i zamisliti.“ Slobodni prijevod preuzet iz „Chance and Necessity: An Essay on the Natural Philosophy of Modern Biology”, 1971.

Dobro je Monod primijetio, kako pročitati DVD na kojem su pohranjene upute za izradu DVD čitača? Niz zagonetki mogli bi nastaviti u nedogled jer su sve proteinske komponente za pravilan stanični ciklus potrebne odmah:

1. Ako nemamo desetke CDK proteina, nema niti ispravne regulacije staničnog ciklusa, niti diobe stanice.

2. Ako nemamo gotovu Kinetohoru (i najmanju izgrađuje 19 različitih proteina) kako ćemo razdvojiti kromosom prilikom mitoze?

3. Ako nemamo proteine Histone koji namataju DNK, kako ćemo upakirati 2-3 m dugački lanac DNK podataka unutar jezgre stanice reda veličine nekoliko mikrometra?

4. Adenin sintetiziraju 11 enzima, ukupne duljine oko 4500 aminokiselina. Ako i jedan od enzima ne radi ispravno, nema sinteze Adenina. Svih 11 enzima koriste energiju u obliku molekula ATP-a, a molekule ATP sastoje se od: Adenina, Riboze i fosfata. Dakle za sintezu Adenina potrebno je imati već gotov Adenin.

Bez gotovih proteinskih komponenti nema metabolizma niti stanične diobe, bez diobe nema sljedeće generacije i koncept evolucije je mrtav u samom startu.

Kodovi

Kada pogledamo hrvatsku abecedu kojom se služimo svakodnevno, primjećujemo da s 30 osnovnih znakova možemo kodirati oko 400.000 riječi koliko su izbrojali jezikoslovci. Koliko različitih smislenih rečenica možemo kodirati tim riječima?

Kao što vidimo kompleksnost od simbola do rečenice raste eksponencijalno. Broju smislenih riječi ili rečenica odgovara puno veća potencija nizova znakova bez ikakvog značenja, koje u transmisijskim sustavima označavamo kao grešku ili šum. I u genetskom kodu imamo simbole-nukleotide, riječi-kodone, i rečenice-proteine. Jednako tako broju funkcionalnih proteina i porodica proteina koje dobivamo slaganjem kodona, a koje pronalazimo u svim biološkim organizmima, broj nefunkcionalnih nizova kodona je do 77 potencije veći [1]. Prema teoriji evolucije organizmi su te funkcionalne proteine pronašli nasumičnim mutacijama i selekcijom, a ponekad i desetke puta paralelno došli do istih rješenja konvergentnom evolucijom. Kako se u znanstvenom rječniku ne smije upotrebljavati riječ čudo, za naslov jednog članka iskoristili su izraz Blizu čuda [2], kada su opisivali gore navedenu problematiku veličine prostornog pretraživanja. Geni se sastoje od eksona i introna. Eksoni sadrže kodirajući DNK koji nosi instrukcije za izradu proteina, dok introni sadrže nekodirajući dio, pa su se do nedavno smatrali nepotrebnim viškom. Međutim, u intronima su pronašli kružne ciRNK, kojima je uloga regulacije transkripcije gena kojima pripadaju [5]. Nakon transkripcije gena slijedi alternativno prekrajanje zapisa gdje se izrezuju introni i kombiniraju eksoni kako bi se dobili razni produkti mRNK. Neki niži organizmi nadmašuju ljudski DNK po duljini, po broju kromosoma, kao i po broju gena, što znači da uzrok kompleksnosti organizma treba potražiti negdje drugdje: u regulaciji gena, kompleksnosti prekrajanja transkripta gena, ekspresiji i međusobnim interakcijama gena, kao i u informacijama pohranjenim izvan genoma. Ljudski DNK sadrži oko 21.500 gena od kojih alternativnim prekrajanjem dobivamo oko 100.000 vrsta proteina i 2,4 milijuna različitih varijanti proteina. Prekrajanjem dobivamo puno veći opseg rezultirajućih mRNK, čime smanjujemo broj potrebnih gena, ali se povećava kompleksnost regulacije (kao što ćemo vidjeti na primjeru). Pronađen je ljudski BN2 gen koji ima 6 promotera, višestruka mjesta prekrajanja i 4 mjesta za poliadenilaciju, čime ima potencijal za izradu čak 90.000 mRNK i 2000 proteina [3].

U svijetu informatike podaci se kodiraju i prenose raznim protokolima. Protokoli su dogovorena pravila kodiranja podataka u kojima se često koristi enkapsulacija (omatanje) poruka zaglavljima/podnožjima. Zaglavlja se u računalstvu mogu koristiti za zaštitu podatka, kodiranje dodatnih informacija ili adrese. Pravila enkapsulacije postoje i u genetskom kodu, na primjer: TATA slog u promotoru, 5′ kapa na početku, 5’UTR i 3’UTR sekvence koje omataju kodirajuće sekvence, promoterske sekvence, START i STOP kodoni između kojih se nalaze instrukcije za aminokiseline, poliadenilacijski rep na kraju, TEE elementi, donorska i akceptorska mjesta za prekrajanje pre-mRNK itd. Da bi digitalni zapis mogao služiti kao instrukcija, odgovor na instrukcije uz jednake početne uvjete mora biti jednoznačan.

Programiranjezivota2

Slika 1. Struktura glasničke mRNK uz netranslatiranu regiju 3’UTR

Nakon prepisivanja DNK u mRNK, na kraju se nakon STOP kodona nalazi sekvenca pod skraćenim nazivom 3’UTR (Slika 1.). 3’UTR je netranslatirana regija mRNA zapisa koja ne predstavlja kodove za aminokiseline, već regulaciju glasničke mRNA, jer sadrži mjesta za vezanje raznih proteina ili microRNA koji reguliraju čitanje mRNA zapisa. Greške na tom 3’UTR dijelu uzrokuju teške bolesti i smrt. 3’UTR sekvenca sadrži na stotine, pa čak i tisuće regulatornih sekvenci i često je dulja i od samih instrukcija za aminokiseline. Uz mogućnost alternativnog prekrajanja gena za razne produkte mRNA (različite instrukcije za proteine), nedavno je otkriveno i alternativno prekrajanje 3’UTR sekvenci, čime se dobiva različita regulacija mRNA u različitim diferenciranim stanicama [4]. Zanimljiva je činjenica da upravo ljudski DNK sadrži duplo dulje 3’UTR regulatorne sekvence od svih drugih sisavaca.

U računalnim se sustavima puno energije ulaže na zaštitu podataka prilikom pohrane ili prijenosa. Tako se važni podaci pohranjuju na više odvojenih lokacija (backup), često se koristi zrcaljenje podataka (mirroring, RAID diskovi) i podaci se kodiraju zaštićenim kodovima (Hummingov kod i sl.). Dvostruki heliks lanac DNK gdje su nukleotide uparene (A-T, C-G) upravo predstavlja zrcaljenje podataka. Kada promotrimo standardni genetski kod, primjećujemo da se uz 4 nukleotide i duljinu od 3 znaka po kodonu, dobiva 64 različite moguće kombinacije za aminokiseline. Međutim od tih 64 mogućih kombinacija najčešće se kodiraju samo oko 20 aminokiselina (s 61 kodonom, ostali su START ili STOP kodoni). Standardni genetski kod je zaštićen optimalan način kodiranja. Pola aminokiselina ne ovisi o trećem znaku što daje redundanciju u zapisu i otpornost na štetne mutacije (postoji oko 45 tRNK koje predstavljaju antikodone za 61 kodon, dakle neki od tRNK prepoznaju više kombinacija kodona). Ako pak dođe do promjene prvog ili drugog znaka u kodonu rezultat je često aminokiselina sa sličnim fizikalnim i kemijskim svojstvima, pa protein nije trajno uništen. Najgori slučaj je pak pomak okvira frame shift, umetanjem/brisanjem dodatne nukleotide u slijed, što potpuno uništava zapis gena jer se mijenjaju svi kodoni u slijedu (budući da se čitaju tri po tri znaka u nizu). U tom slučaju dolazi do brze pojave STOP kodona, jer upravo varijacije tripleta najčešće korištenih aminokiselina predstavljaju STOP kodon! Dakle imamo savršeno zaštićeni način kodiranja gdje se očituje mudrost Stvoritelja koja nadilazi naša shvaćanja. Podjela na aminokiseline s većom redundancijom zapisa od druge polovice mogla bi se činiti nepotrebnom, ali istraživanja na bakterijama pokazala su da je u stresnim situacijama (nedovoljno hrane i sl.) brzina sinteza proteina robusnijih aminokiselina (onih koji imaju više srodnih kodona za istu aminokiselinu) do 100 puta veća nego kod aminokiselina kodiranih osjetljivijim kodonima. Na taj način bakterije imaju sposobnost adaptacije brzine sinteze proteina ovisno o vanjskim stresnim uvjetima [9].

Kako je nastao optimalan genetski kod? Evolucionisti na ovo pitanje nemaju pravi odgovor iako priznaju da se radi o „najboljem mogućem kodu“ (ili vrlo blizu najboljeg), zbog najmanjih gubitaka informacije uslijed pojave grešaka u kodonima [6]. Njihova je pretpostavka da se radilo o početnom neograničenom setu od 10^18 različitih kodova ili ograničenom setu od 10^9 mogućih kodova. Pretpostavljaju da je standardni genetski kod evoluirao i da su slučajni procesi izabrali najbolje moguće rješenje, iako ostaje potpuno nejasno kako se optimalno rješenje moglo pronaći na samom početku razvoja prije navodnog razdvajanja organizama, jer je danas optimalan kod prisutan u svim živućim organizmima. Novi šok predstavlja činjenica da su otkriveni mnogi različiti kodovi (varijacije osnovnog optimalnog koda) kroz organizme, iako se smatralo da je varijacija koda rijetka pojava u prirodi [7]. U preko 1700 slučajeva genoma iz raznih ekosustava (morski, slatkovodni i kopneni), neka od tri sekvence STOP kodona ne predstavlja instrukciju za zaustavljanje, već aminokiselinu [8]. Što bi to značilo za teoriju evolucije? Da je u određenom trenutku neki, prema njima prijelazni organizam, sadržavao do tad prikupljene gene (kroz navodne milijune godina mutacije i selekcije) , da bi u idućem trenutku (generaciji) svi ti geni postali nečitljivi jer se promijenio kod za dekodiranje.

Kao i u računalnim sustavima, u genomu se pronalaze višestruke kopije važnih gena raspršene duž DNK ili kromosoma, što zadaje velike probleme genetičarima pri otkrivanju važnosti gena. Navedimo primjer iz embriologije: Ako se mutiraju razvojni geni HoxA11 i HoxD11 kod miševa, oni se rađaju bez dviju kosti noga. Mutirani HoxA10,C10,D10 rezultiraju mišem bez kičme, što ukazuje na ogromnu važnost tih gena. Međutim ako je samo jedan od navedenih 6 gena normalan, miš je manje defektan, što ukazuje na visoku redundantnost Hox gena.

Znanstvenici s internacionalnog projekta FANTOM ove godine otkrivaju dodatnu složenost genetskog koda proučavajući gene kroz razna tkiva. Nakon provedenog istraživanja otkrivaju: „Pogrešno je misliti kako isti geni stvaraju jednake proteine kroz različita tkiva. Promoterske sekvence, koje prethode kodu za protein, variraju, što rezultira različitim proteinima u različitim organima“ [15]. Dakle uz iste gene imamo različite promoterske sekvence kroz organe što ukazuje na višestruko korištenje istih genetskih kodova uz različitu regulaciju. Time se dobiva nevjerojatna sposobnost da se s istim genima izgrađuju različiti organi.

Uloge RNK molekula su zaista mnogobrojne: izrada proteina, regulacija, promjena strukture kromosoma, vezanje uz brojne proteine, vezanje na mnogobrojna mjesta u DNK itd. Sada se pronalaze i izvan-stanične exRNK molekule koje služe za komunikaciju između stanica, nešto poput slanja email poruka između računala [19]. Kao i u računalnom svijetu gdje email može putovati unutar lokalne mreže (LAN-a) ili globalne mreže (WAN-a), tako i exRNK mogu služiti za komunikaciju između stanica ili između organa, putovanjem kroz krvotok. Neke se uloge exRNK otkrivaju: neurološki sustav otpušta exRNK kao odgovor na vanjske podražaje, koji zatim reguliraju rad mnogobrojnih organa, dok imunološki sustav šalje exRNK kao odgovor na upale. Za funkcioniranje ovakvih sustava stanice moraju imati odgovarajuće proteine koji propuštaju exRNK u stanicu, a zatim niz drugih mehanizama koji će znati ispravno protumačiti primljeni „sistemski signal“.

Genetičari nedavno otkrivaju još jedan sloj informacija pohranjen u genima. Ne samo da geni nose informacije o izradi proteina, već i instrukcije o regulaciji samih gena, u istom zapisu ali na višem nivou, a kodone sada počinju zvati duoni [14]. „Sada znamo da smo s temeljnom pretpostavkom o čitanju ljudskog genoma propustili pola cjelokupne slike. Nova otkrića ukazuju na to kako je DNK nevjerojatno moćan uređaj za pohranu informacija, koje je priroda u potpunosti iskoristila na neočekivane načine.“ kaže genetičar dr. John Stamatoyannopoulos. S druge strane pronalaze se mnogobrojni dualno-kodirajući geni (skraćeno ARFs), geni koji u sebi sadrže dvostruke preklapajuće kodove [21]. Ti geni uz osnovni imaju i alternativni okvir za čitanje (pomaknut za nukleotidu ili dvije u odnosu na osnovni okvir), a oba daju funkcionalne proteine. Poznajući male vjerojatnosti nastanka jednostruko-kodirajućeg gena, autori zaključuju da je nastanak dvostruko-kodirajućeg gena „gotovo nemoguć“ i „statistički nevjerojatan proces“. Pošto ih pronalaze kod mnogih sisavaca (kod ljudi oko 40-tak), autori zaključuju „kako su preklapajući okviri obilježje fascinantne biologije“.

Koji to prirodni slučajni proces može napisati zapis koji u sebi nosi dva paralelna, različita, smislena značenja?

Čitači

Kako se čitaju podaci s naših računala? Mogli bismo reći vrlo primitivno, glava za čitanje smještena na kazaljku, putuje po magnetskoj ploči hard diska i slijedno pretražuje sektore u potrazi za traženim podacima. S druge strane, kod čitanja DNK podataka postoji prostorni pristup polimeraze DNK lancu, a kromosom se: otvara/zatvara, zateže/otpušta (histoni), transkripcijski faktori posreduju i navode polimerazu prema genima, pojačivači iniciraju čitanje gena, dok metilne grupe blokiraju ili dopuštaju prilaz genima. Sve se to odvija vrlo dinamično i precizno, nekada sporije, nekad brže, a ponekad se čita i u obrnutom slijedu, uz stalnu provjeru valjanosti pročitanih podataka. Paradigma evolucije je da su mutacije slučajne i da se do valjanog gena dolazi nizom slučajnih, ne-upravljanih događaja. Tako bi se očekivao i genom prepun smeća (neuspjelih neutralnih mutacija koje nisu generirale valjan zapis nego su se akumulirale kroz milijune godina). Ako bi se i postigli zapisi valjanog gena uz ogroman broj pokušaja, oni bi prostorno bili razbacani i nepovezani. Međutim novija istraživanja pokazuju upravo suprotno, mapiranje asocijacija genoma jedne vrste kvasca otkrila je nevjerojatnu prostornu organizaciju genoma, gdje su međusobno asocirani geni grupirani prostorno blizu, uz redovito aktivnije gene smještene bliže površini, radi lakšeg pristupa čitača [10]. Otkrivena je direktna funkcionalna veza prostorne organizacije i transkripcijske regulacije gena (vidi Sliku 2.). Ovdje se ne radi više o tvrdnji analognoj onoj da imamo pred sobom knjigu koja se sama napisala slučajnim procesima prema teoriji evolucije, već o tvrdnji da su se knjige same napisale i prostorno poslagale po policama ovisno o tematici ili učestalosti čitanja.

Programiranjezivota1

Slika 2. Prostorna organizacija gena, preuzeto iz: „Mapping of long-range associations throughout the fission yeast genome reveals global genome organization linked to transcriptional regulation“

Genetičari Spilianakis i Flavell promatrali su međusobne asocijacije različitih kromosoma kod viših organizama i također otkrili prostornu organizaciju među kromosomima: „Genetske informacije viših organizama kodirane su u DNK koja nije nasumično raspršena unutar stanične jezgre, već je organizirana nukleoproteinima u različite vrste kromatina, građevne blokove kromosoma. Svaki se kromosom nalazi u određenom području jezgre kada se stanica ne dijeli, a geni koji su aktivno izraženi odmotani su iz kondenziranog područja kromatina i lokalizirani u područje transkripcijske aktivnosti. Ova područja „transkripcijskih tvornica“ obiluju transkripcijskim regulatornim faktorima i drugim faktorima koji iniciraju i reguliraju ekspresiju gena“ [20].

Kako se zapisuju podaci na hard disku i što nam to govori o problematici zapisivanja podataka? Svi podaci na računalu predstavljeni su u binarnom kodu pomoću simbola „0“ i „1“. Podaci se zapisuju na medij mijenjajući smjer magnetskog polariteta na ploči. Kada bi direktno zapisivali podatke na magnetsku ploču onako kako su kodirani, došli bi do problema: Što kada se zapis sastoji od mnogobrojnih ponavljanja znaka „0“ (zadržan smjer polariteta par mikrometara, npr. 512 byta sektor od nula predstavljao bi 4.096 sekvenci jednakog polariteta)? Uz minimalna odstupanja od konstantne brzine vrtnje diska, nakon velikog broja ponavljanja simbola dolazi do nesigurnosti u valjanosti pročitanog podatka (koliko je točno „0“ očitano?), problem poznat pod nazivom Run Lenght Limited (RLL). Zato se izbjegava takvo direktno zapisivanje, već se ubacuju razmaknice. Nešto slično primjećujemo i u DNK zapisu, eksoni koji nose instrukcije za proteine odvojeni su razmaknicama intronima koji se poslije procesiranjem (splicing) izrezuju iz zapisa. Tako se osigurava zapisivanje u manje cjeline, uz kasniju mogućnost prerazmještaja eksona.

Što je s onim DNK smećem koje smo spominjali? „Kakvo DNK smeće, to je operativni sustav“ rekla bi dr. Patricia Fitzpatrick Dimond u naslovu istoimenog članka portala GEN [11]. Najveća otkrića u području genetike u zadnje vrijeme pronalaze se upravo u tom dijelu koji se do nedavno smatrao smećem.

Kompleksnost sustava

Broj kromosoma, duljina genoma ili broj gena ne govori nam previše o kompleksnosti organizama. Da bi se odredila kompleksnost nekog sustava potrebno je popisati sve međusobne interakcije pojedinih dijelova. Do nedavno se smatralo da će sekvenciranje genoma otkriti sve tajne života, međutim kako znanstvenici priznaju otvorili su se labirinti neodgovorenih pitanja i otkrilo se da je biološka kompleksnost veća za nekoliko redova veličine. „Čini se da se penjemo na planinu koja postaje sve viša i viša…Što više doznajemo, postajemo svjesniji koliko zapravo malo toga znamo “ govori Jennifer Doudna, biokemičarka sa sveučilišta Berkley u Californiji [12]. Znanstvenici s ENCODE projekta otkrili su da se iz genoma koji sadrži samo par posto kodirajućeg DNK, prepisuje do 93% DNK u RNK, a omjer regulatornih i ostalih RNK prema glasničkim mRNK (od kojih dobivamo proteine) doseže i do 50:1. „Postojanje takvih egzotičnih regulatora ukazuje na to koliko je naše razumijevanje i najosnovnijih stvari, kao što su pokretanje/zaustavljanje stanica, nevjerojatno naivno“ kaže Joshua Plotkin, matematičar i biolog s sveučilišta Pennsylvania u Philadelphiji. Koliko nova saznanja otkrivaju nezamislivu kompleksnost vidimo na sljedećem primjeru: Gen P53 za kojeg su na početku smatrali da uzrokuje tumor, kasnije je ustanovljeno da zapravo suzbija tumore. Tim znanstvenika iz Japana kasnije je pak otkrio da P53 procesira nekoliko varijanti mikroRNK čime zapravo drži rast stanica pod kontrolom [13]. Sada se zna da P53 leži u centru dinamičke mreže proteina, kemijskih i genetičkih interakcija. Veže se na tisuće mjesta u DNK, od kojih su neka udaljena tisućama baznih parova od bilo kojeg gena. P53 utječe na stanični rast ili smrt, kao i na strukturu i popravak DNK. Veže se i uz druge proteine koji mijenjaju njegovu aktivnost, a te protein-protein interakcije se mogu dodatno podešavati dodavanjem kemijskih modifikatora (poput fosfata ili metilnih grupa). Kroz proces alternativnog prekrajanja (splicing) P53 zauzima 9 različitih formi, a svaka od njih ima vlastitu aktivnost i vlastite kemijske modifikatore. Uz suzbijanje tumora, uloga P53 se veže i uz plodnost, kao i rani razvoj embrija, a znanstvenici sada proučavaju i crtaju P53 mrežu kako bi barem shematski pokušali opisati sve moguće mreže interakcija. „Stanične signalne informacije su organizirane u čitave mreže informacija, a ne u zasebne jednostavne putove. Sve to skupa je neizmjerno složenije.“ kaže Tony Pawson, biolog. Genetičar Mark Johnston optimistično je najavljivao kako će do 2007. godine primitivan pivski kvasac biti do kraja istražen, kada se popišu svi njegovi geni i međusobne interakcije. Kako je navedeno vrijeme isteklo morao je priznati kako će za taj posao biti potrebno još nekoliko idućih desetljeća.

Zaključak

Principe logičkih operacija iz svijeta informatike znanstvenici svakodnevno otkrivaju u biološkom svijetu. Logiku ostvarenu u genomu bakterija sada koriste kao logičke sklopove za računanje Booleovih operacija, uz jednake rezultate kakve daju računala [16]. Počinje se naveliko koristiti DNK kao medij za pohranu podataka, jer nakon toliko godina razvoja, ljudski se mediji i dalje ne mogu mjeriti s kapacitetom DNK [17]. Na čajnu žličicu ispunjenu DNK molekulama, moguće je smjestiti genome svih vrsta na planeti i još ostaje dovoljno mjesta za pohranu svih knjiga ikada napisanih. Razvoj računalnog svijeta, pod direktnim upravljanjem ljudske inteligencije, mjeri se Mooreovim zakonom rasta koji kaže da se broj tranzistora na čipovima, a time i kompleksnost sustava, udvostručuje kroz vrijeme. Znanstvenici su velikodušno pokušali dati istu razvojnu snagu slijepom ne-upravljanom procesu evolucije kako bi objasnili nastanak života. Rezultat je za njih bio porazan. Uz 4,5 milijardi godina (koliko pripisuju evolucionisti) i nevjerojatnu razvojnu moć koju su joj pripisali, život na Zemlji nije mogao nastati evolucijom prema Mooreovom zakonu rasta [18]. Ne postoji knjiga ili softver koji se sam napisao i koji je nastao bez djelovanja inteligencije. Na svijetu trenutno oko 20 milijuna programera zarađuje svoj kruh svakodnevno stvarajući nove softvere. Kada bi postojao slijepi proces koji izbacuje gotova, nova rješenja, a koji ne zahtijeva djelovanje inteligencije, nemojmo misliti da bi svi ti programeri zadržali svoj posao. Univerzalno računalo, najbolji mogući kod, dvostruki kodovi, operacijski sustavi, prostorna organizacija genoma, sistemski signali, samo su neki od pojmova koje smo spomenuli, koji ne ukazuju na slučajne procese, već na mudrost Stvoritelja. Na nama ostaje da potražimo Autora.

Reference:

1. http://www.ncbi.nlm.nih.gov/pubmed/15321723

2. http://www.asbmb.org/asbmbtoday/asbmbtoday_article.aspx?id=48961

3. http://www.ncbi.nlm.nih.gov/pubmed/16942855

4. http://genome.cshlp.org/content/early/2013/03/20/gr.146886.112.abstract

5. http://www.cell.com/molecular-cell/abstract/S1097-2765%2813%2900590-X

6. http://www.cc.gatech.edu/~turk/bio_sim/articles/optimal_genetic_code.pdf

7. http://www.the-scientist.com/?articles.view/articleNo/40048/title/When-Stop-Means-Go/

8. http://www.sciencemag.org/content/344/6186/909.abstract

9. http://www.pnas.org/content/early/2012/12/28/1211077110.short

10. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3001101/

11. http://www.genengnews.com/insight-and-intelligenceand153/what-junk-dna-it-s-an-operating-system/77899872/

12. http://www.nature.com/news/2010/100331/pdf/464664a.pdf

13. http://www.nature.com/nature/journal/v460/n7254/abs/nature08199.html

14. http://www.washington.edu/news/2013/12/12/scientists-discover-double-meaning-in-genetic-code/

15. „One gene, many tissues“  http://www.sissa.it/sites/default/files/images/documents/form_e_documenti_linkati/2014-03-27_gustincich_tessuti/geni_per_tessuti_SG-eng_AT.pdf

16. http://www.sciencemag.org/content/340/6132/554.summary

17. http://www.extremetech.com/computing/146600-new-technique-stores-terabytes-data-on-dna-with-100-accuracy

18. http://phys.org/news/2013-04-law-life-began-earth.html

19. http://www.ucsf.edu/news/2014/01/111006/exrna-decoding-messages-between-cells

20. http://www.sciencemag.org/content/312/5771/207

21. http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.0030091

Vezani članci