Rabu, 29 Agustus 2012

Sebuah Tulisan Evolusi dan Filogeni: Estimating Selection Pressures on Molecular Sequences (In Depth) Part I

Hai hai hai...jumpa lagi bersama saia Chef Victor dengan segala kalimat pembuka tulisannya yang terus berulang-ulang dan nampak membosankan...hahaha. Okeh to the point sajah, dalam tulisan kali ini saia ingin mencoba melunasi 'hutang' saia terkait dengan tulisan sebelumnya. Pada tulisan sebelumnya terlihat bahwa saia terkesan begitu polosnya dan belum dapat mengerti dan memahami keseluruhan tulisan dari sebuah bab buku The Phylogenetic Handbook yang berjudul "Estimating selection pressures on molecular sequences". Nah kali ini, tepat 16 hari sesudah postingan tulisan tersebut, saia ingin kembali mencoba pemahaman saia dengan mencoba menceritakannya kepada kalian-kalian ini. Kalau kalian mengerti, maka itu artinya saia berhasil. Namun apabila kalian belum mengerti, itu artinya kalian yang kurang belajar...hahaha. Yasuda, selamat menikmati ^^

Tulisan ini akan saia mulai dengan 4 buah pertanyaan terkait peranan tekanan seleksi terhadap sequence molekular beserta jawaban singkatnya untuk memandu kita dalam menelusuri keseluruhan tulisan ini:
1. Apa bukti adanya seleksi terhadap sebuah gen? Kita dapat menentukan ada atau tidaknya seleksi dengan mengukur laju substitusi non-synonimous (substitusi nukleotida yang berakibat tergantinya asam amino yang di-translasi; beta) terhadap laju substitusi synonimous (substitusi nukleotida yang tidak mengganti asam amino yang di-translasi; alfa). Adanya seleksi dapat ditentukan dengan rasio kedua laju ini (beta/alfa = omega), yakni omega > 1 atau omega < 1.

2. Kapankah seleksi terjadi? Kita dapat mengukur variasi nilai omega antar cabang (branch) yang ada pada pohon filogenetik. Dengan demikian kita dapat menyimpulkan kapan suatu seleksi berlangsung. Estimasi waktu ini dapat diindikasikan oleh lokasi branch di dalam pohon yang kemudian di estimasi waktunya dengan analisis molecular clock).

3. Dimanakah letak tejadinya seleksi? Kita dapat mendeteksi terjadinya seleksi pada gen dengan menganalisis laju subtitusi syn/non terhadap setiap kodon yang ada pada alignment sequence molekular dan kemudian mentarget kodon mana yang bertanggung jawab terhadap hal tersebut.

4. Apakah gen yang berbeda mengalami tekanan seleksi yang berbeda? Kita dapat menjawabnya dengan membandingkan dua jenis dataset sequence menggunakan model analisis yang sama dan kemudian menguji signifikansinya dengan uji statistik.

Sebelum menjawab empat pertanyaan tersebut ada beberapa istilah yang harus diketahui terlebih dahulu mengenai seleksi. Seleksi terhadap sequence molekular terbagi menjadi tida, yakni seleksi positif (diversifying), seleksi netral, dan seleksi negatif (purifying). Seleksi positif adalah suatu kondisi seleksi yang memungkinkan varian-varian sequence molekuar dapat bertahan hidup. Hal inilah yang menyebabkan adaya 'keanekaragaman' tingkat sequence pada gen yang sama. Perlu diketahui bahwa varian-varian tersebut juga memiliki tingkat ketahanan hidup (survival rate) yang beraneka ragam. Dalam hal ini seleksi negatif merupakan kebalikan dari seleksi positif, yakni menyeleksi varian-varian dengan tingkat ketahanan hidup yang berada di bawah suatu batas tertentu. Seleksi netral merupakan titik tengah antara seleksi positif dan negatif. Parameter substitusi non-synonimous (beta) pada suatu kodon dipakai sebagai parameter seleksi ini dan kita akan simak rinciannya pada paragraf selanjutnya.

Oke, sekarang mari kita telusuri secara lebih mendalam lagi jawaban-jawaban tersebut. Sebagai awalan, teman-teman yang setia mengikuti serial Sebuah Tulisan Evolusi dan Filogeni ini pastinya sudah mengetahui bahwa model evolusi yang telah dikenal sejauh membacanya adalah model evolusi nukleotida (Jukes-Cantor, Kimura, dll) dan model evolusi asam amino (Dayhoff, Jones-Taylor-Thornton, Poisson, dll). Namun dalam analisis seleksi ini, kita akan menggunakan model evolusi yang menggabungkan keduanya (kalau boleh saia simpulkan seperti itu), yakni model evolusi kodon. Sebagaimana yang telah kita ketahui, kodon atau kode genetik berisi 64 kode kombinasi triplet nukleotida yang menyandi 20 jenis asam amino. Sebagai konsekuensinya ada beberapa kodon menyandi asam amino yang sama, contohnya adalah kodon AUA, AUC, dan AUU menyandi asam amino isoleusin (Ile).

Sekarang bayangkan apabila suatu kodon GAA mengalami mutasi titik (point mutation). Mutasi ini akan menyebabkan kodon AAG memiliki 9 kemungkinan untuk berubah, yakni menjadi AAA, CAA, GCA, GGA, GTA, GAC, GAG, GAT, dan TAA. Lebih lanjut lagi, hanya mutasi GAA --> GAG yang bersifat synonimous, yakni sama-sama menghasilkan asam glutamat (Glu). Delapan kemungkinan lainnya merupakan mutasi non-synonimous. Nah singkatnya, model evolusi kodon menggunakan distribusi kemungkinan ini untuk diterapkan pada alignment sequence yang ada.

Ada tiga pendekatan yang dilakukan dalam model evolusi kodon ini, yakni pendekatan distance, pendekatan maximum likelihood, dan pendekatan Bayesian. Terlepas dari rincian bagaimana mekanismenya, inti dari setiap pendekatan tersebut adalah untuk mengestimasi nilai beta dan alfa. Selanjutnya, kita dapat menguji apakah terdapat seleksi pada sequence yang kita miliki dengan melakukan uji perbandingan antara dua hipotesis menggunakan Likelihood Ratio Test (LRT). Metode LRT pada prinsipnya adalah menguji signifikansi antara dua hipotesis, yakni H0 = tidak terdapat seleksi (alfa = beta) dan HA = tidak demikian (alfa tidak sama dengan beta). Selanjutnya data yang didasarkan pada H0 dan HA masing-masing diukur nilai likelihood (L) nya. Nilai LRT kemudian dihitung dengan rumus: LRT = 2 (logL HA - logL H0) dan dinyatakan apakah nilainya melewati batas signifikansi atau tidak. Jika ya, berarti H0 ditolak atau singkatnya terjadi seleksi pada sequence yang kita miliki.

Horeee...kira-kira begitulah versi jawaban yang lebih rinci atas pertanyaan yang pertama. Jika kita cukup kurius atau ingin tahu, kita tentu tidak cukup puas dengan jawaban "ada seleksi pada sequence loe bro, trus gue harus bilang WOW gituh...". Jika memang ada seleksi, kita pun lantas mempertanyakan lebih lanjut, "kapan dan dimanakah seleksi itu terjadi pada sequence tersebut"? Ini merupakan pertanyaan nomor dua dan tiga di atas, namun saia berencana akan membahas rincian jawaban atas dua pertanyaan ini pada tulisan berikutnya agar tulisan ini tidak terlalu panjang dan bikin ngantuk. Ditunggu yahhh.

Regards,

Victor Apriel

Senin, 13 Agustus 2012

Sebuah Tulisan Evolusi dan Filogeni: Estimating Selection Pressures on Molecular Sequences

Hai..hai..hai..jumpa lagi bersama Chef Victor dalam Sebuah Tulisan Evolusi dan Filogeni. Setelah lama vakum karena belum menemukan ide untuk menulis, akhirnya saia coba menulis mengenai pengukuran tekanan seleksi terhadap sequence molekular. Well, sebenarnya sih tulisan ini hanya bagian luarnya saja karena saia pun masih belum mengerti seluk-belut nya..heheh. Yaa daripada tidak ada yang bisa ditulis, toh lebih baik menulis apapun yang berhasil dimengerti toh. Okelar, cukup basa-basinya dan selamat menikmati.

Jika pada tulisan sebelumnya kita telah berhasil membuat pohon filogenetik, menguji tingkat kepercayaan, dan kemudian memetakan waktu divergensi; maka akan muncul suatu pertanyaan yang menggelitik dalam benak kita, yakni "bagaimana mereka bisa berdivergensi?". Kita mungkin dapat menjawabnya dengan melakukan analisis sequence DNA dan memetakan substitusi-substitusi yang terjadi diantara daerah dalam aligned sequence dan mempresentasikannya sebagai sebuah pengukuran tekanan seleksi terhadap sequence tersebut. Namun demikian, substitusi pada daerah manakah yang bertanggung jawab dalam proses divergensi antara satu organisme dengan lainnya?

Saia mencoba untuk menjawab pertanyaan diatas dalam 3 tahapan, yakni: (1) Model substitusi kodon; (2) pengukuran laju variasi antar cabang (branch); dan lebih mendalam lagi pada (3) pengukuran laju variasi antar daerah dalam sequence DNA. Model evolusi kodon memberikan kelebihan dibandingkan model evolusi DNA atau protein dalam aspek bahwa kodon merupakan penghubung antara DNA dengan protein. Perubahan nukleotida pada gen struktural dapat atau tidak dapat menyebabkan perubahan pada protein yang disandi bergantung pada kodon yang bersangkutan, sehingga dikenal synonimous substitution dan non-synonimous substitution. Berdasarkan hal ini, kita dapat memperoleh gambaran bagaimana suatu protein target diseleksi, yakni dengan membandingkan rasio laju substitusi non-synonimous terhadap laju substitusi synonimous (b/a = w). Metode perhitungan pada model evolusi kodon terbagi menjadi distance-based approaches dan maximum-likelihood approaches. Dengan kedua metode ini kita dapat mengetahui apakah jenis seleksi terhadap gen tersebut, yakni apakah diversifying (w > 1), netral (w = 1), atau purifying (w < 1).

dimana: b = beta; a = alpha; w = omega


Metode penentuan tekanan seleksi dapat dianalisis dengan baik menggunakan model evolusi kodon dengan segala optimasinya. Namun demikian, hal tersebut tidak memberikan gambaran mengenai tingkat kesetaraan tekanan seleksi di semua titik percabangan (node) dalam pohon filogenetik serta tidak memberikan informasi mengenai posisi kodon yang diseleksi. Kesetaraan tekanan seleksi dalam hal ini dapat dibuktikan dengan penggunaan model evolusi kodon pada setiap titik percabangan, membandingkan nilai antar cabang, dan kemudian memetakannya secara utuh dalam satu kesatuan pohon filogenetik. Lebih mendalam lagi, setelah diketahui tekanan seleksi pada setiap titik percabangan, kita dapat mencari kodon mana yang menjadi target seleksi dalam sequence yang diperbandingkan.

Hmm...okelar sampai segini dulu mengenai apa yang dapat saia ceritakan mengenai analisis tekanan seleksi terhadap sequence molekular. Masih banyak lagi rincian analisis dari setiap tahapan tersebut yang saia sendiri juga masih belum mengerti mekanismenya..heheh.

Regards,
Victor Apriel