Jumat, 28 November 2014

Sebuah Tulisan Evolusi dan Filogeni: Likelihood Mapping Analysis




Hellooo...setelah sekian lama berhibernasi, akhirnya saia KohVic mencoba untuk menulis lagi. Tulisan nya masih mengusung tema yang sama, yakni masih di kisaran evolusi dan filogeni. Ulasan yang akan saia angkat adalah tentang aplikasi lain dari analisis Maximum Likelihood (ML), dimana selain kita dapat merekonstruksi pohon filogenin dengan menggunakan motode tersebut, kita juga dapat melakukan pemetaan likelihood. Mau tau lebih jelasnya, silahkan lanjut baca tulisan di bawah ini yak.



Likelihood Mapping Analysis (LMA) atau yang saia artikan sebagai analisis pemetaan likelihood merupakan salah satu cara alternatif untuk menggali informasi yang lebih banyak dari dataset alignment selain daripada rekonstruksi pohon filogenetik. kalau dalam bahasa resminya sih LMA menggunakan nilai probabilitas posterior dari nilai likelihood tiga pohon unrooted yang dapat dibentuk dari setiap kuartet. Gimana, jelas dengan pernyataan tersebut? Kalau belum, mari kita simak lebih lanjut.



Jadi ceritanya begini. Kalau kita punya sebuah dataset alignment yang mengandung, katakanlah, 30 sequence, kita dapat melakukan LMA dengan tahapan sebagai berikut:



1. Pembentukan kuartet

Jumlah kuartet (set yang terdiri atas 4 sequence) yang dapat dibentuk dari alignment dengan sequence berjumlah n dapat dihitung dengan rumus: n!/4! (n-4)!. jadi, untuk kasus 30 sequence, kita memiliki kominasi kuartet sebanyak: 30!/4! (26)! = (30x29x28x27)/24 = 27405 kuartet. Cukup banyak bukan?



2. Kalkulasi nilai likelihood dari masing-masing kuartet

Setelah semua kuartet dibuat, kemudian masing-masing kuartet tersebut dibuatkan pohon unrooted-nya. Seperti yang telah kita ketahui dari tulisan-tulisan sebelumnya, terdapat tiga buah pohon unrooted yang dapat dibuat dari sebuah kuartet:



(a,b,c,d) = (a,b)-(c,d); (a,c)-(b,d); (a,d)-(b,c)



Masing-masing pohon unrooted tersebut dikalkulasi nilai likelihood nya. Kalkulasi ini tentunya bisa dilakukan dengan cepat dan tanpa masalah, karena jumlah input sequencenya hanya 4 ketimbang 30. Pohon yang mendapatkan nilai likelihood tertinggi kemudian dipetakan dalam likelihood map. Secara sederhananya, proses ini ibarat sebuah voting, dengan kuartet mana yang mendukung topologi pohon yang mana.



3. Zonasi likelihood map

Likelihood map berbentuk sebuah segitiga sama sisi dengan tujuh zona di dalamnya (Gambar 1a). Tiga zona pertama pada sudut-sudut segitiga merupakan zona TREE-LIKE; tiga zona yang berada pada sisi-sisi segitiga merupakan zona NET-LIKE; dan satu zona yang berada di tengah merupakan zona STAR-LIKE (Gambar 1b). Setelah seluruh 27405 kuartet dipetakan ke dalam likelihood map, kita dapat kemudian menentukan apakah data yang kita miliki itu cenderung memberikan informasi kekerabatan dalam bentuk TREE-LIKE, NET-LIKE, atau STAR-LIKE (Gambar 2).

Gambar 1. Likelihood map (a) dan zonasi pada likelihood map (b).

Gambar 2. Distribusi sinyal kuartet yang menentukan bentukan tree-like (kiri), net-like (tengah), atau star-like (kanan).


Kenapa bisa muncul bentukan filogeni tree-, net-, atau star-like? Alasannya ya gampang aja. Proses voting yang dilakukan terhadap seluruh kuartet itu akan menentukan distribusi titik yang pada zona-zona tersebut. Apabila informasi/sinyal hubungan kekerabatan antar sequence cukup kuat (cukup informatif), maka distribusinya akan cenderung mengarah pada sudut-sudut segitiga, artinya tree-like. Apabila terdapat sebagian konflik informasi antara dua topologi pohon, maka distribusinya akan cenderung mengarah ke sisi-sisi segitiga, artinya net-like. Jika konflik informasinya sangat banyak sehingga tidak bisa ditentukan bagaimana topologinya, maka jalan yang paling mudah adalah menggabungkan semua kuartet ke dalam satu zona. Hal ini berarti secara kekerabatan, seluruh sequence terhubung oleh satu titik, itulah star-like.



Dalam konteks filogenetik, tentu kita sangat berharap dataset alignment yang kita miliki memberikan dukungan dalam bentuk tree-like. Namun pada kenyataannya kita tidak selalu mendapatkan itu. Apabila kita mendapatkan hasil berupa net- atau star-like, ada beberapa hal yang harus kita pertimbangkan:



  • Noisy data atau alignment error

Noisy data atau alignment error bisa menjadi penyebab kita mendapatkan bentukan net- atau star-like. Kedua hal ini sangan berhubungan dengan kualitas dataset alignment yang digunakan. alignment dengan jumlah basa yang pendek serta gap atau missing yang terlalu banyak bisa menjadi penyebabnya.



  • Proses evolusi alamiah (rekombinasi atau radiasi adaptif)

Apabila tidak ada masalah dengan kualitas alignment, kita mungkin bisa mempertimbangkan adanya fenomena rekombinasi atau radiasi adaptif yang terjadi di antara sequence yang kita gunakan. Rekombinasi (atau pertukaran-penggabungan gen antar taksa) mengacaukan pola evolusi pada sequence, sehingga mengakibatkan informasi yang bersifat net- atau star-like. Kedua, yakni radiasi adaptif merupakan fenomena alami dimana satu spesies mengalami divergensi menjadi lebih dari dua spesies. hal ini sangat umum terjadi pada virus-virus RNA dan seringkali dikatakan bahwa strain-strain virus baru yang dihasilkan merupakan kumpulan quasi spesies.



Teknik LMA ini dapat dilakukan dengan program TREE-PUZZLE (Strimmer & von haeseler, 1997) yang dapat diunduh secara gratis di http://www.tree-puzzle.de/. Secara konseptual, pemetaan ini mungkin bukanlah hal yang baru, namun cukup menarik untuk studi pendahuluan kualitas sequence dataset yang digunakan sebelum kita mengarah pada analisis filogenetik lain yang lebih mendalam dan juga memakan waktu dan proses komputasi yang lama tentunya. Well, akhir kata, selamat mencoba ^^/


Regards,
KohVic


Reference

Strimmer, K. & A. von haeseler. 1997. Likelihood-mapping: A simple method to visualize phylogenetic content of a sequence alignment. PNAS 94: 6815-6819.


2 komentar:

D mengatakan...

mas, bisa minta no email pean..no email saya.didik_abd@yahoo.co.id...terimakasih...perlu diskusi dengan pean mas..heheh

Victor Aprilyanto mengatakan...

Pak Didik,
Maaf baru membalas komentar bapak. Ya kita bisa berdiskusi Pak. Bisa email saya di vicapr.micro14@gmail.com

Terima kasih.