Hellooo...setelah sekian lama berhibernasi, akhirnya saia KohVic mencoba
untuk menulis lagi. Tulisan nya masih mengusung tema yang sama, yakni masih di
kisaran evolusi dan filogeni. Ulasan yang akan saia angkat adalah tentang
aplikasi lain dari analisis Maximum Likelihood (ML), dimana selain kita dapat
merekonstruksi pohon filogenin dengan menggunakan motode tersebut, kita juga
dapat melakukan pemetaan likelihood. Mau tau lebih jelasnya, silahkan lanjut
baca tulisan di bawah ini yak.
Likelihood Mapping Analysis (LMA) atau yang saia
artikan sebagai analisis pemetaan likelihood merupakan salah satu cara
alternatif untuk menggali informasi yang lebih banyak dari dataset alignment
selain daripada rekonstruksi pohon filogenetik. kalau dalam bahasa resminya sih
LMA menggunakan nilai probabilitas posterior dari nilai likelihood tiga pohon
unrooted yang dapat dibentuk dari setiap kuartet. Gimana, jelas dengan
pernyataan tersebut? Kalau belum, mari kita simak lebih lanjut.
Jadi ceritanya begini. Kalau kita punya sebuah dataset alignment yang
mengandung, katakanlah, 30 sequence, kita dapat melakukan LMA dengan tahapan
sebagai berikut:
1. Pembentukan kuartet
Jumlah kuartet (set yang terdiri atas 4 sequence) yang dapat dibentuk dari
alignment dengan sequence berjumlah n dapat dihitung dengan rumus: n!/4!
(n-4)!. jadi, untuk kasus 30 sequence, kita memiliki kominasi kuartet sebanyak:
30!/4! (26)! = (30x29x28x27)/24 = 27405 kuartet. Cukup banyak bukan?
2. Kalkulasi nilai likelihood dari masing-masing kuartet
Setelah semua kuartet dibuat, kemudian masing-masing kuartet tersebut
dibuatkan pohon unrooted-nya. Seperti yang telah kita ketahui dari
tulisan-tulisan sebelumnya, terdapat tiga buah pohon unrooted yang dapat dibuat
dari sebuah kuartet:
(a,b,c,d) = (a,b)-(c,d); (a,c)-(b,d); (a,d)-(b,c)
Masing-masing pohon unrooted tersebut dikalkulasi nilai likelihood nya.
Kalkulasi ini tentunya bisa dilakukan dengan cepat dan tanpa masalah, karena
jumlah input sequencenya hanya 4 ketimbang 30. Pohon yang mendapatkan nilai
likelihood tertinggi kemudian dipetakan dalam likelihood map. Secara
sederhananya, proses ini ibarat sebuah voting, dengan kuartet mana yang
mendukung topologi pohon yang mana.
3. Zonasi likelihood map
Likelihood map berbentuk sebuah segitiga sama sisi dengan tujuh zona di
dalamnya (Gambar 1a). Tiga zona pertama pada sudut-sudut segitiga merupakan
zona TREE-LIKE; tiga zona yang berada pada sisi-sisi segitiga merupakan zona
NET-LIKE; dan satu zona yang berada di tengah merupakan zona STAR-LIKE (Gambar
1b). Setelah seluruh 27405 kuartet dipetakan ke dalam likelihood map, kita
dapat kemudian menentukan apakah data yang kita miliki itu cenderung memberikan
informasi kekerabatan dalam bentuk TREE-LIKE, NET-LIKE, atau STAR-LIKE (Gambar
2).
Kenapa bisa muncul bentukan filogeni tree-, net-, atau star-like? Alasannya
ya gampang aja. Proses voting yang dilakukan terhadap seluruh kuartet itu akan
menentukan distribusi titik yang pada zona-zona tersebut. Apabila
informasi/sinyal hubungan kekerabatan antar sequence cukup kuat (cukup
informatif), maka distribusinya akan cenderung mengarah pada sudut-sudut
segitiga, artinya tree-like. Apabila terdapat sebagian konflik informasi antara
dua topologi pohon, maka distribusinya akan cenderung mengarah ke sisi-sisi
segitiga, artinya net-like. Jika konflik informasinya sangat banyak sehingga
tidak bisa ditentukan bagaimana topologinya, maka jalan yang paling mudah
adalah menggabungkan semua kuartet ke dalam satu zona. Hal ini berarti secara
kekerabatan, seluruh sequence terhubung oleh satu titik, itulah star-like.
Dalam konteks filogenetik, tentu kita sangat berharap dataset alignment
yang kita miliki memberikan dukungan dalam bentuk tree-like. Namun pada
kenyataannya kita tidak selalu mendapatkan itu. Apabila kita mendapatkan hasil
berupa net- atau star-like, ada beberapa hal yang harus kita pertimbangkan:
- Noisy data atau alignment error
Noisy data atau alignment error bisa menjadi penyebab
kita mendapatkan bentukan net- atau star-like. Kedua hal ini sangan berhubungan
dengan kualitas dataset alignment yang digunakan. alignment dengan jumlah basa
yang pendek serta gap atau missing yang terlalu banyak bisa menjadi
penyebabnya.
- Proses evolusi alamiah (rekombinasi atau radiasi adaptif)
Apabila tidak ada masalah dengan kualitas alignment, kita mungkin bisa
mempertimbangkan adanya fenomena rekombinasi atau radiasi adaptif yang terjadi
di antara sequence yang kita gunakan. Rekombinasi (atau pertukaran-penggabungan
gen antar taksa) mengacaukan pola evolusi pada sequence, sehingga mengakibatkan
informasi yang bersifat net- atau star-like. Kedua, yakni radiasi adaptif
merupakan fenomena alami dimana satu spesies mengalami divergensi menjadi lebih
dari dua spesies. hal ini sangat umum terjadi pada virus-virus RNA dan
seringkali dikatakan bahwa strain-strain virus baru yang dihasilkan merupakan
kumpulan quasi spesies.
Teknik LMA ini dapat dilakukan dengan program TREE-PUZZLE (Strimmer &
von haeseler, 1997) yang dapat diunduh secara gratis di http://www.tree-puzzle.de/.
Secara konseptual, pemetaan ini mungkin bukanlah hal yang baru, namun cukup
menarik untuk studi pendahuluan kualitas sequence dataset yang digunakan
sebelum kita mengarah pada analisis filogenetik lain yang lebih mendalam dan
juga memakan waktu dan proses komputasi yang lama tentunya. Well, akhir kata,
selamat mencoba ^^/
Regards,
KohVic
Reference
Strimmer, K. & A. von haeseler. 1997. Likelihood-mapping: A simple
method to visualize phylogenetic content of a sequence alignment. PNAS 94:
6815-6819.