Jumat, 11 Januari 2013

Sebuah Tulisan Evolusi dan Filogeni: Review Metode Rekonstruksi Filogeni

Tulisan ini saia buat sebagai sebuah tinjauan menyeluruh terhadap metode-metode rekonstruksi pohon filogenetik yang telah dibahas selama ini. Dalam tulisan ini, metode-metode tersebut mencakup Unweighted Pair-Group Method with Arithmethic Mean (UPGMA), Neighbor Joining (NJ), Minimum Evolution (ME), Maximum Parsimony (MP), dan Maximum Likelihood (ML). Dalam tulisan ini saia juga mengasumsikan bahwa para pembaca telah sebelumnya mengetahui tahapan logika masing-masing metode tersebut. Oke, mari kita mulai.

A. Tinjauan Antar Metode
Pertama, saia akan mencoba sekilas membandingkan antar metode yang telah disebutkan di atas. Seperti yang telah kita ketahui bersama, pembagian metode-metode tersebut dapat didasarkan pada jenis data dan metode rekonstruksi pohon. Berdasarkan jenis data, metode UPGMA, NJ, dan ME menggunakan data berupa matriks distance; sedangkan metode MP dan ML menggunakan data character state. Berdasarkan metode rekonstruksi pohon metode UPGMA dan NJ menggunakan pendekatan clustering algorithm yang menghasilkan satu pohon final, sedangkan metode ME, MP, dan ML menggunakan pendekatan optimality search criterion yang menekankan pada evaluasi seluruh kandidat pohon dalam penentuan pohon terbaik menurut kriteria masing-masing metode.

Lebih rinci mengenai logika setiap metode:
1. Unweighted Pair-Group Method with Arithmethic mean (UPGMA)
Mengasumsikan kesamaan laju evolusi antar sequence/OTU sehingga metode ini mengestimasi nilai rerata (menyamaratakan) nilai distance untuk menggabungkan pasangan OTU dan perhitungan branch length.
2. Neighbor Joining (NJ)
Menggunakan logika bahwa pohon terbaik adalah pohon yang meminimalisir nilai tree length yang merupakan penjumlahan dari total branch length. Kondisi ini dicapai dengan konstruksi kombinasi pasangan OTU yang memberikan nilai branch length terkecil (neighbor) diantara seluruh kombinasi yang ada.
3. Minimum Evolution (ME)
Memiliki logika yang sama dengan metode NJ. Perbedaannya terletak pada metode ME menggunakan optimality search criterion sehingga proses penentuan tree length terkecil dilakukan dengan mengevaluasi seluruh kandidat pohon yang mungkin dibuat untuk sejumlah OTU. Dengan demikian, maka metode NJ dapat dipandang sebagai pendekatan heuristik (cepat namun tak menjamin) untuk mendapatkan pohon ME.
4. Maximum Parsimony (MP)
Metode ini memiliki kesamaan konsep dengan metode ME. Namun demikian penentuan pohon dengan tree length terkecil tidak dilakukan berdasarkan matriks distance seperti pada ME. Perhitungan branch length dan tree length pada metode MP didapatkan dari jumlah substitusi minimum antar character state setiap situs pada sequence alignment.
5. Maximum Likelihood (ML)
Metode ini menggunakan perhitungan probabilitas kombinasi seluruh character state ancestral yang dapat memberikan bentukan character state seperti pada sequence alignment yang dimiliki saat ini untuk seluruh situs pada setiap OTU. Metode MP dalam hal ini dapat dipandang sebagai pendekatan heuristik terhadap metode ML karena hanya menggunakan kombinasi character state yang memberikan jumlah substitusi minimum untuk menghasilkan character state sequence yang ada pada saat ini.

Setelah mengenal lima metode di atas, ada beberapa pertanyaan yang kemudian (saia harapkan) muncul di kepala kita, yakni:
- Metode mana yang akan kita pilih?
- Bagaimana kita yakin bahwa pohon yang dihasilkan itu benar?

B. Metode mana yang akan kita pilih?
Kita langsung saja menjawab dari pertanyaan pertama, yakni metode mana yang akan kita pilih untuk merekonstruksi sebuah pohon. Idealnya, kita sebaiknya menggunakan seluruh metode tersebut dan kemudian membandingkan setiap pohon yang dihasilkan untuk melihat adanya kongruensi di antara mereka. Ada pendapat yang mengatakan bahwa jika kualitas data (sequence alignment) yang kita miliki itu baik --belum terkena efek rekombinasi dan substitution saturation-- maka pohon-pohon yang dihasilkan dari setiap metode akan berkongruensi satu sama lain. Namun bagaimana seandainya kita harus memilih satu diantara sekian metode tersebut. Mana yang akan kita pilih?

Well, beberapa pertimbangan praktis tentunya harus dibuat ketika kita menghadapi dengan kenyataan dataset yang ada. Berikut saia akan mencoba merangkum kriteria-kriteria yang perlu dipertimbangan dalam memilih sebuah metode berdasarkan Page & Holmes (1998):
- Efficiency, seberapa cepat waktu komputasi?
- Power, Berapa banyak data yang diperlukan oleh suatu metode agar dapat memberikan hasil yang benar?
- Consistency, Akankah suatu metode memberikan hasil yang benar jika diberikan sejumlah data?
- Robustness, Apakah adanya pelanggaran terhadap asumsi yang ditanamkan pada suatu metode akan membuat metode tersebut memberikan hasil yang salah?
- Falsifiability, Apakah suatu metode akan mengindikasikan bahwa asumsinya telah dilanggar (sehingga kita kemudian disarankan untuk mengganti metode)?

Nei & Kumar (2000) juga menambahkan beberapa kriteria pengujian yang dapat dilakukan terkait perbandingan antar metode:
- Statistical test of phylogenetic trees, Perbandingan antar metode harus dapat dilakukan menggunakan uji statistik seperti interior branch test dan bootstrapping.
- Probability of obtaining the true tree, Merupakan indeks yang dapat dipakai untuk membandingkan peluang dari setiap metode untuk mendapatkan true tree menggunakan data yang ada.
- Reliability of branch length estimates, Merupakan perbandingan nilai branch length yang diestimasi antar metode.

C. Bagaimana kita yakin bahwa pohon yang dihasilkan itu benar?
Sebelum menjawab pertanyaan ini, perkenankan saia memberikan fakta bahwa secara praktis true tree tidak pernah bisa ditemukan. Hal ini disebabkan oleh kenyataan bahwa jumlah kandidat pohon yang perlu dievaluasi meningkat dengan sangat cepat seiring dengan peningkatan jumlah OTU, dan pada akhirnya kita harus melakukan pendekatan heuristik yang tidak menjamin bahwa true tree akan didapatkan. Dengan demikian, tidaklah heran bahwa banyak kontroversi yang muncul seputar pohon yang dipakai untuk menjelaskan hubungan kekerabatan suatu kelompok organisme.

Sedangkal apa yang saia ketahui, ada dua pandangan yang cukup banyak diperdebatkan mengenai kedekatan suatu inferred tree dengan true tree, yakni pandangan parsimony dan pandangan likelihood. Pandangan parsimony menitikberatkan pada konsep bahwa evolusi merupakan proses yang efisien sehingga jika tersedia berbagai jalan untuk menuju ke satu hasil akhir maka jalan terpendeklah yang akan ditempuh. Pandangan ini mengasumsikan bahwa evolusi merupakan sebuah proses yang kompleks sehingga hipotesis yang menggunakan asumsi seminimal mungkin adalah yang paling dapat menjelaskan fenomena evolusi tersebut. Jika dicocokan dengan bukti-bukti evolusi seperti data fosil, pandangan parsimony cocok dengan fenomena evolusi. Namun demikian, kenyataan adanya efek long-branch attarction yang mengakibatkan adanya inkonsistensi metode MP menggunakan data molekular menjadikan pandangan parsimony perlu disikapi dengan lebih hati-hati.

Pandangan likelihood menekankan pada konsep likelihood yang menyatakan bahwa pohon ML merupakan pohon yang paling dapat menjelaskan keragaman sequence yang kita miliki pada saat ini. Sekilas konsep ini cukup meyakinkan bahwa pohon ML bisa jadi merupakan pohon yang mendekati true tree. Namun perlu diperhatikan bahwa konsep likelihood, yakni probabilitas dari suatu pohon untuk memberikan sequence yang dimiliki saat ini, itu tidak berhubungan sama sekali dengan probabilitas bahwa pohon tersebut merupakan pohon yang benar. Saia akan menggambarkannya dengan suatu contoh bahwa jika kita mendengar suara ribut yang begitu kencang di lantai atas, kita bisa menyatakan bahwa ada kerusuhan yang terjadi di sana. Dalam konsep likelihood, kerusuhan (hipotesis) ini sangat mungkin menjelaskan adanya suara ribut (data) yang terjadi di lantai atas. Namun seperti yang kita pikirkan bersama, rasanya sangat sulit untuk mempercayai bahwa kerusuhan itu benar-benar terjadi di lantai atas bukan.

D. Kesimpulan
Berdasarkan uraian yang saia paparkan di atas, terlihat jelas bahwa tidak ada satu pun metode yang mengungguli metode lain secara keseluruhan. Setiap metode memiliki keunggulan dan kerugian masing-masing , sehingga perbandingan seluruh metode dan melihat kongruensi pohon yang dihasilkan dari masing-masing metode merupakan pendekatan ideal untuk setidaknya memuaskan kita akan pencarian true tree.

Referensi
Nei, M. & S. Kumar. 2000. Molecular Evolution and Phylogenetics. Oxford University Press: UK.
Page, R. D. M. & E. C. Holmes. 1998. Molecular Evolution: A Phylogenetic Approach. Blackwell Science Pub.: USA.

Regards
KohVic