Jumat, 11 Maret 2016

Sebuah Tulisan Bioinformatika – Genomika (Part 1)

Seperti yang sudah saia janjikan, pada tulisan kali ini kita akan membahas tentang materi baru yang disebut dengan Genomika (atau istilah dalam bahasa inggrisnya disebut Genomics). Genomika merupakan sebuah ilmu yang mempelajari tentang genom dalam skala besar, yang meliputi pengurutan genom, anotasi, serta perbandingan genom antar organisme satu dengan lainnya. Bidang studi ini juga mencakup tentang studi ekspresi genetik skala genom yang sering disebut dengan transkriptom. Seiring dengan perkembangannya studi transkriptomika ini akan memisah dari genomika menjadi bidang ilmu tersendiri.
Well, cukup dengan pelajaran sejarahnya dan sekarang saia ingin membahas tentang bagian paling pertama yang perlu teman-teman ketahui sebalum beranjak lebih jauh di dalam dunia genomika. Hal tersebut adalah pengurutan DNA. Yaa saia tahu, beberapa teman-teman pembaca pasti sudah bosan mendengarnya di dalam pelajaran biologi molekular. Namun demikian, tanpa kita sadari bahwa perkembangan teknologi pengurutan DNA sekarang ini sangat pesat dan semua itu dilakukan untuk mengejar target pengurutan biaya murah. Pada saat genom manusia selesai diurutakan pada tahun 2003, estimasi total biaya untuk pengurutan sepanjang tiga milyar nukleotida pada saat itu mencapai tiga milyar USD. Secara kasar itu berarti 1 USD per nukleotida. Lalu bagaimana jika seseorang ingin mengurutkan DNA organisme sel tunggal seperti Amoeba dubia yang genomnya sepanjang 670 milyar nukleotida? Nah silahkan hitung sendiri yak. Teknologi pengurutan pada cerita di atas merupakan teknologi pengurutan Sanger (Sanger sequencing) yang berbasis pada metode dideoksi nukleosida trifosfat (ddNTP). Nah teknologi ini menjadi generasi pertama yang mengawali era genomika. Seiring dengan waktu, berbagai sistem pengurutan yang lebih cepat mulai bermunculan. Hingga tulisan ini dibuat, saya dapat mengklasifikasikan berbagai teknologi tersebut ke dalam dua kategori, yakni teknologi pengurutan generasi kedua dan generasi ketiga. Apakah itu dan apa perbedaan antara keduanya?

Teknologi Pengurutan Generasi Kedua

Teknologi pengurutan generasi kedua diciptakan untuk menjawab permasalahan yang dihadapi oleh pengurutan generasi pertama, yakni kecepatan pengurutan. Beberapa sistem pengurutan generasi kedua yang banyak dikenal di antaranya: Roche 454, Life SOLiD/Ion Torrent, Illumina Genome Analyzer (GA) serta MiSeq/NexSeq/HiSeq. Ciri umum yang dimiliki oleh ketiga sistem tesebut adalah pengurutan berbasis amplikon (produk PCR) yang bersifat paralel dan penghasilan bacaan urutan (reads) yang umumnya kurang dari 1000 nukleotida (dibawah 1 kb). Metode pengurutan ketiga sistem ini dalam dibagi ke dalam dua tahap, yakni (i) konstruksi template library genom dan (ii) pengurutan template library genom. Strategi yang digunakan oleh masing-masing pabrikan pun berbeda satu sama lain. Dalam hal konstruksi template library genom, Roche 454 dan Life SOLiD/Ion Torrent menggunakan metode PCR emulsi (emPCR), sedangkan Illumina GA/HiSeq menggunakan metode amplifikasi fase padat (solid-phase amplification).
Gambar 1. Sistem pengurutan generasi kedua yang terdiri atas Roche 454 GS FLX (kiri atas); Life SOLiD (kanan atas); Life IonTorrent (kiri bawah); dan Illumina HiSeq (kanan bawah).

Metode pengurutan ketiga sistem tersebut pada umumnya disebut sebagai sequencing by synthesis (SBS). Namun pada kenyataannya, strategi pengurutan ketiganya berbeda satu sama lain, sehingga penggunaan istilah SBS jadi agak mebingungkan. Roche 454 sebagai pelopor pertama teknologi pengurutan generasi kedua menggunakan metode pengurutan yang bernama pyrosequencing. Metode ini menggunakan bantuan enzim APS sulfurilase dan luciferase untuk memancarkan cahaya setiap kali sebuah nukleotida yang cocok dengan template berhasil dipasangkan. Nukleotida bebas akan dialirkan sejenis demi sejenis dan cahaya yang muncul untuk setiap jenis nukleotida yang dialirkan akan dideteksi. Hal ini membuat urutan basa pada template dapat ditentukan dengan membaca sinyal cahaya pada aliran jenis nukleotida tertentu.
Illumina GA/HiSeq menggunakan metode pengurutan cyclic reversible termination (CRT). Metode ini menggunakan analog nukleotida yang telah diberi penanda fluoresens, biasanya berupa 3’-blocked terminator. Analog nukleotida ini memiliki dua peran, yakni: (i) memberikan sinyal ke detektor tentang nukleotida apa yang dipasangkan ke dalam template dan (ii) memblokir sementara proses pemanjangan urutan template agar sinyal dari nukleotida yang terpasang dapat dibaca oleh detektor. Dengan demikian, reaksi pengurutan dapat dilakukan sedemikian rupa sehingga urutan nukleotida dari template dapat dibaca dari pola urutan sinyal warna yang dihasilkan dari penggabungan analog nukleotida berfluoresens.
Life SOLiD menggunakan pendekatan yang berbeda dari Roche atau Illumina dengan menggunakan metode sequencing by ligation (SBL). Metode ini mengandalkan enzim DNA ligase dan bukan DNA polimerase dalam proses pengurutannya. Tahapan pengurutan dilakukan dengan menggabungkan kombinasi penanda yang telah diketahu jenis nukleotida pada posisi pertama dan kedua (dinamakan sebagai 1,2-probes). Penanda yang cocok dengan urutan template DNA akan diligasikan oleh enzim ligase dan bersamaan dengan itu juga melepaskan molekul fluoresens yang memberikan sinyal warna. Pengembangan berikutnya menghasilkan sistem pengurutan, yang juga oleh Life Technologies, bernama IonTorrent. Serupa dengan metode pyrosequencing, sistem ini memanfaatkan deteksi sinyal urutan per satuan jenis nukleotida. Namun demikian, deteksi sinyal dilakukan berdasarkan perubahan pH yang terjadi selama pengurutan. Ketika ujung 5’ dari sebuah nukleotida bebas dipasangkan ke ujung 3’, ion hidrogen (H+) dilepaskan dari gugus hidroksil ujung 3’ tersebut dan ion ini akan menurunkan pH lingkungan di sekitarnya. Sudah tentu, deteksi pH ini tidak cukup sensitif untuk mendeteksi ion hidrogen dari satu rantai template, sehingga menyebabkan proses pengurutan ini harus dilakukan pada amplikon.
Secara umum, ketiga teknologi pengurutan tersebut mampu memangkas waktu serta biaya yang diperlukan untuk mengurutkan sebuah genom. Namun demikian, terdapat beberapa kelemahan dari seluruh sistem pengurutan tersebut. Penghasilan bacaan urutan yang pendek menghadirkan masalah baru dalam perangkaian kembali untuk menghasilkan sebuah genom utuh. Bayangkan sebuah genom bakteri dengan ukuran 4 juta basa yang diurutkan dengan cakupan 10 kali ukuran genom namun dihadirkan dalam potongan bacaan urutan sepanjang 100 nukleotida. Proses ini akan memberikan sebanyak (4.000.000 x 10)/100 = 400.000 potong bacaan urutan untuk dirangkai satu sama lain sehingga menghasilkan kembali sebuah genom utuh berukuran 4-juta basa. Fakta ini menjadikan perangkaian jigsaw puzzle menjadi hobi yang sangat mudah, mengingat kita pasti menggunakan gambar utuh pada kotak puzzle tersebut untuk memandu perangkaiannya. Kelemahan berikutnya adalah ketergantungan seluruh sistem pengurutan pada produk PCR. Seperti yang telah diketahui, enzim DNA polimerase cukup sering membuat kesalahan pemasangan basa selama proses pengurutan, kira-kira pada skala 1 dalam 1.000.000 basa. Kesalahan ini selain menambahkan kesulitan dalam proses perangkaian genom juga berpotensi untuk kemudian dianggap sebagai polimorfisme nukleotida tunggal (single nucleotide polymorphism, SNP). Berbagai kelemahan tersebut menuntut pengembangan teknologi pengurutan generasi berikutnya yang akan dibahas lebih lanjut.

Teknologi Pengurutan Generasi Ketiga
Dengan berbagai kelemahan yang terdapat pada teknologi pengurutan generasi kedua, teknologi pengurutan generasi ketiga pun dikembangkan untuk menyediakan solusi terhadap berbagai kelemahan tersbeut. Terdapat tiga kriteria yang membuat sebuah sistem pengurutan digolongkan sebagai generasi ketiga. Kriteria pertama adalah sistem tersebut harus dapat melakukan pengurutan dengan menggunakan template urutan tunggal dan bukan amplikon hasil PCR. Hal ini berarti sistem tersebut dapat menghilangkan tahapan PCR dalam konstruksi template library genom namun harus cukup sensitif untuk mendeteksi sinyal pengurutan pada skala satu molekul template. Kriteria berikutnya adalah sistem pengurutan generasi ketiga harus dapat menghasilkan bacaan urutan dengan panjang minimal 1.000 basa (1 kb). Hmm..tentunya ini kabar menggembirakan untuk mereka yang berkutat dalam pengembangan algoritma perangkaian genom yak. Kriteria ketiga yang tentunya menjadi titik unggul dari teknologi generasi ketiga ini adalah kemampuannya untuk melakukan pengurutan secara real-time, atau dengan kata lain kita dapat melihat secara langsung bacaan urutan yang dihasilkan bersamaan dengan proses pengurutan yang sedang berlangsung.

Gambar 2. Sistem pengurutan DNA generasi ketiga, Pacific Biosciences RS II (kiri) dan Oxford Nanopore Technologies MinION MkII (kanan).

Dua pabrikan yang sudah mengembangkan teknologi pegurutan generasi ketiga di antaranya adalah Pacific Biosciences (PacBio) dengan produknya yang bernama RS II dan Oxford Nanopore Technologies (ONT) dengan produknya yang bernama MinION MkII. PacBio RS II menerapkan pengembangan teknologi deteksi sinyal cahaya yang bernama zero-mode waveguide (ZMW). Teknologi ZMW ini sangat sensitif dalam menangkap sinyal fluoresensi bahkan pada tingkat template molekul tunggal. Metode pengurutan yang diterapkan dalam PacBio RS II adalah dengan mengikatkan enzim DNA polimerase yang telah direkayasa sedemikian rupa ke dalam sebuah pelat ZMW dengan lubang-lubang ukuran nano sedemikian rupa sehingga hanya terdapat satu buah enzim dalam setiap lubang. Setelah itu, molekul DNA template beserta analog nukleotida bebas dengan penanda fluoresens ditambahkan ke pelat ZMW tersebut sehingga membuat enzim DNA polimerase dapat menjalankan reaksinya. Selama reaksi berlangsung, enzim DNA polimerase akan menggabungkan molekul analog nukleotida ke dalam template dengan nukleotida yang komplementer. Setiap kali enzim polimerase menggabungkan analog nukleotida, penanda fluoresense akan terlepas dan menghasilkan sinyal warna yang spesifik untuk setiap jenis nukleotida. Sinyal warna ini akan langsung dibaca oleh detektor yang terdapat di bawah pelat ZMW dan kemudian diterjemahkan sebagai sinyal nukleotida. Proses pengurutan dengan cara ini juga mampu menghasilkan urutan yang cukup panjang, umumnya pada kisaran 3 kb hingga 5 kb.
Oxford Nanopore Technologies MinION MkII, seperti yang diindikasikan oleh namanya, menggunakan teknologi nanopori untuk mengurutkan DNA. Penerapan teknologi ini didasarkan pada temuan sebuah protein membran bernama alfa-hemolysin yang dapat memasukkan untai DNA ke dalam sel. Dengan mengaplikasikan arus listrik pada membran sel, proses masuknya untai DNA ini diharapkan dapat mengganggu aliran arus listrik sedemikian rupa sehingga polanya dapat diterjemahkan ke dalam urutan nukleotida. Membran nanopori tersebut kemudian disempurnakan lebih lanjut sehingga mampu memberikan resolusi yang lebih jelas dan tegas urutan nukleotida yang melewatinya. Teknologi ini tidak membutuhkan enzim polimerase atau molekul nukleotida dengan penanda fluoresens. Secara teoritis, panjang bacaan urutan yang dihasilkan juga hanya dibatasi oleh panjang untai template yang dimasukkan. Beberapa penelitian yang menggunakan ONT MinION MkII melaporkan panjang bacaan urutan yang dihasilkan mampu mencapai 98 kb, namun rata-rata pada kisaran 10 kb. Selain daripada itu, kebutuhan arus listrik yang kecil juga membuat dimensi fisik mesin pengurut DNA ini jauh lebih kecil dibanding yang lain, yakni hanya sedikit lebih besar dari USB flashdrive yang kita lihat sehari-hari. Hal ini memberikan keunggulan karena sistem pengurutan ONT MinION dapat dibawa ke lapangan untuk pengurutan DNA secara langsung. Virus Ebola menjadi salah satu yang genomnya diurutkan dengan sistem ini. Namun demikian, berbagai studi yang membandingkan sistem pengurutan memberikan gambaran bahwa akurasi bacaaan urutan ONT MinION termasuk yang paling kecil dibanding yang lainnya. Faktor tersebut yang sepertinya membatasi penggunaan MinION hanya pada pengurutan genom bakteri dan virus saja. Namun untuk ke depannya, tidak menutup kemungkinan bahwa ONT akan mengembangkan sistem pengurutan serupa yang sudah mampu diaplikasikan kepada genom eukariot atau bahkan mamalia dan tumbuhan.
Secara umum, teknologi pengurutan DNA generasi ketiga telah mampu menjawab kelemahan yang terdapat pada teknologi generasi sebelumnya. Namun bukan berarti bahwa pengembangannya hanya akan berhenti sampai disini saja. Generasi selanjutnya dari teknologi pengurutan ini akan terus menyempurnakan kelemahan dari generasi sebelumnya. Pada suatu saat di masa depan, bukannya tidak mungkin bahwa sebuah teknologi pengurutan mampu mengurutkan untai DNA dari ujung satu hingga ke ujung lain dalam sekali jalan, memberikan bacaan dengan akurasi tinggi, serta waktu pengurutan per genom yang lebih cepat. Impian tentang 1000 USD per genom sebentar lagi akan, atau mungkin, sudah tercapai pada saat ini.



Penutup
Oke, saya rasa cukup sampai disini dulu tulisan tentang teknologi pengurutan DNA-nya. Pada tulisan berikutnya saia akan coba membahas tentang bagaimana merangkai potongan-potongan bacaan urutan DNA tersebut agar kita bisa mendapatkan sebuah genom utuh serta apa saja tantangan dalam proses perangkaiannya. Ditunggu yak!!!



Victor Aprilyanto


 

Bacaan Lanjutan
Ulasan yang bagus mengenai perbandingan antar sistem pengurutan dapat dibaca pada Metzker (2010). Ulasan tersebut juga dilengkapi dengan ilustrasi yang mendetail untuk setiap metode yang digunakan. Saya sangat menyarankan untuk membaca Metzker (2010) bagi teman-teman yang ingin memahami lebih lanjut mengenai teknologi pengurutan DNA karena rincian yang lebih dalam dari setiap metode tidak dibahas dalam tulisan ini. Artikel lainnya yang saya cantumkan adalah publikasi pertama dari teknologi pengurutan yang dibahas di atas

Metzker, M. L. 2010. Sequencing technologies - the next generation. Nature Reviews Genetics 11: 31-46.
Eid, J., A. Fehr, J. Gray, K. Luong, J. Lyle, G. Otto, P. Peluso, D. Rank, P. Baybayan, B. Bettmann, A. Bibillo, K. Bjornson, B. Chaudhuri, F. Christians, R. Cicero et al. 2009. Real-time DNA sequencing from single polymerase molecules. Science 323 (5910): 133–138.
Branton, D., D. W. Deamer, A. Marziali, H. Bayley, S. A. Benner, T. Butler, M. DiVentra, S. Garaj, A. Hibbs, X. Huang, S. B. Jovanovich, P. S. Krstic, S. Lindsay, X. S. Ling, C. H. Mastrangelo et al. 2008. The potential and challenges of nanopore sequencing. Nature Biotechnology 26 (10): 1146–1153.
Margulies, M., M. Egholm, W. E. Altman, S. Attiya, J. S. Bader, L. A. Bemben, J. Berka, M. S. Braverman, Y-J. Chen, Z. Chen, S. B. Dewell, L. Du, J. M. Fierro, X. V. Gomes, B. C.Godwin et al. 2005. Genome sequencing in microfabricated high-density picolitre reactors. Nature 437: 376–380.
Quick, J. et al. 2016. Real-time, portable genome sequencing for Ebola surveillance. Nature 530: 228-232.
Shendure, J., G. J. Porreca, N. B. Reppas, X. Lin, J. P. McCutcheon, A. M. Rosenbaum, M. D. Wang, K. Zhang, R. D. Mitra, & G. M. Church. 2005. Accurate multiplex polony sequencing of an evolved bacterial genome. Science 309 (5741): 1728–1732.
Valouev, A., J. Ichikawa, T. Tonthat, J. Stuart, S. Ranade, H. Reckham, K. Zeng, J. A. Malek, G. Costa, K. McKernan, A. Sidow, A. Fire, & S. M. Johnson. 2008. A high-resolution, nucleosome position map of C. elegans reveals a lack of universal sequence-dictated positioning. Genome Research 18: 1051-1063.

1 komentar:

Tectona grandis mengatakan...

Keren bro..ditunggu tulisan berikutnya. Mbk Hana papua