Senin, 14 Maret 2016

Sebuah Tulisan Bioinformatika – Genomika (Part 2)

Setelah kita mempelajari sekilas tentang teknologi pengurutan DNA pada Part 1, saya berharap teman-teman mendapatkan gambaran tentang bagaimana proses pengurutan DNA pada skala genom dilakukan. Hmm…tapi tidak ada salahnya jika saia review sedikit agar para teman-teman pembaca mendapatkan dasar-dasar yang diperlukan untuk memahami Part 2 ini. Teknologi pengurutan DNA, kendati sudah mengalami banyak kemajuan pesat, masih belum dapat mengurutkan DNA secara ideal. Ya, secara ideal yang saia maksud adalah mengurutkan untai DNA dari satu ujung ke ujung yang lain. Prosedur umum dari pengurutan DNA genom saat ini adalah memotong-motong DNA genom menjadi jutaan potongan kecil dan kemudian mengurutkan semuanya secara paralel sebanyak beberapa kali. Perlu diperhatikan disini bahwa prosesnya tidak hanya melibatkan satu genom saja, melainkan banyak genom karena ekstraksi DNA dilakukan terhadap banyak sel dari sebuah spesies. Dengan demikian, mesin pengurut DNA yang saia ceritakan pada Part 1 akan mengurutkan DNA genom sebanyak beberapa kali namun menyajikan hasil urutannya dalam bentuk jutaan potongan kecil yang perlu dirangkai satu sama lain sebelum menjadi sebuah genom utuh. Perangkaian bacaan (reads) hasil pengurutan genom dapat dianalogikan seperti pada merangkai potongan puzzle, namun sedikit lebih sulit. Bayangkan kita memiliki 10 kotak jigsaw puzzle untuk gambar yang sama, tumpahkan dan campur semua isinya, lalu coba rangkai satu demi satu hingga menjadi sebuah gambar utuh.
Dapat bayangannya? Oke sekarang kita menuju ke kasus nyata. Bayangkan kita memiliki genom TAATGCCATGGGATGTT yang dipecah dan diurutkan menjadi potongan bacaan berjumlah tiga nukleotida (trimer) berikut: TAA, AAT, ATG, TGC, GCC, CCA, CAT, ATG, TGG, GGG, GGA, GAT, ATG, TGT, dan GTT. Perhatikan pola setiap trimer tersebut baik-baik dan kita akan mengetahui bahwa trimer kedua bertumpang-tindih dengan trimer pertama sebanyak dua nukleotida. So, merangkai trimer-trimer tersebut menjadi sebuah genom utuh? Ya mudah saja. Jajarkan saja trimer satu yang bertumpang tindih dengan lainnya dan kita akan segera mendapatkan urutan genomnya. Kelihatannya mudah memang, tapi kita lupa bahwa kita dapat melakukannya semudah itu karena adanya dua asumsi. Pertama, kita telah mengetahui terlebih dulu urutan genomnya. Kedua, trimer-trimer tersebut telah diurutkan sedemikian rupa sehingga trimer pertama pasti bertumpang-tindih dengan trimer kedua dan seterusnya. Pada kasus perangkaian genom yang sebenarnya, kedua asumsi di atas tidak ada (Gambar 1). Jadi, apakah kita masih bisa merangkai genom tersebut?
Gambar 1. Kita dapat dengan mudah merangkai genom jika kita memiliki panduan berupa urutan genom itu sendiri dan bacaan urutan yang saling tumpang tindih satu sama lainnya secara berurutan (kiri). Perangkaian genom akan lebih sulit tanpa adanya urutan genom dan bacaan urutan yang teracak satu sama lain (kanan).

 Sebelum beranjak ke teknik perangkaian genom, perkenankan saia untuk mengenalkan beberapa istilah teknisnya. Setiap bacaan urutan dengan panjang k nukleotida akan kemudian disebut sebagai kmer. Contoh di atas menggunakan bacaan berjumlah tiga nukleotida yang disebut trimer atau 3-mer. Selanjutnya, kita akan mendefinisikan awalan dan akhiran dari sebuah kmer. Awalan kmer didefinisikan sebagai kmer–1 yang diambil dari awal; sedangkan akhiran kmer didefinisikan sebagai kmer–1 yang diambil dari akhir. Sebagai contoh, sebuah 3-mer TAA memiliki awalan TA dan akhiran AT. Teknik perangkaian genom yang akan diceritakan pada paragraf selanjutnya menggunakan apa yang disebut sebagai teori grafik (graph theory). Grafik yang dimaksud ini bukanlah grafik Cartesian dengan sumbu x dan y, melainkan sebuah peta hubungan antara nodus (nodes) dengan garis (edges).
Oke, sekarang kita mulai teknik perangkaiannya. Perangkaian genom dari bacaan urutan (reads) dilakukan dalam dua tahap, yakni: (i) konstruksi grafik de Bruijn dan (ii) penelusuran grafik de Bruijn untuk menghasilkan jalur Eulerian. Kita mulai dari yang pertama dulu, yaitu konstruksi grafik de Bruijn. Saia sendiri kesulitan menuliskan definisi formalnya, tapi intinya grafik de Bruijn merupakan grafik yang merepresentasikan keseluruhan kmer dalam bentuk nodus dan garis dengan jumlah minimum. Dalam kasus ini, kita ingin setiap bacaan urutan direpresentasikan oleh sebuah garis, sehingga kedua nodus yang dihubungkan oleh garis tersebut adalah awalan dan akhiran dari sebuah kmer (Gambar 2). Selanjutnya, kita dapat melihat bahwa terdapat nodus akhiran dari sebuah 3-mer yang identik dengan nodus awalan 3-mer yang lain. Jika kita menemukan ini, kita dapat menyatukannya sehingga pada akhirnya akan terbentuk sebuah jalinan antar 3-mer yang direpresentasikan oleh nodus awalan dan akhiran. Pada Gambar 2, hanya 3-mer ujung awal yang nodus awalannya tidak identik dengan nodus akhir 3-mer manapun dan begitu juga sebaliknya untuk 3-mer ujung akhir.
Gambar 2. Membuat nodus awalan dan akhiran dari seluruh 3-mer dan kemudian menyambungkannya satu sama lain jika nodus akhiran dari 3-mer yang satu identik dengan nodus awalan dari 3-mer lainnya.

Nah setelah seluruh 3-mer terjalin, bukankah masalahnya sudah selesai? Kita hanya perlu ‘membaca’ seluruh 3-mer tersebut dari ujung awal hingga ujung akhir untuk mendapatkan urutan genomnya bukan? Well, jika genom organisme hanya terdiri dari 17 nukleotida dan dapat terwakilkan oleh hanya 15 3-mer seperti pada Gambar 2, maka masalah memang selesai. Namun pada kenyataannya, genom bakteri yang berukuran kecil pun dapat menghasilkan jutaan kmer. Jadi dalam kasus ini peran grafik de Bruijn adalah mempersingkat jalinan antar kmer pada Gambar 2 namun tetap mempertahankan informasinya sehingga algoritma yang dirancang untuk perangkaian bacaan menjadi genom dapat berjalan dengan cepat. Sekarang coba perhatikan bahwa meskipun seluruh nodus telah terjalin satu sama lain, masih terdapat nodus-nodus yang identik satu dengan lainnya. Kita dapat menyatukan nodus-nodus tersebut untuk mengkonstruksi grafik de Bruijn (Gambar 3).  Nah sampai disini, tahap 1 telah selesai. Berikutnya adalah tahap 2, yakni mencari jalur di dalam grafik de Bruijn tersebut yang bersifat Eulerian. Sebuah jalur (path) bersifat Eulerian jika dan hanya jika jalur tersebut menelusuri seluruh garis di dalam grafik sebanyak persis satu kali. Jika kita mencobanya pada grafik de Bruijn yang baru saja kita konstruksi, kita akan mendapatkan contoh jalur Eulerian seperti pada Gambar 4.

Gambar 3. Konstruksi grafik de Bruijn dengan menyatukan lebih banyak nodus-nodus yang identik.



Gambar 4. Ikuti jalur Eulerian dan rangkai genomnya!

Hingga pada tahap ini kita telah selesai mengkonstruksi genom contoh kita. Tentunya konstruksi ini merupakan contoh yang sangat sederhana dan saia berani jamin tidak akan ada kasus perangkaian genom di dunia nyata yang sesederhana ini. Pada kenyataannya, beberapa kendala yang kerap muncul selama perangkaian genom adalah kendala ketidaklengkapan bacaan urutan yang diberikan oleh mesin pengurut DNA. Kesalahan pengurutan, sesuatu yang cukup sering dilakukan oleh mesin pengurut DNA, juga turut mempersulit perangkaian karena berpotensi mengarahkan pada rangkaian genom yang salah. Panjang kmer juga turut berperan dalam menentukan apakah kompleksitas grafik de Bruijn. Perhatikan baik-baik Gambar 4 dan kita akan menyadari bahwa ada jalur alternatif yang juga bersifat Eulerian namun memberikan hasil akhir urutan genom yang salah. Well, keseluruhan kendala ini akan saia bahas pada cerita berikutnya yak. Kepanjangan kalau dibahas sekalian disini…hehehe. So stay tuned!!



Victor Aprilyanto



Bacaan Lanjutan
Compeau, P. E. C. & P. A. Pevzner. 2015. Bioinformatics Algorithms: An Active Learning Approach 2nd Edition, Vol. 1. Active Learning Pub.: USA.
Compeau, P. E. C., P. A. Pevzner, & G. Tesler. 2011. How to apply de Bruijn graphs to genome assembly. Nature Biotechnology 29: 987-991.
Jones, N. C. & P. A. Pevzner. 2004. An introduction to Bioinformatics Algorithms. MIT Press Pub.: USA.

Jumat, 11 Maret 2016

Sebuah Tulisan Bioinformatika – Genomika (Part 1)

Seperti yang sudah saia janjikan, pada tulisan kali ini kita akan membahas tentang materi baru yang disebut dengan Genomika (atau istilah dalam bahasa inggrisnya disebut Genomics). Genomika merupakan sebuah ilmu yang mempelajari tentang genom dalam skala besar, yang meliputi pengurutan genom, anotasi, serta perbandingan genom antar organisme satu dengan lainnya. Bidang studi ini juga mencakup tentang studi ekspresi genetik skala genom yang sering disebut dengan transkriptom. Seiring dengan perkembangannya studi transkriptomika ini akan memisah dari genomika menjadi bidang ilmu tersendiri.
Well, cukup dengan pelajaran sejarahnya dan sekarang saia ingin membahas tentang bagian paling pertama yang perlu teman-teman ketahui sebalum beranjak lebih jauh di dalam dunia genomika. Hal tersebut adalah pengurutan DNA. Yaa saia tahu, beberapa teman-teman pembaca pasti sudah bosan mendengarnya di dalam pelajaran biologi molekular. Namun demikian, tanpa kita sadari bahwa perkembangan teknologi pengurutan DNA sekarang ini sangat pesat dan semua itu dilakukan untuk mengejar target pengurutan biaya murah. Pada saat genom manusia selesai diurutakan pada tahun 2003, estimasi total biaya untuk pengurutan sepanjang tiga milyar nukleotida pada saat itu mencapai tiga milyar USD. Secara kasar itu berarti 1 USD per nukleotida. Lalu bagaimana jika seseorang ingin mengurutkan DNA organisme sel tunggal seperti Amoeba dubia yang genomnya sepanjang 670 milyar nukleotida? Nah silahkan hitung sendiri yak. Teknologi pengurutan pada cerita di atas merupakan teknologi pengurutan Sanger (Sanger sequencing) yang berbasis pada metode dideoksi nukleosida trifosfat (ddNTP). Nah teknologi ini menjadi generasi pertama yang mengawali era genomika. Seiring dengan waktu, berbagai sistem pengurutan yang lebih cepat mulai bermunculan. Hingga tulisan ini dibuat, saya dapat mengklasifikasikan berbagai teknologi tersebut ke dalam dua kategori, yakni teknologi pengurutan generasi kedua dan generasi ketiga. Apakah itu dan apa perbedaan antara keduanya?

Teknologi Pengurutan Generasi Kedua

Teknologi pengurutan generasi kedua diciptakan untuk menjawab permasalahan yang dihadapi oleh pengurutan generasi pertama, yakni kecepatan pengurutan. Beberapa sistem pengurutan generasi kedua yang banyak dikenal di antaranya: Roche 454, Life SOLiD/Ion Torrent, Illumina Genome Analyzer (GA) serta MiSeq/NexSeq/HiSeq. Ciri umum yang dimiliki oleh ketiga sistem tesebut adalah pengurutan berbasis amplikon (produk PCR) yang bersifat paralel dan penghasilan bacaan urutan (reads) yang umumnya kurang dari 1000 nukleotida (dibawah 1 kb). Metode pengurutan ketiga sistem ini dalam dibagi ke dalam dua tahap, yakni (i) konstruksi template library genom dan (ii) pengurutan template library genom. Strategi yang digunakan oleh masing-masing pabrikan pun berbeda satu sama lain. Dalam hal konstruksi template library genom, Roche 454 dan Life SOLiD/Ion Torrent menggunakan metode PCR emulsi (emPCR), sedangkan Illumina GA/HiSeq menggunakan metode amplifikasi fase padat (solid-phase amplification).
Gambar 1. Sistem pengurutan generasi kedua yang terdiri atas Roche 454 GS FLX (kiri atas); Life SOLiD (kanan atas); Life IonTorrent (kiri bawah); dan Illumina HiSeq (kanan bawah).

Metode pengurutan ketiga sistem tersebut pada umumnya disebut sebagai sequencing by synthesis (SBS). Namun pada kenyataannya, strategi pengurutan ketiganya berbeda satu sama lain, sehingga penggunaan istilah SBS jadi agak mebingungkan. Roche 454 sebagai pelopor pertama teknologi pengurutan generasi kedua menggunakan metode pengurutan yang bernama pyrosequencing. Metode ini menggunakan bantuan enzim APS sulfurilase dan luciferase untuk memancarkan cahaya setiap kali sebuah nukleotida yang cocok dengan template berhasil dipasangkan. Nukleotida bebas akan dialirkan sejenis demi sejenis dan cahaya yang muncul untuk setiap jenis nukleotida yang dialirkan akan dideteksi. Hal ini membuat urutan basa pada template dapat ditentukan dengan membaca sinyal cahaya pada aliran jenis nukleotida tertentu.
Illumina GA/HiSeq menggunakan metode pengurutan cyclic reversible termination (CRT). Metode ini menggunakan analog nukleotida yang telah diberi penanda fluoresens, biasanya berupa 3’-blocked terminator. Analog nukleotida ini memiliki dua peran, yakni: (i) memberikan sinyal ke detektor tentang nukleotida apa yang dipasangkan ke dalam template dan (ii) memblokir sementara proses pemanjangan urutan template agar sinyal dari nukleotida yang terpasang dapat dibaca oleh detektor. Dengan demikian, reaksi pengurutan dapat dilakukan sedemikian rupa sehingga urutan nukleotida dari template dapat dibaca dari pola urutan sinyal warna yang dihasilkan dari penggabungan analog nukleotida berfluoresens.
Life SOLiD menggunakan pendekatan yang berbeda dari Roche atau Illumina dengan menggunakan metode sequencing by ligation (SBL). Metode ini mengandalkan enzim DNA ligase dan bukan DNA polimerase dalam proses pengurutannya. Tahapan pengurutan dilakukan dengan menggabungkan kombinasi penanda yang telah diketahu jenis nukleotida pada posisi pertama dan kedua (dinamakan sebagai 1,2-probes). Penanda yang cocok dengan urutan template DNA akan diligasikan oleh enzim ligase dan bersamaan dengan itu juga melepaskan molekul fluoresens yang memberikan sinyal warna. Pengembangan berikutnya menghasilkan sistem pengurutan, yang juga oleh Life Technologies, bernama IonTorrent. Serupa dengan metode pyrosequencing, sistem ini memanfaatkan deteksi sinyal urutan per satuan jenis nukleotida. Namun demikian, deteksi sinyal dilakukan berdasarkan perubahan pH yang terjadi selama pengurutan. Ketika ujung 5’ dari sebuah nukleotida bebas dipasangkan ke ujung 3’, ion hidrogen (H+) dilepaskan dari gugus hidroksil ujung 3’ tersebut dan ion ini akan menurunkan pH lingkungan di sekitarnya. Sudah tentu, deteksi pH ini tidak cukup sensitif untuk mendeteksi ion hidrogen dari satu rantai template, sehingga menyebabkan proses pengurutan ini harus dilakukan pada amplikon.
Secara umum, ketiga teknologi pengurutan tersebut mampu memangkas waktu serta biaya yang diperlukan untuk mengurutkan sebuah genom. Namun demikian, terdapat beberapa kelemahan dari seluruh sistem pengurutan tersebut. Penghasilan bacaan urutan yang pendek menghadirkan masalah baru dalam perangkaian kembali untuk menghasilkan sebuah genom utuh. Bayangkan sebuah genom bakteri dengan ukuran 4 juta basa yang diurutkan dengan cakupan 10 kali ukuran genom namun dihadirkan dalam potongan bacaan urutan sepanjang 100 nukleotida. Proses ini akan memberikan sebanyak (4.000.000 x 10)/100 = 400.000 potong bacaan urutan untuk dirangkai satu sama lain sehingga menghasilkan kembali sebuah genom utuh berukuran 4-juta basa. Fakta ini menjadikan perangkaian jigsaw puzzle menjadi hobi yang sangat mudah, mengingat kita pasti menggunakan gambar utuh pada kotak puzzle tersebut untuk memandu perangkaiannya. Kelemahan berikutnya adalah ketergantungan seluruh sistem pengurutan pada produk PCR. Seperti yang telah diketahui, enzim DNA polimerase cukup sering membuat kesalahan pemasangan basa selama proses pengurutan, kira-kira pada skala 1 dalam 1.000.000 basa. Kesalahan ini selain menambahkan kesulitan dalam proses perangkaian genom juga berpotensi untuk kemudian dianggap sebagai polimorfisme nukleotida tunggal (single nucleotide polymorphism, SNP). Berbagai kelemahan tersebut menuntut pengembangan teknologi pengurutan generasi berikutnya yang akan dibahas lebih lanjut.

Teknologi Pengurutan Generasi Ketiga
Dengan berbagai kelemahan yang terdapat pada teknologi pengurutan generasi kedua, teknologi pengurutan generasi ketiga pun dikembangkan untuk menyediakan solusi terhadap berbagai kelemahan tersbeut. Terdapat tiga kriteria yang membuat sebuah sistem pengurutan digolongkan sebagai generasi ketiga. Kriteria pertama adalah sistem tersebut harus dapat melakukan pengurutan dengan menggunakan template urutan tunggal dan bukan amplikon hasil PCR. Hal ini berarti sistem tersebut dapat menghilangkan tahapan PCR dalam konstruksi template library genom namun harus cukup sensitif untuk mendeteksi sinyal pengurutan pada skala satu molekul template. Kriteria berikutnya adalah sistem pengurutan generasi ketiga harus dapat menghasilkan bacaan urutan dengan panjang minimal 1.000 basa (1 kb). Hmm..tentunya ini kabar menggembirakan untuk mereka yang berkutat dalam pengembangan algoritma perangkaian genom yak. Kriteria ketiga yang tentunya menjadi titik unggul dari teknologi generasi ketiga ini adalah kemampuannya untuk melakukan pengurutan secara real-time, atau dengan kata lain kita dapat melihat secara langsung bacaan urutan yang dihasilkan bersamaan dengan proses pengurutan yang sedang berlangsung.

Gambar 2. Sistem pengurutan DNA generasi ketiga, Pacific Biosciences RS II (kiri) dan Oxford Nanopore Technologies MinION MkII (kanan).

Dua pabrikan yang sudah mengembangkan teknologi pegurutan generasi ketiga di antaranya adalah Pacific Biosciences (PacBio) dengan produknya yang bernama RS II dan Oxford Nanopore Technologies (ONT) dengan produknya yang bernama MinION MkII. PacBio RS II menerapkan pengembangan teknologi deteksi sinyal cahaya yang bernama zero-mode waveguide (ZMW). Teknologi ZMW ini sangat sensitif dalam menangkap sinyal fluoresensi bahkan pada tingkat template molekul tunggal. Metode pengurutan yang diterapkan dalam PacBio RS II adalah dengan mengikatkan enzim DNA polimerase yang telah direkayasa sedemikian rupa ke dalam sebuah pelat ZMW dengan lubang-lubang ukuran nano sedemikian rupa sehingga hanya terdapat satu buah enzim dalam setiap lubang. Setelah itu, molekul DNA template beserta analog nukleotida bebas dengan penanda fluoresens ditambahkan ke pelat ZMW tersebut sehingga membuat enzim DNA polimerase dapat menjalankan reaksinya. Selama reaksi berlangsung, enzim DNA polimerase akan menggabungkan molekul analog nukleotida ke dalam template dengan nukleotida yang komplementer. Setiap kali enzim polimerase menggabungkan analog nukleotida, penanda fluoresense akan terlepas dan menghasilkan sinyal warna yang spesifik untuk setiap jenis nukleotida. Sinyal warna ini akan langsung dibaca oleh detektor yang terdapat di bawah pelat ZMW dan kemudian diterjemahkan sebagai sinyal nukleotida. Proses pengurutan dengan cara ini juga mampu menghasilkan urutan yang cukup panjang, umumnya pada kisaran 3 kb hingga 5 kb.
Oxford Nanopore Technologies MinION MkII, seperti yang diindikasikan oleh namanya, menggunakan teknologi nanopori untuk mengurutkan DNA. Penerapan teknologi ini didasarkan pada temuan sebuah protein membran bernama alfa-hemolysin yang dapat memasukkan untai DNA ke dalam sel. Dengan mengaplikasikan arus listrik pada membran sel, proses masuknya untai DNA ini diharapkan dapat mengganggu aliran arus listrik sedemikian rupa sehingga polanya dapat diterjemahkan ke dalam urutan nukleotida. Membran nanopori tersebut kemudian disempurnakan lebih lanjut sehingga mampu memberikan resolusi yang lebih jelas dan tegas urutan nukleotida yang melewatinya. Teknologi ini tidak membutuhkan enzim polimerase atau molekul nukleotida dengan penanda fluoresens. Secara teoritis, panjang bacaan urutan yang dihasilkan juga hanya dibatasi oleh panjang untai template yang dimasukkan. Beberapa penelitian yang menggunakan ONT MinION MkII melaporkan panjang bacaan urutan yang dihasilkan mampu mencapai 98 kb, namun rata-rata pada kisaran 10 kb. Selain daripada itu, kebutuhan arus listrik yang kecil juga membuat dimensi fisik mesin pengurut DNA ini jauh lebih kecil dibanding yang lain, yakni hanya sedikit lebih besar dari USB flashdrive yang kita lihat sehari-hari. Hal ini memberikan keunggulan karena sistem pengurutan ONT MinION dapat dibawa ke lapangan untuk pengurutan DNA secara langsung. Virus Ebola menjadi salah satu yang genomnya diurutkan dengan sistem ini. Namun demikian, berbagai studi yang membandingkan sistem pengurutan memberikan gambaran bahwa akurasi bacaaan urutan ONT MinION termasuk yang paling kecil dibanding yang lainnya. Faktor tersebut yang sepertinya membatasi penggunaan MinION hanya pada pengurutan genom bakteri dan virus saja. Namun untuk ke depannya, tidak menutup kemungkinan bahwa ONT akan mengembangkan sistem pengurutan serupa yang sudah mampu diaplikasikan kepada genom eukariot atau bahkan mamalia dan tumbuhan.
Secara umum, teknologi pengurutan DNA generasi ketiga telah mampu menjawab kelemahan yang terdapat pada teknologi generasi sebelumnya. Namun bukan berarti bahwa pengembangannya hanya akan berhenti sampai disini saja. Generasi selanjutnya dari teknologi pengurutan ini akan terus menyempurnakan kelemahan dari generasi sebelumnya. Pada suatu saat di masa depan, bukannya tidak mungkin bahwa sebuah teknologi pengurutan mampu mengurutkan untai DNA dari ujung satu hingga ke ujung lain dalam sekali jalan, memberikan bacaan dengan akurasi tinggi, serta waktu pengurutan per genom yang lebih cepat. Impian tentang 1000 USD per genom sebentar lagi akan, atau mungkin, sudah tercapai pada saat ini.



Penutup
Oke, saya rasa cukup sampai disini dulu tulisan tentang teknologi pengurutan DNA-nya. Pada tulisan berikutnya saia akan coba membahas tentang bagaimana merangkai potongan-potongan bacaan urutan DNA tersebut agar kita bisa mendapatkan sebuah genom utuh serta apa saja tantangan dalam proses perangkaiannya. Ditunggu yak!!!



Victor Aprilyanto


 

Bacaan Lanjutan
Ulasan yang bagus mengenai perbandingan antar sistem pengurutan dapat dibaca pada Metzker (2010). Ulasan tersebut juga dilengkapi dengan ilustrasi yang mendetail untuk setiap metode yang digunakan. Saya sangat menyarankan untuk membaca Metzker (2010) bagi teman-teman yang ingin memahami lebih lanjut mengenai teknologi pengurutan DNA karena rincian yang lebih dalam dari setiap metode tidak dibahas dalam tulisan ini. Artikel lainnya yang saya cantumkan adalah publikasi pertama dari teknologi pengurutan yang dibahas di atas

Metzker, M. L. 2010. Sequencing technologies - the next generation. Nature Reviews Genetics 11: 31-46.
Eid, J., A. Fehr, J. Gray, K. Luong, J. Lyle, G. Otto, P. Peluso, D. Rank, P. Baybayan, B. Bettmann, A. Bibillo, K. Bjornson, B. Chaudhuri, F. Christians, R. Cicero et al. 2009. Real-time DNA sequencing from single polymerase molecules. Science 323 (5910): 133–138.
Branton, D., D. W. Deamer, A. Marziali, H. Bayley, S. A. Benner, T. Butler, M. DiVentra, S. Garaj, A. Hibbs, X. Huang, S. B. Jovanovich, P. S. Krstic, S. Lindsay, X. S. Ling, C. H. Mastrangelo et al. 2008. The potential and challenges of nanopore sequencing. Nature Biotechnology 26 (10): 1146–1153.
Margulies, M., M. Egholm, W. E. Altman, S. Attiya, J. S. Bader, L. A. Bemben, J. Berka, M. S. Braverman, Y-J. Chen, Z. Chen, S. B. Dewell, L. Du, J. M. Fierro, X. V. Gomes, B. C.Godwin et al. 2005. Genome sequencing in microfabricated high-density picolitre reactors. Nature 437: 376–380.
Quick, J. et al. 2016. Real-time, portable genome sequencing for Ebola surveillance. Nature 530: 228-232.
Shendure, J., G. J. Porreca, N. B. Reppas, X. Lin, J. P. McCutcheon, A. M. Rosenbaum, M. D. Wang, K. Zhang, R. D. Mitra, & G. M. Church. 2005. Accurate multiplex polony sequencing of an evolved bacterial genome. Science 309 (5741): 1728–1732.
Valouev, A., J. Ichikawa, T. Tonthat, J. Stuart, S. Ranade, H. Reckham, K. Zeng, J. A. Malek, G. Costa, K. McKernan, A. Sidow, A. Fire, & S. M. Johnson. 2008. A high-resolution, nucleosome position map of C. elegans reveals a lack of universal sequence-dictated positioning. Genome Research 18: 1051-1063.