Biyoinformatik | Sekanslama Teknolojileri


Ayşegül MURAT, Ege Ünv. Sağlık Biyoinformatiği A.B.D., Doktora Öğrencisi

Omiks teknlolojilerinin ortaya çıkardığı büyük verinin işlenmesinde ihtiyaç duyulan algoritmaları, yazılımları, veri tabanlarını gerek matematiksel gerek istatistiksel yöntemler kullanarak, kullanıcının elindeki bilgiyi (information:işlenmemiş ham veri) veriye (datum|data bilginin işlenmiş hali) dönüştürmesini sağlayan bilim dalı biyoinformatiktir. Biyoinformatikçilerin elde ettiği büyük verilerin kaynakları nelerdir ve nasıl elde edilir?


İnsan genom projesine ya da bireysel genomunuzu elde etme konusunda araştırma yaparken karşınıza sanger sekanslama, YNS (yeni nesil sekanslama), oxford nanopore gibi farklı yöntemlere ait birkaç kelime ile mutlaka karşınıza çıkacaktır.

Sekanslama/dizileme: DNA içeriğini belirlemek üzere yapılan tüm laboratuvar sürecidir. Bir DNA örneğinin sekanslanmasıyla mutasyon taraması, tür belirlenmesi, metagenomik analizler yapılabilir.

Sekanslama yönteminin gereçleri; PCR, Kalıp DNA, Primer (Özgül olionükleotit), Enzim (taq polimeraz), dNTP, distile su ve jel elektroforezi.


PCR: sekanslanacak bölgeyi seçerek o bölgenin çok sayıda kopyasının elde edilmesi. Kendi içerisinde 1.nesil-klasik/konvansiyonel, 2.nesil-qRT-PCR, 3.nesil-Dijital PCR o.ü 3’e ayrılır.


NGS: new generation sequencing YNS: yeni nesil sekanslama(dizileme)


Bir gametin, bireyin, popülasyonun veya bir türün genetik bilgisinin tamamını oluşturan DNA dizisine genom denilir. Peki bu DNA dizisi hangi yöntemlerle elde edilir?


1.Nesil #Geleneksel Yöntemler


Allan MAXAM & Walter GILBERT (kimyasal degredasyon yöntemi) ve Fred SANGER (dideoksi yöntemi) geleneksel yöntemler olarak bilinir. Günümüzde YNS teknolojileri ile sekanslama yapılmış olsa da yayın aşamasında sanger yöntemiyle elde edilen dizinin doğrulanması istenir. Sanger ve Coulson tarafından 1975’te “Plus and Minus” yöntemi geliştirilmiş ve sonraki 30 yıl süresince geliştirilecek modern dizileme yöntemleri için yol gösterici olmuştur. Sanger ve ark. bu yöntemle ФX174 bakteriyofajının tüm genomu diziledi.


1977’nin yakın tarihlerinde geliştirilmiş bu iki yöntemden Sanger yöntemi Maxam & Gilbert yöntemine kıyasla daha fazla tercih edilmektedir. Bunun nedeni ise; Sanger yönteminin daha verimli, daha kolay, daha az toksik kimyasal ve radyoaktivite gerektirdiği için kısa sürede hızla yaygınlaşmıştır.

Sanger yönteminin ana ilkesi; zincir sonlandırıcı olarak dideoksinükleotit trifodfatların (ddNTP) kullanılmasıdır. Bu yöntem klasik PCR deneyini yaparken ortaya koyduğumuz bazların (dNTP) bir kısmını, b,r ucuna yeni baz ekleme özelliğini kaybetmiş ve floresan özellikte olan başka bir baz türüyle (ddNTP) değiştirmemiz; farklı uzunluklarda sonlanmış ve sonlandığı bazlara göre ışıma yapan DNA’lara sahip olmamızı sağlamıştır.


Sanger yönteminin sınırlarını 300-500 baz aralığında kısa okumalar oluştururken, uzun zamanda analizin bitmesi ve elde edilen sonuca göre pahalı bir yöntem olması, ilk ve son 50 bazda kalite problemine (yani bu kısımlardaki bazların hata oranı daha fazla) ek yöntemin dezavantajıdır.

Birinci nesil dediğimiz bu dönemin eksikliklerini düzeltmek için araştırmacılar bir geçiş dönemi yaşadılar. Bu dönemdeki araştırmacılar Sanger yönteminin daha az sarf malzemeyle daha az zamanda hızlı dizileme yapmayı hedefledirler.


Klasik Sanger yöntemi jel elektroforezi aşamasına ihtiyaç duyarken, otomatik cihazlar kılcal (kapiller/capillary) elektroforez yöntemiyle okumayı hızlandırdılar ve ayrıca aynı zamanda birden fazla kılcal elektroforez kullanarak birim zamanda dizilimlenen baz sayısını artırdılar.


Geçiş dönemi aslında YNS ilk versiyonlarının ortaya çıkmasına zemin sağlayarak, Roche 454’ün geliştirdiği mikro kuyucuklu teknoloji, 500 kat daha hızlı ve 50 kat daha ucuz bir dizileme sunarak yeni nesil dizilimleme çağını açtı.


2. Nesil #Otomatik Dizi Analizi


1986 yılında ise Leroy hood ve Applied Biosystem tarafından ilk otomatiza cihaz tanıtıldı. Sabit bilgisayarda yüklü programın yönettiği elektroforez sistemli bu yöntemle 6-1000 baz arası güvenli okuma sağlandı.


Hız kazanmak ve okunan bazın doğruluk oranını (1/10000 hata) artıran Shotgun sekanslama yöntemi; çok büyük DNA parçalarının parçalara ayrılarak kütüphanesinin oluşturulması, DNA parçalarının ayrı ayrı dizilenmesi ve orijinal DNA’nın yeniden yapılandırılmasını (aligment, dizilerin birleştirilmesi) sağlamıştır. 1995 – İnsan genom projesi çalışmasının ve ilk bakteriyel genomun açığa çıkarılmasında kullanılan bir yöntemdir.


Yeni nesil sekanslama, next generation sequencing, deep sequencing, ultra deep sequencing, shallow sequencing, pyrosequencing, massively paralel sequencing ve high-throughput sequencing terimlerini içerisine alır.


Nesil olarak ifade edilen teknolojik gelişmeyi oluşturan firmalar ve yöntemleri birbirinden farklılık göstererek kendi avantaj ve dezavantajlarına sahip olurlar.


Roche 454 life science /pyrosequencing:


400-800 bazçifti(bç) uzunluğundaki DNA parçaları, sentez yoluyla dizileme. Bir yağ solüsyonu içindeki su damlacıklarında yer alan DNA, PCR ile çoğaltılır. Her damlacık klonal bir koloni oluşturur. Dizileme makinası çok sayıda pikolitre hacimli, her biri tek boncuk ve diizleme enzimli (lüsiferaz) kuyucuklara sahiptir. 3,6 milyon kuyucuk, 7.5 saatte dizileme, toplamda 100-500 milyon baz.


Illumina HiSeq / MiSeq / NextSeq500:


Tüm reaksiyonlar katı bir fazda gerçekleşir. Köprü tabanlı sekanslama ile 75-500 baz uzunluğunda okumalar yapılır. Nükleotitlerin 3’OH uçları kimyasal olarak kapatılmış olduğundan zincir sonlanmasına neden olur.


Ion Torrent PGM / Ion Proton:


Kamera, tarama, ışıma yok!


Herhangi bir okuma veya floresan ışıma yok. Minyatürize pH metre bulunduran ve 400 bazlık okuma sağlayabilen teknolojidir. İyon yarı iletken dizilenmesine dayanan bu yöntem, DNA’nın polimerizasyonu sırasında açığa çıkan Hidrojen iyonlarının tespitine dayalıdır.


PacBio (Phospolinked Nucleotides):


ZWN sıfır mod dalga alan olarak adlandırılan, optik kuyucuk tabana tek bir DNA polimeraz bağlanmıştır. 5000 bazdan kısa olan tekrar bölgeleri okunabilir. Tekrar bölgelerinin özellikle uzun tekrar bölgelerinin doğru okuması bu yöntemlerde oldukça kritiktir. Genelde ışıma tabanlı ölçüm gerçekleştirildiği sırada ve gelen ışın dalgalarının aynı frekansta arka arkaya olması farklı sırada ama aynı bazın cihazda algılama hatası oluşturmasını sağlar.


3. Nesil #Oxford Nanopore


17 Şubat 2012’de Erika Check Hayden tarafından Nature dergisinde yayınlanarak bilim dünyasına sunulan Oxford nanopore teknolojisi, bir avuç içine sığacak küçüklükte ve 1000 dolara satışı olan cihazdır. Bilgisayarı yanınıza alıp gerçek zamanlı sekanslamayı takip edip istediğiniz yerde kesebileceğiniz hatta istediğiniz yere götürebileceğiniz boyuta sahip.


Sekanslama teknoljisi için bazı kavramlar


Read: Her bir okuma. Bir sekanslama cihazı milyonlarca okuma üretir.


Capacity: Bir YNS cihazının veya kullanılan sarf malzemenin toplam okuma miktarını gösterir. Örneğin, MiSeq Nano v2à1M, MiSeq Micro v2 à4M, MiSeq v2 à15M, MiSeq v3à25M, NextSeq Mid Output à132M NextSeq High Outputà 400M, HiSeq 2500/1500 Rapid Run(per flowcell)à300M ve HiSeq 2500/1500 High Outputà 1500M okuma kapasitesi vardır.


Coverage: Bir baz veya bölgeye ait toplam kaç okuma olduğunun göstergesidir. YNS’deki hata oranlarının yüksekliğinden ötürü klinik çalışmalarda en az 100x coverage önerilir.


Clustering: Hazırlanan kütüphanenin flow cell üzerinde yoğunlaşarak çoğaltılması ve sekanslamaya hazır hale gelmesi


Library Preparaion: Örneğe ait DNA parçalarına, kullanılan eknolojiye ai çipe uygun adaptör sekanslarını eklenmesi. Böylece clustering aşaması mümkün olur.


İndexing: Bir YNS sekanslama cihazı çalıştırılırken aynı anda birden fazla farklı örneğin sekanslanmasına olanak verir. Örneğin bir hastalık için panel oluşturulurken her bir hasaya ait örneğe farklı indexler verilir.


Targeted Sequencing: DNA’nın sadece belirli bir kısmının sekanslanması, Amplicon sequencing


De novo Sequencing: O zamana kadar DNAsı sekanslanmamış bir türün DNAsının sekanslanması


Whole Genome Sequencing: Bir organizmaya ait tüm genomun sekaslanması


Exom Sequencing: DNA’nın sadece exon bölgelerinin sekanslanması


RNA-Seq: Gen ekspresyon çalışmalarınınYNS ile yapılmış hali. Örneğin mikro RNA-miRNA ların sekanslanmsı


Metagenomiks: Aynı anda birden fazla organizmanın karışımını sekanslayarak türleri keşfetme. Özellikle bakteri odaklı çalışmalar. Örneğin bir topraktan ya da hastanenin bir yüzeyinden alınan örnek içerisinde bulunan tüm bakteri türlerini analiz etme.


Phred Score: Okunan her bir baza ilişkin kalite skoru algoritması. Örneğin, phred qualitys core 10 ise 10 bazda bir hata olabilir ve accuracy %90 olarak hesaplanır, phred quality score 40 ise 10,000 bazda bir hata olabilir ve accuracy %99,99 olarak hesaplanır, , phred quality score 60 ise 10,000 ,000 bazda bir hata olabilir ve accuracy %99,9999 olarak hesaplanır.


FastQ: Fasta ve Phred Score birleşimi ile elde edilen sekanslama dosya formatıtıdr.

@SEQ_ID

GATTTGGGGTTAAAAGCAG…

+

!’’*((((**+)(%%%%).1**-…… şeklindedir.


Aligment: Hizalama. Her bir okumanın ait olduğu bölgenin belirlenmesi


Annotation: Okumaların hizalanmasının ardından derlenip toparlanması ile tespit edilen bölgelerin hangi genlere veya varyasyonlara denk geldiğinin raporlanması süreci.


Variant Calling: YNS sonucu elde edilen okumaların referans genom ile karşılaşırılması sonucu farklılık gösteren bölgelerin (varyasyonların) tespit edilmesi e raporlanması






Kaynakçalar

1. El-Metwally, S., Ouda, O. M., & Helmy, M. (2014). First-and next-generations sequencing methods. In Next Generation Sequencing Technologies and Challenges in Sequence Assembly (pp. 29-36). Springer, New York, NY.

2. Verma, M., Kulshrestha, S., & Puri, A. (2017). Genome sequencing. In Bioinformatics (pp. 3-33). Humana Press, New York, NY.

3. Schuster, S. C. (2008). Next-generation sequencing transforms today's biology. Nature methods, 5(1), 16-18.

4. Hodkinson, B. P., & Grice, E. A. (2015). Next-generation sequencing: a review of technologies and tools for wound microbiome research. Advances in wound care, 4(1), 50-58.

5. https://www.nature.com/collections/jmgqdxpvsk/

6. İllumina.com/systems/miseq.html

7. https://www.nanoporetech.com

8. Jain, M., Olsen, H. E., Paten, B., & Akeson, M. (2016). The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome biology, 17(1), 239.

9. Yeni nesil dizileme Ahmet Raşit Öztürk / ODTÜ biyoinformatik eğitim sunumu

0 görüntüleme

Türkiye'nin Tek Popüler Genetik Bilim Dergisi

Bezelye Dergi ISSN: 2587-0173

Bizi Takip Et
  • Beyaz Facebook Simge
  • Beyaz Instagram Simge
  • White Twitter Icon
  • Icon-gmail
  • kisspng-white-logo-brand-pattern-three-d
  • images
  • medium
  • Dergilik
  • YouTube

© 2019 by Bezelye Dergi