DNA Öğeleri Ansiklopedisi: ENCODE Projesi
Zeynep SALGIN – Moleküler Biyoloji ve Genetik, Fen Edebiyat Fakültesi, Bilecik Şeyh Edebâli Üniversitesi
DNA’nın moleküler mekanizması ve yapısal özelliklerini gün yüzüne çıkararak günümüzün hızla gelişen teknolojik gelişmeleriyle bile yeterli tedavi sağlayamadığımız koşullar, bizleri bilim için daha fazla ileriye taşımayı sağlamaktadır. DNA’nın keşfiyle beraber tüm bilim dünyası artık yeni bir çağa adımlarını atmış olup, tedavisi bulunamayan genetik hastalıklar ve bu hastalıkların yatkınlık derecelerini belirleyebilmek adına lokal olarak gen yerlerini, özelliklerini, moleküler etkileşimlerini ve bağlantı yolakları gibi daha birçok biyokimyasal ve moleküler mekanizmaları aydınlatabilmek adına birbirimizle yarışmaktayız.
Bu şartlar neticesinde 1990 yılında İnsan Genom Projesi başlatılmış olup sadece insan yararı ve toplumsal çıkar için değil aynı zamanda da koca bir bilinmezlik deryası olan genetik bilgi ile neler yapılabileceğinin kontrol altına alınması, bu bilgilerin kötüye kullanılarak biyolojik silah oluşturulması, cinsiyet için ayrımcılık yapılma ihtimali, hastalıkların tedavisel dönemlerinde kişide yada toplum içerisinde psikolojik sorunlar baş göstermesi ya da genetik üstünlükler, ırklar arasında çatışmalar gibi daha bu gibi birçok soysa-kültürel savaş ve karmaşalar da baş göstermesi doğa için ve biz insanlar için tek kelimeyle parçalanıp yıkıma uğramamıza da sebebiyet vermemesi için korkuyla ve tedbirle ele alınması gereken bir diğer yön olarak karşımıza çıkmaktadır[1].
Tüm bunlara rağmen 20 senedir devam etmekte olan genom proje çalışmalarının çok büyük bir bölümü 2000 yılı içerisinde bitirilmiş, kesin bilgiler neticelendirilerek literatür aşamasında 2003 yılında tüm dünya ile paylaşımı düşünülmüştür. DNA çalışmalarının hızla gelişmesine restriksiyon enzimlerinin bulunması, DNA dizi analizlerinin yapılabilmesi, polimeraz zincir reaksiyonu ve bunun gibi daha birçok uygulama ve çalışmalar ile İnsan Genom Projesi’nin daha da geçerliliğini ve temelinin sağlam atılmasına neden olmuştur[2].

Şekil 1: ENCODE: İnsan genomunun kabataslak rehberi[3].
İnsan genomu projesinde yaklaşık 175.000 baz çiftler halinde parçalara ayrılmış, yapay olarak bakteri kromozomlar halinde bakteri türlerinde çoğaltılıp araştırılmıştır. Dizi çalışmaları sonucunda ise parçaların birbirleriyle ne kadar örtüştüğünün belirlenmesi, bu parçalarının her birinin özel enzimler sayesinde kesilip kimliğini belirlemek ve genom üzerinde hangi lokasyonlar da bulunması gibi özellikler deneyler sonucunda bulunmuştur[4].
Ulusal İnsan Genom Araştırma Enstitüsü (NHGRI), başlatılan bu büyük genom projesinin dizilerindeki tüm işlev sahibi etmenleri tanımlamaya çalışmak ve bilim dünyasına kazandırmak adına 2003 yılı Eylül ayında DNA Öğeleri Ansiklopedisi (ENCODE) adında bir pilot projeye başlanılmıştır. Genel amaç insan genomu içerisindeki tüm fonksiyon gösteren moleküllerin tanımlanıp açıklanması olsa da bu proje bizlere genomun büyük bir bölümünün fonksiyonel olduğunu kanıtlamış, memeli genomunda ve özellikle kodlanmayan RNA’ların yaygın bir dağılış gösterdiğini de kanıtlayarak düşüncelerimizin temellerini sarsmıştır[5].
Projenin ilk basamağında genomun %1’nin araştırılması hedeflenen pilot uygulama, 2007 yılında sunulan verilerin yaklaşımları kanıtlanmış oldu. Aynı zamanda yeni nesil dizileme teknolojileri ve çalışmaları da bu pilot projenin genom analizlerinin büyütülmesindeki yapılabilirliğini olanak sağladı. Proje bu aşamada 32 farklı merkez olmak üzere 400 den fazla farklı araştırmacıların katkı sağladığı uluslararası bir işbirliği içerisinde gerçekleştirildi. Araştırma ekipleri 147 farklı insandaki hücre hattında yer alan transkripsiyon ve düzenleme işlevi gören dizileri genom çerçevesi çapında analizlerini gerçekleştirmek için farklı yöntemlere başvurmuşlardır[6].
Transkripsiyon ve RNA işlenilmesi, RNA-seq ile incelenmekte, genin düzenleyici bölgeleri ise hem düzenleyici bölgelerdeki proteinlerin bağlanma dizilerinin hem de düzenlemeyi sağlayan dizilere özel kromatin bölgelerinin belirlenmesi neticesinde analizler gerçekleştirilmiştir. Farklı gen veya gen grupları farklı hücrelerde ekspres oldukları için 147 hücre hattının sonuçları bir araya getirilip insan genomu içerisinde transkripsiyona uğrayan bölgelerin ve düzenleyici dizilerin tamamını sonuçlandırmak amaçlanmıştır[7].
Projenin hedef seçiminden önce 30 Mb’lık sekans içerisinden %50’sinin manuel biçimde seçilimi, kalan diğer sekans ise rastgele genom içerisinden seçilmesine karar kılınmış, manuel bölgelerin neden bu şekilde seçilmesinin sebepleri içerisinde de öncelikle iyi çalışılmış gen veya genlerin ya da diğer bilindik sekans üyelerinin oluşu ile beraber ikinci neden ise sekans verileri arasında önemli düzeyde karşılaştırma yapılabilmesi oluşudur. Bu şekilde 500 Kb ile 2 Mb aralığında 14 hedef eşliğinde toplam 14.82 Mb’lık dizi manuel olarak tercih edilmiştir[8].
Bu 30 Mb lık diziden geriye kalan %50 lik dilim ise gen yoğunluğu ve eksonik bölümü olmayan koruma düzeylerine dayanarak tabakalı şekilde rastgele oluşturulup, örnekleme 500 kb dan oluşmakla birlikte bu kritere dayanarak hem gen içeriği hem de diğer fonksiyonel unsurlar yönünden büyük ölçüde değişen genomik bölgeleri saptamak açısından güzel bir kriterdi. Bu kriter ile de insan genomu iki eksenin her biri yönünde üç parçaya bölünmüş olup üst katmanda %20, orta katmanda %30 ve alt düzeyde ise %50‘lik dilim oluşturulmuştur[9].
Konsorsiyum kaynakları içersinde ENCODE hedef dizilerine her insanın hedef genom yapıları serbest halde bulunup ve güncel bir şekilde RefSeq de erişimi sağlanmış sekans girişleri mevcuttur. Farklı insan genomundaki yapılar için hedef bölge listeleri UCSC ENCODE tarayıcısında bulunup bu tarayıcılar içerisinde ayrıca genomun incelenme düzeneklerinde elde edilen ve tanımlanan BAC klonlarının doğrudan dizilmesiyle elde edilmiş diğer omurgalı canlıların genom veri bilgi ve listeleri de güncellenerek tüm bilim dünyasına sunulmaktadır[10].
Encode Hedefleri Ve Bac Klonları – Hücre Hatları
İnsan genomundan hariç diğer omurgalı genomları da çalışılmış ve buradaki ENCODE bölgeleri için BAC klonları NHGRI/NISC’deki Eric Green adlı bilim insanın araştırma ekibiyle tanımı yapılmıştır. Her bir farklı organizma için elbette farklı hedefler alınıp bu hedefler boyunca BAC klonlarının haritaları yine NISC veritabanında bulunmaktadır. Tüm ENCODE araştırmacıları tarafından kullanılan tüm deneylerin, ekipmanların ve reaktiflerin çalışma düzeyleri yine farklı sonuçlar elde edilmemesi için ortak bir platform ve veriler baz alınarak çalışmalar içerisinde biyolojik varyasyon oluşmaması için ortak hücre dizilerine başvurulmuştur[11].
Ama farklı hücre özellikleri için ise iki tane hücre dizisi seçilmiştir. Bunlar[12]:
Servikal adenokarsinom olan Hela S3, yüksek seviyede verim ve transfekte özelliği ile bu hücrelerin büyük miktarları, DNA replikasyonunda ve hücre döngüsünde kolayca senkronize sağlamasından dolayı seçilmiş,
Bir diğeri ise Utah CEPTH havuzundan bir Epstein-Barr virüsü dönüştürülerek B-Lenfosit olan GM06990, temsil niteliğinde lenfoblastoid hücresi olarak seçilmiştir.
Bu hücreler normal düzeyde bir karyotipe sahip olmakla birlikte ENCODE bölgeleri iyi çalışılmış genlerin aktivasyon mekanizmalarında sinyal iletim yolları mitojenlere başvurularak etkinleştirilebilir ve çalışmalarda bizlere kolaylık sağlayabilmektedir.
Ek olarak ortak hücre hatları için farklı hücre grupları olan BJ-TERT; K562 (fibroblast hücre grubu), lipoproteinleri eksprese edebilen HepG2 gibi ENCODE bölgelerinde bulunan ilgili gen dizilerini ekspres etmeleri özellikleri nedeniyle Konsarsiyum üyeleri tarafından seçilmişlerdir[13].
DNA Bağlayıcı Proteinlere Karşı Antikorlar
ENCODE pilot projesi içerisinde ayrı bir alt bölüm olarak gerçekleştirilen ChIP-chip çapraz platform karşılaştırmalarında kontrol olarak kullanılması için konsorsiyum tarafından dört tane antikor belirlenmiştir. RNA polimeraz II’yi tanıma işlevi gerçekleştiren antikorlar ve RNA polimeraz II için başlatıcı marker kompleksi genel transkripsiyon faktörü bileşeni olan TAFII250, RNA polimeraz II tarafından aktif şekilde kopyalama işlemi tüm genlerin promotörlerine bağlanma afinitesi gerçekleştirmektedir[14].
Üçüncü bir ortak antikor ise hücrelerin IFN’le beraber tedavi sonrası indükleme işleminden sonra transkripsiyon faktörlerinden biri olan STAT-1’i tanımaktadır. Bu protein çeşidi hücrelerin uyarılmasının ardından sadece IFN ile indüklenerek promotörlere bağlanır. Histon modifikasyonuna karşı antikor etkisi –asetilenmiş histon H4’de hücre döngüsü özelliği nedeniyle seçilmiştir[15].
ENCODE projesinde genel anlamda çarpıcı veriler içerisinde %80’ni olmak üzere tüm genom analiz yaklaşımları belirlenme fonksiyonlarına sahiptir. Transkripsiyon kaynakları içerisinde bu projeyle beraber 20,687 protein kodlayan genin yanında 8801 kısa kodlanmayan RNA, 9640 uzun kodlanmayan RNA (IncRNA) ve 863 psödogen bulunmuştur[16].
ENCODE projesinin en şaşırtıcı sonuçlarından bir diğeri ise genomumuzun büyük bir kısmının biyokimyasal düzeydeki moleküler mekanizmasının şaşırtıcı derecede aktif halde olduğunu göstermesidir. Bu sonuca ek olarak kodlanmayan RNA’ların transkripsiyonun boyutları ve IncRNA’ları kodlayan fazla sayıda gen bulunması da eklenmelidir[17].
Tüm bu sonuçlar şunu gösteriyor ki insan genomuna çok başka bir bakış açısıyla yaklaşmamız gerektiğini vurgulamaktadır. Bu genom hiçbir fonksiyona sahip olmayan çöp DNA’lar içerinde var olan ve az sayıda protein kodlayan gen dizileri olmak yerine fonksiyonel dizi gruplarının bu genom içerisinde büyük bir paya sahip olduğunu, kodlanmayan RNA’lar ve genin düzenleyici unsurlarının da birçok göreve sahip oluşuyla bizleri tanık haline getirmiştir[18].
Belirlenen çok sayıda kodlanmayan RNA’ların işlevlerinin belirlenmesi gelecek yıllardaki çalışmalar için zorluk çıkarabilme ihtimali yüksektir. Çünkü pek çoğunun gen düzenleyici rolü bilinse de bu transkriptlerin çoğunluğunun işlevselliği hala anlaşılamamıştır. Bu yüzden de biyolojik anlamda aktifliği ne ölçüde barındırdığı ve hücre değişimleri, davranışları hakkında nasıl ir role sahip oldukları henüz bilinmemektedir.
Yine de genomumuzda yer alan gen düzenleyici bölgelerinin tümünün aydınlatılması gelecekte yapılacak olan çalışmaların yegane hedefleri arasında yer almaktadır. Ve ENCODE memeli gen ve genomlarına yeni bir pencere açarak bilim dünyasına adını yazdırmayı başarmıştır.
Referanslar
Superhumans, P. İnsan Genom Projesinin Korkulan Rüyası; Ayrıcalıklı İnsan Yaratma.
Fidanoğlu, P., Belder, N., Erdoğan, B., İLK, Ö., RAJABLİ, F., & ÖZDAĞ, H. (2013). Genom projeleri 5N1H: ne, nerede, ne zaman, nasıl, neden ve hangi popülasyonda? Türk Hijyen ve Deneysel Biyoloji Dergisi, 71(1), 45-60.
ENCODE: The rough guide to the human genome, National Geographıc, 2021.
Bilim ve Teknik (Mayıs 2001), "Genom Ne Söylüyor?" 9 Nisan 2011 tarihinde Wayback Machine sitesinde arşivlendi., Prof. Dr. Beyazıt Çırakoğlu, Tübitak Yayınları.
National Human Genome Research Institue, 2021. (Erişim: 10.04.2021).
Deloukas, P., & Bentley, D. (2004). The HapMap project and its application to genetic studies of drug response. The pharmacogenomics journal, 4(2), 88-90.
Cooper, MG, Hausman, RE, Hücre, Moleküler Yaklaşım, İzmit Tıp Kitap Evi, İzmir, 631-673, 2006.
ENCODE Project Consortium. (2004). The ENCODE (ENCyclopedia of DNA elements) project. Science, 306(5696), 636-640.
Harrow, J., Denoeud, F., Frankish, A., Reymond, A., Chen, C. K., Chrast, J., ... & Guigo, R. (2006). GENCODE: producing a reference annotation for ENCODE. Genome biology, 7(1), 1-9.
Harrow, J., Frankish, A., Gonzalez, J. M., Tapanari, E., Diekhans, M., Kokocinski, F., ... & Hubbard, T. J. (2012). GENCODE: the reference human genome annotation for The ENCODE Project. Genome research, 22(9), 1760-1774.
Paik, Y. K., & Hancock, W. S. (2012). Uniting ENCODE with genome-wide proteomics. Nature biotechnology, 30(11), 1065-1067.
Bryzgalov, L. O., Antontseva, E. V., Matveeva, M. Y., Shilov, A. G., Kashina, E. V., Mordvinov, V. A., & Merkulova, T. I. (2013). Detection of regulatory SNPs in human genome using ChIP-seq ENCODE data. PLoS one, 8(10), e78833.
Guigó, R., Flicek, P., Abril, J. F., Reymond, A., Lagarde, J., Denoeud, F., ... & Reese, M. G. (2006). EGASP: the human ENCODE genome annotation assessment project. Genome biology, 7(1), 1-31.
Marvelle, A. F., Lange, L. A., Qin, L., Wang, Y., Lange, E. M., Adair, L. S., & Mohlke, K. L. (2007). Comparison of ENCODE region SNPs between Cebu Filipino and Asian HapMap samples. Journal of human genetics, 52(9), 729-737.
ENCODE Project Consortium. (2012). An integrated encyclopedia of DNA elements in the human genome. Nature, 489(7414), 57.
Blankenberg, D., Taylor, J., Schenck, I., He, J., Zhang, Y., Ghent, M., ... & Nekrutenko, A. (2007). A framework for collaborative analysis of ENCODE data: making large-scale analyses biologist-friendly. Genome research, 17(6), 960-964.
Rosenbloom, K. R., Sloan, C. A., Malladi, V. S., Dreszer, T. R., Learned, K., Kirkup, V. M., ... & Kent, W. J. (2012). ENCODE data in the UCSC Genome Browser: year 5 update. Nucleic acids research, 41(D1), D56-D63.
Moraes, F., & Góes, A. (2016). A decade of human genome project conclusion: Scientific diffusion about our genome knowledge. Biochemistry and Molecular Biology Education, 44(3), 215-223.