İçeriğe geçmek için "Enter"a basın

Makine öğrenmesi sayesinde tükürükten kanser teşhisi yapılabilecek

Boğaziçi Üniversitesi’nde yapılan bir araştırmaya göre, gelecekte sadece kan ve tükürük örneği kullanılarak kanser teşhisi yapılabilecek. Araştırmacılar, kanser teşhisinde biyopsi yönteminin yerine geçmesi amaçlanan bu yeni yöntemin başarı oranını artırmayı hedefleyen ikinci bir araştırma projesini de sürdürdüklerini açıkladılar.

Bilim insanlarının araştırmalarında kullanılan Big Data, geleceğe dair yepyeni umutların yeşermesine vesile oluyor. Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü öğretim üyelerinin gerçekleştirdiği araştırma, başta kanser türleri olmak üzere birçok hastalığın teşhisinde genomik verinin kullanılabileceğini ortaya koydu. DNA dizileme (sekanslama) teknolojisinin gelişmesi ve maliyetlerinin her yıl ucuzlayarak daha erişilebilir hale gelmesi sayesinde, DNA verisi kullanarak çeşitli hastalıkların teşhisinin yaygın kullanılacak bir teknoloji olması bekleniyor.

Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü öğretim üyeleri Prof. Dr. Fikret Gürgen, Doç. Dr. Arzucan Özgür ve aynı bölümde araştırma görevlisi olan N. Özlem Özcan Şimşek’in “Genomic Data Analysis Using Machine Learning Techniques For Disease Prediction” başlıklı araştırmaları DNA verisinin kanser hastalığı teşhisinde kullanıldığı öncü araştırmalardan biri oldu. Araştırma yazısı BMC Bioinformatics‘te yayınlandı.

DNA scientific research infographics set with charts and diagrams vector illustration

Araştırmacıların geliştirdikleri dil işleme / makine öğrenmesi yöntemi, DNA’nın 4 harften oluşan dil yapısını çözümlemeye ve farklı kanser türüne sahip hastaların genlerindeki mutasyonları inceleyerek, hastalığa yol açan sebepleri anlamaya çalışıyor ve DNA örneklerinden kanser türünü teşhis etmeyi amaçlıyor.

Big Data’dan yararlandılar: 7 bin hasta verisi incelendi

Dünya genelinde ölüm nedenlerinin başında gelen 10 farklı kanser türünü (akciğer, meme, beyin, böbrek, kalın bağırsak ve rektum [Colorectal], troid, postat, cilt, mide ve karaciğer) ele alan araştırmacılar, ABD’deki National Cancer Institute’ün sağladığı imkânlarla erişimlerine açılan The Cancer Genome Atlas’tan alınan 7 bin hasta verisini inceledi. Hastaların DNA dizilerini referans genom dizileriyle karşılaştıran araştırmacılar hangi genlerde ne tür mutasyonlar olduğunu inceleyerek kanser türlerini yapay öğrenme (makine öğrenmesi yöntemi) ile ayrıştırabilir miyiz sorusu üzerine yoğunlaştı.

Biyopsi yerine sadece kan ve tükürük örneğinden teşhis mümkün olacak

Çalışmada yüzde 76 gibi önemli bir başarı oranına ulaşan araştırmacılar, bu sayede yakın gelecekte bazı kanser türlerinde biyopsi vb. gibi yöntemlerle yapılan teşhis yerine hastadan sadece kan ve tükürük örneği alınarak da ne tür bir kanser türü olduğunun anlaşılabileceğini belirtiyorlar.

Araştırmacılar, bu çalışmanın bir yandan hastalığın teşhisine yardımcı olurken öte yandan da hangi genlerin hastalıkla ilişkisi olduğunu göstermeyi amaçladığını ifade ediyorlar ve ileride bu çalışmanın tedavi açısından yeni ilaç denemeleri gibi gelişmelere de katkısı olacağını öngörüyorlar.

500 bin hasta verisi ile daha geniş ikinci bir çalışma yapıyorlar

Araştırmacıların yürüttüğü bir başka çalışmada ise 500 bin hastanın verisinden yararlanılıyor. Bu araştırma ise sadece kanser değil çok çeşitli hastalıkları olan kişilerin yaşam alışkanlıkları, sigara tüketimleri gibi verilerin de olduğu çok daha geniş bir genom verisi inceleniyor. Yaşam alışkanlıklarının genom verisiyle entegre edildiği daha kapsamlı bir veri seti ile yapılan bu araştırma ise makine öğrenmesi yöntemi ile hastalık teşhisinde başarı oranını daha yükseğe çekmeyi hedefliyor.


DNA dizilemek hızla ucuzluyor

Genom başına maliyet Moore Yasası’nın öngördüğünden de hızlı bir şekilde ucuzluyor. Grafik, Şubat 2019 itibariyle güncel veriyi içermektedir. Kaynak: NHGRI 2019 Şubat ayı itibariyle Data Seti Excel dosyası

İnsan geninin tamamının sekanslanmasını amaçlayan İnsan Geni Projesi’nin (Human Genom Project – HGP) 14 Nisan 2003’te tamamlandığı duyuruldu. O tarihden bu yana insan geni sekanslama teknolojisi ilerlerken, maliyeti Moore Yasası’nın öngürdüğünden de hazlı bir şekilde düşüyor.

National Human Genome Research Institute (NHGRI) kendileri tarafından fonlanan araştırmalarda DNA sekanslamanın maliyet verisini de takip ediyor ve sitesinden açıklıyor. NHRGI’nın sitesindeki bilgilere göre, ilk taslak insan geni sekanslamanın proje maliyeti küresel çapta 300 milyon Dolar idi. Taslak genin üzerinde çalışarak iyileştirme için yapılan çalışmaların maliyeti ise küresel olarak 150 milyon Dolar olarak gerçekleşmişti. İnsan geninin tam olarak sekanslaması için yürütülen bu çalışmaların toplam maliyetinin 500 milyon Dolar ile 1 milyar Dolar arasında olduğu tahmin ediliyor.

Sekanslama maliyeti 2015 yılının ortalarında 4000 Dolar düzeyinde iken, 2015 sonunda 1500 Dolar seviyesine indi. Tam genom sekanslama ve tam exome sekanslama maliyetleri günümüzde 1000 Dolar’ın altında seyrediyor (NHGRI verisine göre).


Araştırmaya dair haber Boğaziçi Üniversitesi’nin internet sitesinde 25 Haziran 2019 tarihinde yayınlandı ve üniversitesi’nin Twitter hesabından duyuruldu:

Daha fazla bilgi için: https://haberler.boun.edu.tr/tr/haber/bogazici-universitesi-nden-dna-nin-dilini-yapay-zeka-ile-cozmeyi-hedefleyen-arastirma