İçeriğe geçmek için "Enter"a basın

Boğaziçililerden “-de/-da Takıntısı” için web sitesi

Boğaziçi Üniversitesi Bilgisayar Mühendisliği öğrencileri Hasan Öztürk, Alperen Değirmenci ve Onur Güngör, Bilgisayar Mühendisliği öğretim görevlisi Suzan Üsküdarlı koordinasyonunda Türkçe’deki en yaygın yazım yanlışlarından biri olan –de ve –da eklerinin yanlış yazılıp yazılmadığını kontrol etmeyi sağlayan “-de/-da Takıntısı” adlı bir internet sitesi oluşturdu.

Sosyal medya ve mobil cihazların etkisiyle hemen her kullanıcının yazım yanlışı yapma olasılığının arttığı bu dönemde imla hatalarıyla ilgili farkındalık oluşturmak adına önemli bir işlev üstlenmeye aday web sitesinin nasıl ortaya çıktığı konusundaki sorulara projeyi geliştiren ekip cevap verdi.

Projenin çıkış noktası ne oldu?

Onur Güngör​: Çoğumuzun zaman zaman yanlış yazdığı, bazılarımızın da okudukları metinlerde görmek istemedikleri türden bir hata olan -de/-da’nın yanlış kullanımını bir süredir gözümüze kestirmiştik. Bu sorunun son zamanlarda ortaya çıkmış yöntemlerle ne kadar iyi çözülebileceğini merak ettik ve çalışmalara başladık.

Türkçe‘de pek çok imla hatası yapılıyor ama sanırız en fazla hata -de ve -da’ların yanlış kullanımında gözleniyor. Sizce bunun bir açıklaması var mı?

 Onur Güngör​: Sanırım en çok yapılan hata bu değildir. ‘Hiçbir’, ‘Herkes’, ‘Her şey’ ve ‘Birçok’ gibi sözcüklerin ilk dördü oluşturduğunu tahmin ediyorum. Ama -de/-da hatalarının çok göze battığına biz de katılıyoruz. İlgi çekmesinin en büyük nedeni yapmamayı öğrenmenin ve tutarlı olarak doğru yazmanın göreli olarak zor olması olabilir. Bir de şu var, birkaç tane harfi karıştırmakla cümledeki anlamın bozulması çok kolay değildir, ancak -de/-da hataları genelde anlamayı zorlaştıran, imkânsız kılmasa da garip bir his veren hatalar. Bu da rahatsızlığı artırıyor olmalı. Neden bahsettiğimi daha iyi anlamanız için “Araba da aldım” ve “Arabada aldım” cümlelerini düşünün. İkisini karşılaştırdığınızda anlamın ne kadar farklılaşabileceğini görebilirsiniz. Nadir olarak da bu hatayı yapanları aşağılamak amacıyla gereğinden çok önemsendiğini düşünüyorum.

Suzan Üsküdarlı​: Daha sık olmasa da daha çok göze batıyor. Birçok insanı da oldukça rahatsız eden bir imla hatası. İmla hatalarını düzelten yazılımlar da bu tür hataları genel olarak yakalayamadığı için bu hatalara pek çok resmi ve gayri resmi yazılarda rastlamak mümkün. Maalesef bazı ortamlarda ise bu tür hataları yapanlara karşı çok olumsuz tavır alan da oluyor. Bir şekilde yerleşmiş bir algı oluyor birçok insanda. Belki zamanında özenle öğrendiği içindir. Sosyal medya ortamlarında çok daha gayri resmi bir dil kullanılmakta. Bu ortamlarda da her türlü imla hatası artmakta. -de/-da hatalarına gelince Twitter ve Ekşi Sözlük gibi çok kullanılan çevrimiçi platformlarda bu imla hatasına özel sayfalar ve kullanıcı hesaplarının olması da ilginçtir. Bu da bu hatanın oldukça göze battığını gösteriyor.

İstatistiki olarak imla hataları konusunda elinizde bir veri var mı?

Onur Güngör​: Bu projede tüm yazım yanlışları üzerine çalışmayı düşünmediğimizden bu tür bir araştırma yapmadık. İleride bunu da gündeme alabiliriz tabii.

 Mobil cihazların imla hatalarındaki payı hakkında ne düşünüyorsunuz, bu cihazlarda yapılan yazışmalarda Türkçe kullanımı sorunlu olabiliyor ister istemez. Mobil cihazlar da hata olasılığını artırıyor mu?

Hasan Öztürk​: Günümüzün giderek dinamikleşen dünyasında hayatımız daha hızlı bir hal alıyor ve artık yazılarımızı da daha hızlı yazıyoruz. Sözgelimi, eskiden birisi bir mektup yazdığında göndermeden önce mektubunu tekrar okuyup kontrol ederken artık günümüzde insanlar özellikle sosyal medya ve anlık mesajlaşma platformlarındaki yazılarında böyle bir dikkat göstermiyor. Bu da doğal olarak yazım hatalarının artmasına sebep oluyor. Dediğiniz gibi mobil cihazlar bu dinamik yapının en önemli araçlarından biri ve bu açıdan mobil cihazların insanların yazım hatası yapma olasılığını artırdığı söylenebilir.

Onur Güngör​: Çok yazan çok hata yapar. Mobil cihazlar ve sosyal medya yazılı haberleşmeyi önceki yıllara göre kolaylaştırarak çok yaygınlaştırdı. Ayrıca bu tür mecralarda yazdığınızın %100 doğru olması gerekmez, dolayısıyla çok da dikkat etmeden yazarsınız.

Suzan Üsküdarlı​: Özenli yazma isteğinden bağımsız olarak önemli olan noktalardan biri ise mobil cihazların kullanımı sırasında genellikle kullanan kişinin hareket halinde olması. Bu şartlarda insanların dikkati doğal olarak dağınıktır. Dolayısı ile yazmaya verdiği enerji de harcadığı zaman da kısıtlıdır. Bu duruma bir de mobil cihazların sınırlı ekran görüntüsünü ve etkileşimini de eklediğimiz zaman birçok kısaltmanın ve hatalı yazılmış ifadelerin olması şaşırtıcı değildir. Ama sorun şu ki, bu ortamlarda zamanının büyük kısmını geçiren insanlar, yazmayı da mobil platformlarda öğreniyor. O zaman sorun hızlıca kısaltarak yazmaya çalışmaktan çıkıyor ve doğru biçimde yazamamaya dönüşüyor. 

 Projenizin altyapısını yapay zekâ oluşturuyor, sistemin nasıl çalıştığını biraz anlatır mısınız?

Onur Güngör​: Aslında proje iki parçadan oluşuyor. Birinci parça -de/-da hatasını tespit eden model. Bu modelin ilk hali geçen sene yine lisans bitirme tezi olarak Uğurcan Arıkan tarafından geliştirilmişti. Bu sene Hasan Öztürk ve Alperen Değirmenci’nin bitirme projesinde hem bu modeli geliştirdik, hem de bu modelin nasıl çalıştığını daha iyi anlamak için bir deney tasarladık. Modeli eğitirken gözetimli öğretim yöntemini kullandık. Bu yöntemin çalışması için ‘hata var’ veya ‘hata yok’ etiketleriyle işaretlenmiş çok sayıda cümle örneğine ihtiyacımız vardı. Bu cümleleri güvenilir kaynaklardan elde ettiğimiz düzgün yazılmış cümleleri otomatik olarak bozarak elde ettik. Bu cümleleri işleyen bir sinir ağı tasarladık ve her sözcüğü temsil eden sabit uzunluklu vektörler kullanarak öğrenimi gerçekleştirdik.

Suzan Üsküdarlı​: ​dedatakintisi.derlem.com​ sitesinde katılabileceğiniz deney ise insanların bu hatayı ayırt ederken cümlenin görmeleri gereken kısmıyla bizim modelimizin dikkate aldığı kısımların aynı olup olmadığını araştırıyor. Bunu literatürde ‘amaçlı oyun’ (Games with a Purpose) denen bir yöntemle tasarladık. Deney, katılımcıların -de/-da’nın bitişik veya ayrı yazılması gerektiğine karar verebilmeleri için bir cümlenin ne kadarını görmelerinin yeterli olduğunu ölçüyor. Bunun için katılımcılara bazı kısımları gizlenmiş cümleler gösteriliyor. Oyunun başındaki en kolay seviyede cümlenin hepsi görünüyor ve seviye ilerledikçe cümlelerin daha geniş bir kısmı gizlenerek tahmin yürütmeleri isteniyor. 

Projenize alternatif bir yazım kılavuzu olarak bakılabilir mi?

 Onur Güngör​: Tüm yazım hatalarını tespit etmediğimiz için diyemeyiz.

 Hasan Öztürk​: Ancak genel amaçlı bir yazım denetleyiciye evrilme ya da hâlihazırdaki bir yazım denetleyiciye eklenme imkânının olduğunu söyleyebiliriz.

Kullanıcılara bir test sunuyorsunuz ancak bu testin sonuç skoru yok. Kullanıcı – de, -da hatalarıyla ilgili bir skor alacak mı, böyle bir çalışma düşünüyor musunuz?

Onur Güngör​: Aslında bu bir testten ziyade bir deney. Bu deney insanların bireysel başarısını ölçmek için tasarlanmadı. Deney sonrasında bazı hesaplamalarda kullanmak üzere tüm katılımcıların anonimleştirilmiş verileri üzerinden ortalama olarak ne kadar başarılı olduklarını hesaplayacağız.

Testte yer alan son sorularda bahsi geçen cümleye dair bir ipucu olmadan de ve da takılarının doğru veya yanlış kullanımı soruluyor. Kullanıcının cümleyi tahmin etmesi mi gerekiyor?

Hasan Öztürk​: Öncelikle deneyimize katılıp bu problemin çözülmesine katkıda bulunduğunuz için teşekkür ederiz. Bu deneyi kurgularken amacımız -de/-da kullanımının cümlenin hangi kısımlarına bağlı olduğunu anlamaktı. Örneğin, -de/-da kullanımı -de/da ek ya da bağlacından önceki sözcüklere mi daha çok bağlıdır, yoksa sonrakilere mi? -de/-da kullanımı -de/-da ek ya da bağlacına yakın kelimelere mi daha çok bağlıdır, yoksa uzaktakilere mi? gibi soruların cevabını arıyoruz. Bunun için cümlelerin çeşitli kısımlarını saklayıp kullanıcıdan -de/-da’nın doğru kullanımını tahmin etmelerini bekleyerek sakladığımız kısımların ne kadar önemli olduğunu ölçüyoruz. Deneyi giderek zorlaşacak şekilde kurguladık ve son 5 soruda bir kelime hariç tüm kelimeleri saklıyoruz. Bu kısımda çoğu zaman doğru kullanımı bilmek imkânsız olsa da bu kısımda ilginç sonuçlar çıkabileceğini düşünüyoruz. 

Hasan Öztürk​: Öncelikle bu çalışmanın topladığı ilgi bizi çok mutlu etti. Bir hafta içerisinde -de/-da yazım hatası bulucu​ üzerinde 90 binden fazla cümle denendi. Ayrıca bahsettiğimiz deneyde de 14 binden fazla soru çözüldü. Bu durum bize göre insanların bu konuda ne kadar hassas ve duyarlı olduklarını gösteriyor ve bizi bu çalıştırmayı geliştirme ve benzer konularda yeni çalışmalar düzenleme konusunda cesaretlendiriyor.  Deneye katılanlardan tüm ekibe farklı kişilerden farklı kanallardan geri besleme ve soru yağdı. Bu çalışmanın altyapısını öğrenmek isteyen birçok mesaj aldık. Deneyimizi ve hata bulucuyu anlatan bir blog yazısını, ilgili kod altyapısını ilerleyen günlerde paylaşacağız. Ayrıca deneyimizin sonuçlarını açıklayan bir makaleyi hazırlamaya şimdiden başladık bile. İlgilenen okurları sitemizdeki “Hakkımızda” sayfasını ve ​Twitter hesabımızı​ takip etmeye davet ediyoruz.

Suzan Üsküdarlı​: Hem hata bulucu hem de deneyimizi yaptığımız web sayfasını açık kaynaklı olarak geliştirdik. Bu çalışma sırasında oluşturulan kaynaklar ve deneyde toplanan veriler anonimleştirildikten sonra paylaşılacaktır. Özellikle Türkçe doğal dil işleme konusunda yapılan çalışmaların açık olarak paylaşılmasını çok önemli buluyoruz. Bu şekilde Türkçe dili için oluşturulmuş çalışmalar daha çok çalışmaya sebep olacak ve hepimizin kullanabileceği kaynaklar çoğalacaktır.  Son olarak böyle bir çalışmaya pek çok kişinin gönüllü olarak katılması ve ondan da ötesi yapılan işi merak etmiş olup bize sorular sormuş ve önerilerde bulunmuş olmaları çok sevindirici. 

Kaynak: https://haberler.boun.edu.tr/tr/haber/bogazicililerden-de-da-takintisi-icin-web-sitesi

İlk yorum yapan siz olun

Bir Cevap Yazın