HAKKIMIZDA

İstanbul Teknik Üniversitesi Doğal Dil İşleme Grubu, Türkçe Doğal Dil İşleme ve Uygulamaları alanında uzmanlaşmış Türkiye’deki en eski ve en büyük dil teknolojileri grubudur. 2000 yılında kurulan grup, halen İTÜ Bilgisayar ve Bilişim Fakültesi bünyesinde faaliyetlerini yürütmektedir. Doç.Dr. Gülşen Eryiğit’in kurucu üyesi olduğu ve günümüzde koordinatörlüğünü üstlendiği grup halihazırda 3 öğretim üyesi, 5 araştırma görevlisi ve 30’a yakın doktora, yüksek lisans ve gönüllü lisans öğrencisinden oluşmaktadır.

Türkçe doğal dil işleme üzerine farklı seviyelerde araştırmalar yürüten ve bu araştırma çıktılarının telekom, bankacılık, hukuk, otomotiv gibi çeşitli sektörlere uygulamalarına yoğunlaşan grubun üyelerinin yer aldığı öne çıkan araştırma projelerinden bazıları şöyledir:

  • Web2.0 Cümlelerinin Ayrıştırılması, TUBITAK, 2013-2015 (Tübitak Proje Performans Ödülü)
  • Türkçe'den - Türk İşaret Diline Otomatik Çeviri Sistemi ve Avatar Animasyonu,TUBITAK,2014-2016
  • Akıllı Telefon ve Tabletler Üzerinde Türkçe Kişisel Asistan Uygulaması, T.C. Bilim Sanayi ve Teknoloji Bakanlığı SANTEZ, 2013-2014
  • Türkçe’nin Bağlılık Çözümlemesi, ITU BAP, 2005-2007
  • Türkçe-İngilizce (2011-2013) and Türkçe-Türkmence (2006-2009) Makine Çevirisi

Yıllar içerisinde kuvvetli endüstriyel ilişkiler geliştirmiş olan grup, üniversite-sanayi işbirliği çerçevesinde  pek çok endüstri odaklı projede yer almış ve almaya devam etmektedir. Bu projelerden bazıları  “Otomotiv Destek Kanalları Diyalog Sistemi”, “Telekom Alanında Hedefe Dayalı Duygu Analizi”, “Gürültülü Bankacılık Metinleri Üzerinden Bilgi Çıkarımı”, “Bankacılık Diyalog Sistemleri”, “Hukuksal Dokümanlar üzerinde Metin Analizi” olarak sıralanabilir.

Grup doğal dil işleme alanında çalışan araştırmacılara pek çok Türkçe doğal dil işleme temel seviye aracını (örn: metin normalizasyonu, sözcük çözümleyici, cümle çözümleyici ...) sağlamaktadır. Bunlardan bazıları aynı zamanda  tools.nlp.itu.edu.tr adresi üzerinden web servis olarak hizmet vermektedir. Benzer şekilde grup tarafından üretilen pek çok önemli veri kümesi (örn: Türkçe Ağaç Yapılı Derlemler, Çok Sözcüklü terim ve varlık ismi kaynakları, Türk İşaret Dili kaynakları …) aynı adres üzerinden araştırmacılar ile paylaşılmaktadır.

İTÜ DDİ grubu, UD (Universal Dependencies), CLARIN (Common language resources and technology infrastructure, EU 7th Framework), PARSEME (Parsing and Multiword Expressions, European Cost Action IC1207), ve EnetCollect (European Network for Combining Language Learning with Crowdsourcing Techniques, European Cost Action CA16105) gibi pek çok Avrupa Birliği projesinde aktif olarak rol almış ve almaya devam etmektedir.