Wednesday, 8 June 2022

LanganaT ne yapabilir, ne yapmalı?

 LanganaT ne yapabilir, ne yapmalı?


1-Bir referans dosya ya da kitabı önceden batch olarak PARSE eder.
Özne ve nesneleri belirler.
2- Gelecek soruyu online olarak alır ve PARSE eder.
Özne ve nesneleri ayırır, soruyu belirler.
3- Soruya göre, örneğin bisikleti ilk kim yaptı? sorusuna göre,
arama metnini lokalize eder.
4- Odaklandığı metinler içinde bisiklet ve buldu kelimelerini
arar, o cümlenin öznesini bulur.  
5- Bulduğu özneyi özel isimler listesinde kontrol eder.
6- Özneyi, soru cümlesinde 'kim' kelimesi yerine yerleştirir
ya da yeni bir cümle yapar ve soruyu cevaplar.

Bu mantık herhangi bir uzmanlık alanında çok kalın kitaplardan
bilgi çıkartmak için kullanılabilir.

Örneğin (İzmir Ege Tıp fakültesi hastahanesi başhekimi Adil ESEN (AFL78)
üroloji için hazırladıkları bir kitap metnini göndermişti bana.
Bu metnin işlenmesi Tıp deyimleri sözlüğünü gerektirir.  Fakat
LanganaT PARSER'ı otomatik tarama ve bilgi bulma amacıyla kullanılabilir.)
Aynı mantık, İngilizce bir PARSER olmak şartı ile Uçak Bakım
sürecinde bakım süresini kısaltmak için kullanılabilir ve ekonomik
olarak çok yüksek artı değer getirir. (Yaptığım İngilizce tercüme
motorunda çok gelişmiş olmasa da bir İngilizce PARSER var).

Anlamak bilmekten daha geniş ve derin bir kavram.
Bisikleti kim icad etti? sorusu Bisikleti ilk kim yaptı?
Bisikleti kim buldu?  Bu üç soru da doğru ve aynı cevaplanmalı.

Bu bir eş anlamlar sözlüğü, deyimler sözlüğü ve nihayet bir
thesaurus ve semantik sözlük gerektirir.  Çok sınırlı bir deyimler sözlüğü
kullanıyor LanganaT.  Sözlüklerin hazırlanması ise güçlü tarayıcı ve
bulucu programlar gerektiriyor.

Bu programların geliştirilmesi için ise Türkçe CORPUS oluşturmak gerekiyor.
Corpusların seçilecek konuya hatta üsluba (gazete makalesi, bilimsel makale) 
göre de seçilmesi gerekiyor.  Elimde 1 milyon kelimelik sınırlı bir edebi 
Corpus var.  Bunun içinde bile dilin eskiliğine ve yazarlara göre farklılıklar var.
 
AMAÇ: Büyük verilerin içerdiği metinlerin kolaylıkla işlenmesini sağlayacak
araçlar geliştirmek.  Örneğin bir kuruluşun (bir banka, silahlı kuvvetler,
Facebook, internet yazıları) bütün iletişimlerinin izlenmesi ve istenen
sorulara cevap bulunması.  Bu işlemin yüzlerce seçenek oluşturan anahtar
kelimeler yerine daha sınırlı anlamsal şekilde ve çabuk gerçekleştirilmesi.
Nihai hedef, bir insanın zihinsel işleyişine benzer yaklaşımlarla OTOMATİK ANLAMA.