Thursday, 5 June 2014

LANGANA Türkçe parser projesinde son durum Haz 2014

LANGANA Türkçe yazıları okuyup ilgili soruları cevaplayan bilgisayar programı çalışmamda en son ÖZNE ile NESNE'yi diğer kelimelerden ayırmıştım.  Daha sonra, bu çalışmanın sonuçlarını kullanarak ÖZNE ile NESNE'yi birbirlerinden ayırma çalışmasına başlamıştım.

LANGANA - ÖZNE ile NESNE ayrımı yapan programım başarı ile bitmeye yaklaşıyor.
Bu çalışmamın sonunda, STEINBECK'in "Farelere ve İnsanlara Dair" kitabının ilk
1000 cümlesi aşağıdaki şekilde minimum hata ile çıkmış olacak.  Elde iki dosya olacak.
Bir dosya yalnız (özne) ve {nesne} şeklinde cümleleri ve cümle numarasını verecek.
İkinci dosyada bu cümle nosunu kullanarak, yapılan işlemlerin ayrıntılarına erişilecek.
Bir örnek olması için en altta bir örneğin iki türlü bilgilerini sundum.

Daha sonra, ÖZNE-NESNE ayrımında deyimin son kelimesinin tespit edilmiş olmasından
faydalanarak ÖZNE ve NESNE'yi oluşturan kelime grupları belirlenecek.  Böylece
ÖZNE ve NESNE belirleme çalışması tamamlanmış olacak.

Bir ara aşama olarak bu ana kadar yapılmış olan bütün LANGANA modüllerinin temizlenmesi
düzenlenmesi gerekiyor.

Daha sonra, elde edilmiş olan ÖZNE, NESNE ve FİİL/FİİLİMSİ'den faydalanarak
yer-zaman TÜMLEÇLERİ ve diğer TÜMLEÇLER belirlenecek.

Bu aşamaya ulaşınca, "Farelere ve İnsanlara Dair" kitabının tümünü bir pseudo dile
dönüştürmüş olacağım.  LANAGANA bu ara mamül kitabı kullanarak, bu kitaba ilişkin
sorulara doğru cevap verecek.  Demo amaçlı, bir WEB arayüzü yazmak gerekecek.

Türkçe - İngilizce tercüme makinası yazma çalışması da bu aşamadan sonra başlayacak.

468------------------------------------------------------------
 Âdi keten bezinden mavi renkte bir {tulum} giymiş,
 sol elinde kocaman bir {süpürge} vardı,
 ihtiyarın arkasından (George),
 onun
 da arkasından (Lennie) içeri girmişlerdi,
 (ihtiyar):
 (Patron),
 dün gece geleceksiniz diye bekliyordu,
 dedi

285------------------------------------------------------------
 Lennienin (yüzü),
 dehşetten şekil
 ve {ifadesini} kayıp etmişti

274------------------------------------------------------------
 (Lennie),
 yanan ateşin üstünden,
 karşısında duran Georgea bakarak sabırlı bir sesle:
 (Ben) {fasulyeyi} domates salçasıyla severim,
 dedi

400------------------------------------------------------------
 (George) biraz durduktan sonra:
 (Ben)
 de
 amma
 da saçmalıyorum ha,
 dedi
 ve cebinden {çakısını} çıkararak:
 Artık alt {tarafını} anlatmaya {vaktim} yok,
 diye ilâve etti

320------------------------------------------------------------
 Bir an {gözlerini} ateşten ayırarak ırmağın karşı tarafındaki karanlıklara baktı
 ve:
 George,
 dedi,
 {seni} bırakıp gitmemi,
 {seni} yalnız başına {bırakmamı} mı istiyorsun
 SENTENCE NO = 439 *************28**167*****************************************

439------------------------------------------------------------
 Ateşin (alevleri) alçaldıkça aydınlık (yerler) azalıyordu;
 eğri (dallar) artık görünmemeye başlamış,
 şimdi sadece hafif bir parıltıdan ibaret kalan ateşte
 ancak ağaç gövdelerinin {seçilmesi} mümkün olabiliyordu

buf_sub_struct_list()------------------------------------------------------------

439 0 SENTENCE( SUB(
439 0 0 3569 İsim null Ateş nounExt in %%?in% null null null
ÖZNE-NESNE =====>  alevleri
ARS i=1 k=1
439 1 0 1722 İsim null alev nounExt leri #ler%%?i% null null null
439 2 0 1652 Fiil nsz alçal nounFromVerbExt dıkça -dı-k-ça null null null
ÖZNE-NESNE =====>  aydınlık yerler
ARS i=3 k=2
439 3 0 3924 İsim null aydınlık null null null null null null
439 4 0 56679 İsim null yer nounExt ler #ler%%% null null null
439 5 0 4152 Fiil nsz azal verbExt ıyordu ::-ıyor-du: null null null
439 6 ;SUB(
439 6 0 15642 Sıfat null eğri null null null null null null
ÖZNE-NESNE =====>  dallar
ARS i=7 k=1
439 7 0 11896 İsim null dal nounExt lar #lar%%% null null null
439 8 0 3113 Sıfat null artık null null null null null null
439 9 0 20376 Fiil nsz,-e görün nounFromVerbExt memeye -meme-ye null null null
439 10 0 5335 Fiil -e başla verbExt mış ::-mış: null null null
439 11 ,SUB(
439 11 0 48754 Zarf null şimdi null null null null null null
439 12 0 43474 Zarf null sadece null null null null null null
439 13 0 21315 Sıfat null hafif null null null null null null
439 14 0 6880 İsim null bir null null null null null null
439 15 0 40853 İsim null parıltı nounExt dan %%%&dan null null null
439 16 0 23888 Sıfat null ibaret null null null null null null
439 17 0 27013 Fiil nsz kal adjectiveFromVerbExt an .an null null null
439 18 0 3569 İsim null ateş nounExt te %%%&te null null null
439 19 ==>CONJUNCTSUB(
439 19 0 2311 Bağlaç null ancak null null null null null null
439 20 0 729 İsim null ağaç null null null null null null
439 21 0 20457 İsim null gövde nounExt lerinin #ler%%?in%?in null null null
ÖZNE-NESNE =====>  seçilmesi
ARS i=22 k=1
439 22 0 44676 Fiil nsz seçil nounFromVerbExt mesi -me-si null null null
439 23 0 37261 Fiil null mümkün null null null begFiil 37261 1
439 24 0 38929 Fiil nsz ol verbExt abiliyordu +abil::-iyor-du: endFiil 37261 1
439 25 .END-SENTENCE)

buf_verbose_list()------------------------------------------------------------

 Ateşin alevleri alçaldıkça aydınlık yerler azalıyordu;
 eğri dallar artık görünmemeye başlamış,
 şimdi sadece hafif bir parıltıdan ibaret kalan ateşte
 ancak ağaç gövdelerinin seçilmesi mümkün olabiliyordu

buf_struct_only_list()------------------------------------------------------------

SENTENCE( SUB(
439 0 ateş in
439 1 alev leri begso ending-ext=leri
439 2 alçal dıkça ------------nounFromVerb type=nsz
439 3 aydınlık begso
439 4 yer ler endso ending-ext=ler
439 5 azal ıyordu --------------------verbExt type=nsz
;SUB(
439 6 eğri
439 7 dal lar begso ending-ext=lar
439 8 artık
439 9 görün memeye ------------nounFromVerb type=nsz,-e
439 10 başla mış --------------------verbExt type=-e
,SUB(
439 11 şimdi
439 12 sadece
439 13 hafif
439 14 bir
439 15 parıltı dan
439 16 ibaret
439 17 kal an ------------adjectiveFromVerb type=nsz
439 18 ateş te
==>CONJUNCTSUB(
439 19 ancak
439 20 ağaç
439 21 gövde lerinin
439 22 seçil mesi begso ending-ext=mesi------------nounFromVerb type=nsz
439 23 mümkün
439 24 ol abiliyordu --------------------verbExt type=nsz
.END-SENTENCE)
439 25


Process structure*****************************

;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;FORWARD SCAN
SENTENCE( SUB(
439 0 ateş in
439 1 alev leri begso ending-ext=leri
439 2 alçal dıkça ------------nounFromVerb type=nsz #endSO=1 #punct=0 #conj=0

---------------------------------------------Phenemonon List
phenom data[1]=1 alev leri alçal dıkça nsz--->MULTI CONJ=1 0 0
 ÖZNE nszzzzezezez3


;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;FORWARD SCAN
439 3 aydınlık begso
439 4 yer ler endso ending-ext=ler
439 5 azal ıyordu --------------------verbExt type=nsz #endSO=1 #punct=0 #conj=0

---------------------------------------------Phenemonon List
phenom data[1]=4 yer ler azal ıyordu nsz--->MULTI CONJ=1 0 0
 ÖZNE nszzze1


;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;FORWARD SCAN
;SUB(
439 6 eğri
439 7 dal lar begso ending-ext=lar
439 8 artık
439 9 görün memeye ------------nounFromVerb type=nsz,-e #endSO=1 #punct=1 #conj=0
439 10 başla mış --------------------verbExt type=-e #endSO=1 #punct=1 #conj=0

---------------------------------------------Phenemonon List
phenom data[2]=7 dal lar başla mış -e--->MULTI CONJ=1 1 0
 ÖZNE nszzze1


;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;FORWARD SCAN
,SUB(
439 11 şimdi
439 12 sadece
439 13 hafif
439 14 bir
439 15 parıltı dan
439 16 ibaret
439 17 kal an ------------adjectiveFromVerb type=nsz #endSO=0 #punct=1 #conj=0
439 18 ateş te
==>CONJUNCTSUB(
439 19 ancak
439 20 ağaç
439 21 gövde lerinin
439 22 seçil mesi begso ending-ext=mesi------------nounFromVerb type=nsz #endSO=1 #punct=1 #conj=1
439 23 mümkün --------------------verbRoot type=null #endSO=1 #punct=1 #conj=1
439 24 ol abiliyordu --------------------verbExt type=nsz #endSO=1 #punct=1 #conj=1

---------------------------------------------Phenemonon List
phenom data[3]=22 seçil mesi ol abiliyordu nsz--->MULTI CONJ=1 1 1
 NESNE nszzzzezezez3


;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;FORWARD SCAN

439------------------------------------------------------------

439------------------------------------------------------------
 Ateşin (alevleri) alçaldıkça aydınlık (yerler) azalıyordu;
 eğri (dallar) artık görünmemeye başlamış,
 şimdi sadece hafif bir parıltıdan ibaret kalan ateşte
 ancak ağaç gövdelerinin {seçilmesi} mümkün olabiliyordu