Accessibility links

როგორ იქმნება „ქართული დიალექტური კორპუსი“


მარინე ბერიძე
ამ კვირაში საქართველოს ეროვნულ ბიბლიოთეკაში გაიმართა „ქართული დიალექტური კორპუსის“ პრეზენტაცია. ენათმეცნიერების ინსტიტუტის პროექტის „საქართველოს ლინგვისტური პორტრეტის“ ფარგლებში შექმნილი კორპუსი თანამედროვე ტექნოლოგიებზე დაფუძნებული სისტემაა. მისი საშუალებით შესაძლებელია ქართული ენის ნებისმიერი ქვესისტემის, ან სხვა ქართველური ენების მონაცემთა შენახვა, აღწერა და კვლევა.

ლინგვისტური ატლასის ლაბორატორია, რომელიც ქართული ენის და მისი დიალექტების დოკუმენტირებაზე იყო ორიენტირებული, არნოლდ ჩიქობავას სახელობის ენათმეცნიერების ინსტიტუტში წლების წინ ჩამოყალიბდა. დღეს ამ ლაბორატორიას ეწოდება ენობრივ მონაცემთა კომპიუტერული დამუშავების განყოფილება. მისი ხელმძღვანელი მარინე ბერიძე იხსენებს, რომ ლინგვისტური ატლასის ლაბორატორიაში მუშაობისას სირთულეებს აწყდებოდა, რადგან ტექნოლოგიების ცვლის კვალდაკვალ ჩნდებოდა დისონანსი დროის მოთხოვნებსა და იმ საქმეს შორის, რომელსაც კოლეგებთან ერთად აკეთებდა.
თბილისში მე-20 საუკუნე ლინგვისტურად ჯერ კიდევ სუნთქავს. შევადგენდი სიას იმ ადამიანების, რომლებშიც ეს მე-20 საუკუნე უნდა დავიჭირო ლინგვისტურადაც, ისტორიულადაც, კულტურულად, მენტალურად და ა.შ. გარკვეული მეთოდოლოგიის დაცვით ჩავიწერდი ამ ადამიანებს და შევქმნიდი მონაცემთა მინიბანკს...
მარინე ბერიძე

„თუ ქართველურ ენებს არ ჩავთვლით, მხოლოდ ქართულს 17 დიალექტი აქვს. ლაბორატორია ენობრივი მოვლენების კარტოგრაფირებას ახდენდა“, - ამბობს მარინე ბერიძე. მაგალითად, დაერთვის თუ არა ხმოვანფუძიან სახელებს იოტი სახელობით ბრუნვაში? პასუხად ენათმეცნიერებს რუკა უნდა გაეკეთებინათ და დიალექტური საზღვრების იდენტიფიკაცია მოეხდინათ. „თქვენ იცით, მე-20 საუკუნეში რა მიგრაცია იყო საქართველოში. ფაქტობრივად, ამ სამუშაომ აზრი დაკარგა, იმიტომ რომ თქვენ ამ იოტის რუკას გააკეთებთ, ან შეცდომით რაღაც საზღვრებს შემოხაზავთ, არადა, ყველამ იცის, რომ ვთქვათ, ლაგოდეხში იმერლები ცხოვრობენ უკვე ერთი საუკუნეა და იქ დიალექტური კუნძულია წარმოქმნილი. ამიტომ, რთული იყო იმის განცდა, რომ რამდენიც უნდა აკეთო, ეს არასდროს დამთავრდება. თანაც, აზრი ხელიდან გვეცლებოდა“, - უთხრა რადიო თავისუფლებას მარინე ბერიძემ. მან 2004 წელს, ეროვნული სამეცნიერო ფონდის მიერ გამოცხადებული კონკურსისთვის შექმნა პირველი პროექტი ციკლიდან „საქართველოს ლინგვისტური პორტრეტი,“ რომელიც გულისხმობდა ქართული ენობრივი მრავალფეროვნების ფართომასშტაბიან დოკუმენტირებას და საკვლევი ინსტრუმენტის შექმნას. ამ ყველაფერს თეორიულ საფუძვლად დაედო ლინგვისტიკური მიმართულება, რომელმაც მსოფლიოში განვითარება მე-20 საუკუნის 60-იანი წლებიდან დაიწყო. საუბარია კორპუსის ლინგვისტიკაზე. მარინე ბერიძე ამბობს, რომ დასახული მიზნის შესრულება სწორედ კორპუსის ლინგვისტიკის საფუძვლებზე დაყრდნობით გადაწყვიტეს: „თუ მაშინ იყო ეს უსასრულობის, უშედეგობის და უმწეობის განცდა, ეხლა არსებობს ეს კორპუსი. რომ წარმოვიდგინოთ ძალიან მოხერხებული და კომფორტული კარადა, სადაც ყველაფერს თავისი, წინასწარ განსაზღვრული უჯრა აქვს. უკვე ისეა მოწესრიგებული, რომ თუ გადაწყვეტთ, რომ ცოტა დამეხმაროთ, ხვალიდანვე შეგიძლიათ ადგილი მონახოთ, ჩაერთოთ და რაღაც უბანი ჩაიბაროთ.“

„ქართული დიალექტური კორპუსის“ სამეცნიერო ხელმძღვანელმა თავად გვიკარნახა ერთი ასეთი უბანი, რომელიც იმ იმედით, რომ მონაწილეობას ბევრი ადამიანი მიიღებს, მომავალ სამუშაო გეგმაში უკვე შეტანილი აქვს: „თბილისში მე-20 საუკუნე ლინგვისტურად ჯერ კიდევ სუნთქავს. შევადგენდი სიას იმ ადამიანების, რომლებშიც ეს მე-20 საუკუნე უნდა დავიჭირო ლინგვისტურადაც, ისტორიულადაც, კულტურულად, მენტალურად და ა.შ. გარკვეული მეთოდოლოგიის დაცვით ჩავიწერდი ამ ადამიანებს და შევქმნიდი მონაცემთა მინიბანკს. ის შეიძლება იყოს თემატური, ასაკობრივი, საზოგადოების სხვადასხვა ფენის წარმომადგენლების, ან ყველაფერი ერთად.“

მარინე ბერიძის თქმით, შედეგად შემოგვრჩება კონკრეტული ეპოქის ქალაქური მეტყველების ენობრივი ძეგლი და ამასთან, იმავე ეპოქის ზეპირი ისტორია, რომელსაც ადამიანის მეხსიერება ინახავს. გახსენების შეუქცევადი პროცესის მოწმენი ენათმეცნიერები განსაკუთრებით ხშირად ხდებიან ექსპედიციებისას თურქეთში, საინგილოსა და ფერეიდანში, სადაც სამუშაოდ დაბრუნებულებს ახალ-ახალ ჩანაწერეს ახვედრებენ. „ფერეიდანში მაგალითად, ას გვერდიანი წიგნი შევსებული დაგვახვედრეს. მოხუცი ცოლ-ქმარია, რომლებსაც უდევთ ეს წიგნი და რაც გაახსენდებათ მაშინვე წერენ“, - უამბო რადიო თავისუფლებას მარინე ბერიძემ.
მარტივად გამოსაყენებლად კორპუსს მრავალმხრივი და სწრაფი ძიების სისტემა აქვს. ვთქვათ, მხოლოდ ამა და ამ ასაკის ქალების ჩანაწერი მინდა, ან მხოლოდ მიგრირებულების, ან რომელიმე სიტყვა მინდა ამა და ამ ბრუნვასა და რიცხვში. ან, ეძებთ სიტყვა სამშობლოს და თქვენ გეძლევათ ყველა კონტექსტი. და აღმოაჩენთ, რომ თქვენ დროში ამ სიტყვას რაღაც სხვა მნიშვნელობაც შეუძენია...
მარინე ბერიძე

თითქმის 10 წელია აუდიო და ვიდეოჩანაწერებისთვის ენათმეცნიერები გაცილებით ხარისხიან აპარატურას იყენებენ, ვიდრე ადრე. „ქართული დიალექტური კორპუსი“ ტექსტური მასალის გარდა მრავალი ასეული საათის ხანგრძლივობის ასეთ ჩანაწერებსაც მოიცავს. მათ შორის ენათმეცნიერების ინსტიტუტის მკვლევრების მიერ გასული საუკუნის შუა პერიოდიდან გაკეთებულ ჩანაწერებს. მათი დიდი ნაწილი არცთუ ხარისხიანი იყო, მაგრამ დღეს უკვე ციფრული სახე აქვს და შესაბამისად, განადგურება აღარ ემუქრება. კორპუსი მოიცავს ადამიანების ნაამბობს, მიგრაციის მარშრუტებსა და შედეგებს, ტოპონიმებს, საკუთარ სახელებს, მოგონებებს ისტორიულ პიროვნებეზე, ცნობებს სახალხო დიპლომატიის და ერთაშორის ურთიერთობების შესახებ, კულინარიულ რეცეპტებს და ფოლკლორულ ვარიაციებს. ფილოლოგების და პროგრამისტების ჯგუფის წყალობით „ქართულ დიალექტურ კორპუსში“ ამჟამად დაახლოებით მილიონ-ნახევარი სიტყვაა და მისი შევსება გრძელდება. კორპუსის საცდელი ვერსია 2009 წელს შეიქმნა. ტექნოლოგიურად მის დახვეწას დღემდე უზრუნველყოფს პროგრამისტი დავით ნადარაია. „კორპუსი მუდმივად ივსება, ქართული ენის, ან მისი რომელიმე ჭრილის მიკრომოდელს წარმოადგენს და შესაბამისად, უამრავ ტექსტს შეიცავს“, - ამბობს მარინე ბერიძე. მისივე თქმით, „მარტივად გამოსაყენებლად კორპუსს მრავალმხრივი და სწრაფი ძიების სისტემა აქვს. ვთქვათ, მხოლოდ ამა და ამ ასაკის ქალების ჩანაწერი მინდა, ან მხოლოდ მიგრირებულების, ან რომელიმე სიტყვა მინდა ამა და ამ ბრუნვასა და რიცხვში. ან, ეძებთ სიტყვა სამშობლოს და თქვენ გეძლევათ ყველა კონტექსტი. და აღმოაჩენთ, რომ თქვენ დროში ამ სიტყვას რაღაც სხვა მნიშვნელობაც შეუძენია.“

„ქართული დიალექტური კორპუსის“ შემქმნელების ამოცანა საზოგადოების ინფორმირება და მასში მომხმარებლის დამოკიდებულების გაღვიძებაცაა. ამ მიზნით დაგეგმილი შეხვედრების დასაწყისი იყო კორპუსის მხარდამჭერ საქართველოს ეროვნულ ბიბლიოთეკაში 10 თებერვალს გამართული პრეზენტაცია. ენის კორპუსი თანამედროვე მსოფლიოს ყველა ცივილიზებულ სახელმწიფოს აქვს. მათგან პირველი იყო დიდი ბრიტანეთი, სადაც ინგლისური ენის „ბრაუნის კორპუსის“ შექმნა გასული საუკუნის 60-იანი წლებიდან დაიწყო. დღეს მსოფლიოს დიდ ნაციონალურ კორპუსებში უკვე მილიარდობით სიტყვაა. „ქართული დიალექტური კორპუსის“ სამეცნიერო ხელმძღვანელი მარინე ბერიძე კორპუსს ახალ კულტურულ რეალობას უწოდებს: „დაახლოებით ისეთია, რომ ვიცოდეთ მრავალენოვანი, განმარტებითი, ეტიმოლოგიური და სხვა ლექსიკონების არსებობა, მაგრამ ვიცოდეთ სხვის მაგალითზე და ჩვენ ლექსიკონები არ გვქონდეს. დაახლოებით ასეთივე კულტურული დეფიციტია, როცა ერს არ აქვს შექმნილი ტექსტური კორპუსი.“ მარინე ბერიძის თქმით, საქართველოშიც და უცხოეთშიც დღეს მუშაობენ მეცნიერები, რომლებსაც ერთ დღეს, როცა საზოგადოება, ან ხელისუფლება მოიკითხავენ გვაქვს თუ არა ასეთი კორპუსი, შეუძლიათ სიამაყით თქვან, რომ ეს საქმე გააკეთეს მაშინ, როცა მის შესახებ სხვებმა ჯერ კიდევ არაფერი იცოდნენ.
XS
SM
MD
LG