Professional sohada tarjimon ishida mashina tarjimasidan foydalanish imkoniyatlari. Mashina tarjimasi: til to'siqlarini engib o'tish
Ish turi:
Mavzu bo'yicha amaliyot hisoboti: Mashina tarjimasi - PROMT mashina tarjimasi tizimi
21.03.2012 10:20:09
Fayl turi:
Virus tekshiruvi:
Tekshirildi - Kasperskiy antivirusi
To'liq matn:
Kirish …………………………………………………………………………… ..2
I bob. Mashina tarjimasi
Mashina tarjimasi tarixi ………………………………………….… 4
Mashina tarjimasi qanday amalga oshiriladi …………………………… ..10
Mashina tarjimasi tizimlari va ularning tasnifi ………………………… 13
Mashina tarjimasi sifati ………………………………………… ..18
II bob. PROMT mashina tarjimasi tizimi
2.1 PROMT oilasining mashina tarjimonining xususiyatlari …………… 22
2.2 Mashina tarjimasi tizimi va inson tomonidan qilingan badiiy matn tarjimalarining qiyosiy tahlili ... ... ... ... 26
Xulosa …………………………………………………………….… .30
Bibliografiya ……………………………………………………………… ..31
Kirish
tarjima (lingvistik vositachilikning bir turi, bunda asl nusxaning chet el matni mazmuni shu tilda kommunikativ jihatdan ekvivalent matn yaratish orqali boshqa tilga uzatiladi. turli til hamjamiyatlari vakillari oʻrtasidagi muloqotda vositachilik qilishga qodir.
Kommunikativ ekvivalentlik deganda tarjima qilingan matnning asl matnni toʻliq oʻrnini bosuvchi vazifasini bajarish qobiliyati tushuniladi (7-son).
Yangi matnning asl nusxaga nisbatan kommunikativ ekvivalentligi quyidagilar bilan ta'minlanadi:
· Asl tarkibni to'liq hajmda o'tkazish;
· Tarjima matnining matn tili me’yoriga muvofiq asl matnga muvofiqligi;
· Tarjima matni xuddi shunday stilistik effektga erishish uchun lakonizm va batafsil bayonlar nuqtai nazaridan asl nusxaga mos kelishi kerak. Shuningdek, tarjima hajmi bo'yicha taxminan taqqoslanadigan bo'lishi kerak.
Muvofiqlik Bu muammo shaxsiy kompyuterlarni (avtomatik tarjima qilish qobiliyatiga ega) ishlab chiqish va kundalik hayotga joriy etish tarixi o'n besh-yigirma yildan oshmaganligi bilan bog'liq. Bugungi kunda tarjimon dasturlari mazmunli iboralar va oddiy jumlalarni yaratishga qodir, so'nggi bir necha yil ichida tarjima sifati yaxshilandi.
Tadqiqot ob'ekti mashina tarjimasi tizimidir.
Tadqiqot mavzusi PROMT XT tizimi tomonidan qilingan tarjimadir.
Biroq, ushbu kompyuter dasturlari hali ham grammatika, jarangli iboralar, stilistik uslublar va boshqa ko'rinadigan mayda-chuyda narsalarni yaxshi bilmaydi, ammo ulardan chiroyli, tushunarli tarjima hosil bo'ladi. Zamonaviy dunyoda kompyuterlar tarjimonlar, tilshunoslar va chet tilidagi ma'lumotlarni tezkor tarjima qilishga muhtoj mutaxassislar orasida ham muhim o'rin tutadi.
Kibernetikaning rivojlanishi mashina tarjimasini amalga oshirishga imkon berdi, ya'ni. bir tabiiy tildagi matnni boshqa tildagi ekvivalent matnga aylantirish uchun kompyuterda bajariladigan harakat, shuningdek, bunday harakat natijasi. Hozirgi vaqtda mashina tarjimasini qo'llashning asosiy yo'nalishlari Internet sahifalarini, texnikaga qo'llanmalarni, elektron pochtalarni tarjima qilishdir. Bunday holda, faqat matnni umumiy tushunishga erishiladi. Ushbu tizimlarning yana bir qo'llanilishi professional tarjimonlarning ishini engillashtirish, keyinchalik tahrirlash mumkin bo'lgan interlinear tarjimaga sarflanadigan vaqtni qisqartirishdir.
Maqsad ushbu ishning - tarjima qilish uchun zamonaviy dasturlardan qanday foydalanish mumkinligi, shuningdek ularning samaradorligi qanday ta'rif.
Belgilangan maqsadga muvofiq, vazifalar tadqiqotlar quyidagilardir:
· Mashinali tarjima tizimida tahlil va sintezni ta’minlovchi rasmiy operatsiyalar ketma-ketligini aniqlashtirish (tarjima);
· PROMT XT dasturida ishlab chiqarilgan tarjima misolida mashinali tarjima tizimlarining ishlashini tahlil qilish;
· Tarjima namunalarini inson tarjimasi bilan solishtirish. Qarama-qarshilik sabablarini tahlil qilish.
Ishda, shuningdek, mamlakatimizda va xorijda mashina tarjimasining rivojlanish tarixi yoritiladi. Mashina tarjimasini amalga oshirish algoritmi, mashinali tarjima tizimlarining tasnifi, tarjima sifati muammosi ko'rib chiqiladi.
I bob. Mashina tarjimasi.
1.1 Mashina tarjimasi tarixi
Birinchi marta bir tildan boshqa tilga tarjima qilish mexanizmlaridan foydalanish g'oyasi Leybnits va Dekart tomonidan ilgari surilgan. Ular raqamli kodlar asosida lug'at yaratishga harakat qilishdi. Uzoq vaqt davomida hamma uchun tushunarli bo'lgan, faqat mantiqqa asoslangan, belgilar - piktogrammalardan foydalangan holda yaratilgan til haqida g'oyalar mavjud. Bu sohadagi eng mashhur rivojlanish Jon Uilkinsning "interlingua"sidir. Keyinchalik yana bir nechta sun'iy tillar yaratildi, ulardan eng mashhuri Lev Znamenhof tomonidan esperanto. Tarjimai holga ko‘ra, mashhur matematik Charlz Bebbij Britaniya hukumatini o‘zining “analitik dvigatel”ni ishlab chiqishni moliyalashtirishga ishontirishga urinib, yaqin kelajakda uning mashinasi boshqa narsalar qatori og‘zaki tilni ham tarjima qila olishiga va’da bergan. Ammo mashina hech qachon ishlab chiqilmagan.
1933 yilda mexanik tarjima tizimi uchun ikkita patent berildi - Rossiyada va Frantsiyada. Frantsuz arman Jorj Arsouni 1937 yilda o'zboshimchalik bilan so'zni boshqa tilga tarjima qilish uchun qog'oz lenta qurilmasini ixtiro qildi. tizimning prototipini namoyish etdi. Rossiyada patent Pyotr Smirnov-Troyanskiyga tegishli bo'lib, u o'ziga xos lingvistik qo'shish mashinasini ixtiro qilgan. U mexanik tarjimaning uch bosqichini ajratdi: birinchi bosqichda kirish tilini biladigan kishi so'z va gaplarni "asosiy" shaklda taqdim etdi va so'zlarning sintaktik funktsiyalarini tartibga soldi. Ikkinchi bosqichda mashina ushbu shakl va funktsiyalarni maqsadli tilga tarjima qildi, so'ngra uchinchi bosqichda olingan matnni maqsadli tilning ona tilida so'zlashuvchisi tahrir qildi. Smirnov-Troyanskiy hech bo'lmaganda ikkinchi bosqichni avtomatlashtirish mumkin deb hisoblagan.(15-son).
Mashina tarjimasining ilmiy va amaliy yoʻnalish sifatida tarixi oʻtgan asrning 40-yillari oxiridan boshlangan. 1947 yil mart oyida Rokfeller jamg'armasining Tabiiy fanlar bo'limi direktori Uorren Uiver Edrew But va Norbert Wiener bilan yozishmalarda dastlab mashina tarjimasi kontseptsiyasini shakllantirdi, keyinchalik u (1949 yilda) Jamg'armaga o'zining memorandumida ishlab chiqdi. V. Uiver shunday deb yozgan edi: "Mening oldimda rus tilida yozilgan matn bor, lekin men uni chindan ham ingliz tilida yozilgan va u qandaydir g'alati belgilar bilan kodlangan deb o'ylayman. Men qilishim kerak bo'lgan yagona narsa Matndagi ma'lumotlarni olish uchun kodni o'chirib qo'ying. "" ("Ko'zim oldida rus tilida yozilgan matn bor, lekin men u aslida ingliz tilida yozilgan va juda g'alati bilan kodlangan deb o'ylayman. Men matndagi ma'lumotlarni olish uchun kodni buzishim kerak. ") Ikkinchi jahon urushi davrida kriptografiya erishgan muvaffaqiyatlarni hisobga olgan holda, urushdan keyingi davr kontekstida tarjima va shifrni ochish o'rtasidagi o'xshashlik tabiiy edi.
· Xabarning sof tashqi xususiyatlarini, masalan, alohida elementlarning chastotasi va elementlar kombinatsiyasini o'rganish;
· Matnni tashkil etuvchi elementlarning tarqalishini tadqiq qilish;
· statistik va taqsimot xususiyatlarini hisobga olgan holda, bir-biriga mos keladigan elementlarni aniqlash va ayrim asosiy elementlardan (tegishli nomlar va boshqalar) foydalanish uchun ikki tillilarni tahlil qilish;
· Kalitni topish va uni butun kodlangan xabarlar ketma-ketligiga tatbiq etish (№ 11)
Taxminan bir vaqtning o'zida Klod Shennon axborot nazariyasini shakllantirdi va Norbert Viner kibernetikaning kontseptual asoslarini belgilab berdi. Va tez orada tadqiqot uchun pul ajratildi va mashina tarjimasi matematika va dasturlash chorrahasida tug'ilgan mustaqil ilmiy yo'nalishga aylandi.
Uiver g‘oyalari MTga interlingua yondashuvining asosini tashkil etdi: axborot uzatish bosqichi ikki bosqichga bo‘linadi; birinchi bosqichda asl jumla vositachi tilga tarjima qilinadi (soddalashtirilgan ingliz tili asosida yaratilgan), so'ngra ushbu tarjimaning natijasi maqsadli til yordamida taqdim etiladi. Weaverning memorandumi MT masalasiga eng jonli qiziqish uyg'otdi. 1948 yilda A. But va Richard Richens bir qancha dastlabki tajribalarni o‘tkazdilar (masalan, Richens so‘z shakllarini o‘zak va oxirlarga ajratish qoidalarini ishlab chiqdi).
O'sha yillarda kompyuterlar hozirginikidan tubdan farq qilar edi. Bular juda katta va qimmat mashinalar bo'lib, butun xonalarni egallagan va ularga texnik xizmat ko'rsatish uchun muhandislar, operatorlar va dasturchilarning katta shtatini talab qilgan. Asosan, bu kompyuterlar harbiy muassasalar, shuningdek, universitetlarning matematika va fizika kafedralari ehtiyojlari uchun matematik hisob-kitoblarni amalga oshirish uchun ishlatilgan. Shu sababli, dastlabki bosqichlarda MP tizimlarining rivojlanishi harbiylar tomonidan faol qo'llab-quvvatlandi, AQShda esa asosiy e'tibor rus-ingliz yo'nalishiga, SSSRda esa ingliz-rus yo'nalishiga qaratildi. 1952 yilda mantiqchi va matematik J. Bar-Hillel tomonidan mashina tarjimasi bo'yicha birinchi konferentsiya tashkil etildi. Aniq amaliy ehtiyojlardan tashqari, 1950-yilda ingliz matematigi A.Tyuring tomonidan taklif qilingan mashhur aql-zakovat testi (“Tyuring testi”) haqiqatan ham savol o‘rnini egallaganligi mashina tarjimasining rivojlanishida muhim rol o‘ynadi. mashina odam bilan tabiiy tilda muloqot qila oladimi, u uni inson suhbatdoshidan ajrata olmaydimi, degan savol bilan o'ylay oladimi? Shunday qilib, tabiiy tildagi xabarlarni kompyuterda qayta ishlash masalalari o'nlab yillar davomida kibernetika (keyinchalik sun'iy intellekt) sohasidagi tadqiqotlar markazida bo'lib, bir tomondan, matematiklar, dasturchilar va kompyuter muhandislari, ikkinchi tomondan, tilshunoslar o'rtasida. samarali hamkorlik yo‘lga qo‘yildi.
Aslida, mashina tarjimasi tarixi Jorjtaun tajribasidan boshlanadi. IBM kompaniyasi Jorjtaun universiteti (AQSh) bilan birgalikda birinchi tajribani (tarixga Jorjtaun nomi bilan kirgan) muvaffaqiyatli o‘tkazdi, uning davomida 250 ta so‘zdan iborat lug‘at va 6 ta sintaktik qoidalar grammatikasidan foydalangan holda tizim oldindan tanlangan 49 ta jumlani tarjima qildi. Xuddi shu 1954 yilda SSSRda SSSR Fanlar akademiyasining Aniq mexanika va hisoblash texnikasi institutida I.K.Belskaya (lingvistik qism) va D.Yu.Panov (dasturiy taʼminot qismi) tomonidan mashina tarjimasi boʻyicha birinchi tajriba oʻtkazildi. va birinchi sanoat uchun mos mashina tarjimasi algoritmi va universal kompyuterda ingliz tilidan rus tiliga mashina tarjimasi tizimi Yu.A.Motorin boshchiligidagi guruh tomonidan ishlab chiqilgan. Shundan so‘ng mamlakatimizning ko‘plab axborot institutlari, ilmiy va ta’lim muassasalarida ish boshlandi. Mashina tarjimasi g'oyasi butun dunyoda nazariy va amaliy tilshunoslik bo'yicha tadqiqotlar rivojlanishini rag'batlantirdi. Formal grammatika nazariyalari paydo bo'ldi, til va uning individual tomonlarini modellashtirishga, lingvistik va aqliy faoliyatga, lingvistik shakl va til hodisalarining miqdoriy taqsimoti masalalariga katta e'tibor berildi. Tilshunoslikning yangi sohalari – hisoblash, matematika, muhandislik, statistik, algoritmik tilshunoslik va amaliy va nazariy tilshunoslikning bir qator boshqa tarmoqlari vujudga keldi. 1950-yillarda butun dunyo oʻquv markazlarida amaliy tilshunoslik va mashina tarjimasi boʻlimlari ochildi. Mashina tarjimasi bo'yicha tadqiqotlar va ishlanmalar Frantsiya, Angliya, AQSh, Kanada, Italiya, Germaniya, Yaponiya, Niderlandiya, Bolgariya, Vengriya va boshqa mamlakatlarda, shuningdek, turli tillardan tarjimalar hajmi katta bo'lgan xalqaro tashkilotlarda ham rivojlangan. katta.
Mashinali tarjima tizimlarining birinchi avlodi so‘zma-so‘z va iborama-so‘z ketma-ket tarjima algoritmlariga asoslangan edi. Bunday tizimlarning imkoniyatlari to'g'ridan-to'g'ri kompyuter xotirasi hajmiga bog'liq bo'lgan lug'atlarning mavjud o'lchamlari bilan aniqlandi. Matn tarjimasi alohida jumlalarda amalga oshirilgan, ular orasidagi semantik aloqalar hech qanday tarzda hisobga olinmagan. Bunday tizimlar to'g'ridan-to'g'ri tarjima tizimlari deb ataladi. Vaqt o'tishi bilan ularning o'rnini keyingi avlodlar tizimlari egalladi, ularda tildan tilga tarjima sintaktik tuzilmalar darajasida amalga oshirildi. Tarjima algoritmlarida tarjima qilingan jumlani tahlil qilish orqali uning sintaktik tuzilishini kirish jumla tili grammatikasi qoidalariga muvofiq qurish va keyin uni chiqish gapning sintaktik tuzilishiga aylantirish imkonini beradigan operatsiyalar to'plami ishlatilgan. va lug‘atdan kerakli so‘zlarni o‘rniga qo‘yib chiqish gapni sintez qiling. Bunday tizimlar T-tizimlar deb ataladi (T - inglizcha "transfer - transformatsiya" so'zidan).
Mashinali tarjima tizimlarini qurishga yondashuv eng mukammali, kirish gapning semantik tahlili orqali ba'zi, tildan mustaqil, semantik ifodasini olishga asoslangan. Keyin olingan semantik vakillikka muvofiq chiqish gapning sintezi amalga oshiriladi. Bunday tizimlar I-tizimlar deb ataladi (I - "interlingua" so'zidan). Mashinali tarjima tizimlarining keyingi avlodlari I-tizimlar sinfiga tegishli bo'ladi, deb ishoniladi.
1950-yillarda AQSh va Yevropada bir qator tadqiqot guruhlari MT sohasida ishlagan. Ushbu tadqiqotlarga katta miqdordagi mablag 'sarflandi, ammo natijalar tez orada investorlarning hafsalasi pir bo'ldi. O'sha yillarda MT ning past sifatining asosiy sabablaridan biri texnik vositalar imkoniyatlarining cheklanganligi edi: undagi ma'lumotlarga sekin kirish bilan xotiraning kichik hajmi, yuqori darajadagi dasturlash tillaridan to'liq foydalana olmaslik. Yana bir sabab, lingvistik muammolarni hal qilish uchun zarur bo'lgan nazariy asosning yo'qligi edi, buning natijasida dastlabki MT tizimlari matnlarni hech qanday sintaktik (va undan ham ko'proq semantik) yaxlitliksiz so'zma-so'z tarjimasiga qisqartirildi.
Ma'lum bo'lishicha, an'anaviy tilshunoslikda na faktik materiallar, na tarjima qilingan matnning ma'nosidan foydalanadigan mashinali tarjima tizimlarini yaratish uchun zarur bo'lgan g'oyalar va tushunchalar mavjud emas.
An’anaviy tilshunoslik nafaqat semantika, balki sintaksis nuqtai nazaridan ham dastlabki fikrlarni bera olmadi. O‘sha davrda hech bir til uchun sintaktik konstruksiyalarning ro‘yxatlari yo‘q edi, ularning uyg‘unlik va o‘zaro almashinish shartlari o‘rganilmagan, kichikroqlaridan sintaktik tuzilmaning yirik birliklarini yasash qoidalari ishlab chiqilmagan. Aslini olganda, 1950-yillarda an'anaviy tilshunoslik mashinali tarjima tizimlarini qurish bilan bog'liq hech qanday savolga javob bera olmadi.
Mashina tarjimasining nazariy asoslarini yaratish zarurati tilshunoslikda strukturaviy, amaliy, matematik tilshunoslik deb nomlangan yangi yo‘nalishning shakllanishiga olib keldi.
1959 yilda. faylasuf, matematik, mantiqchi Bar-Hillel yuqori sifatli to'liq avtomatik MT (FAHQMT) ga printsipial jihatdan erishib bo'lmaydi, deb ta'kidladi. Misol tariqasida u qalam so‘zining to‘g‘ri tarjimasini topish muammosini quyidagi kontekstda keltirgan: Jon o‘yinchoq qutisini qidirmoqda. Nihoyat u topdi. Quti qalam ichida edi. Jon juda xursand edi. (Jon o‘yinchoq qutisini qidirayotgan edi. Nihoyat topib oldi. Quti arenada edi. Jon juda xursand edi.). Bu holda qalam "qalam" (yozish vositasi) deb emas, balki "o'yin maydonchasi" (o'yin qalami) deb tarjima qilinishi kerak. U yoki bu tarjimani bu holatda va boshqa bir qatorda tanlash tildan tashqari voqelik haqidagi bilim bilan shartlanadi va bu bilimlar kompyuterga kiritish uchun juda keng va xilma-xildir. Biroq, Bar-Hillel MP g'oyasini inkor etmadi, chunki bu inson tarjimoni tomonidan ulardan foydalanishga qaratilgan mashina tizimlarini rivojlantirishning istiqbolli yo'nalishi ("odam-mashina simbiozi" turi).
Ushbu ko'rsatkich AQShda MT rivojlanishiga eng salbiy ta'sir ko'rsatdi. 1966 yilda Milliy fanlar akademiyasi tomonidan maxsus tuzilgan ALPAC (Tilni avtomatik qayta ishlash bo'yicha maslahat qo'mitasi) komissiyasi Bar-Hillel xulosalariga asoslanib, mashina tarjimasi foydasiz degan xulosaga keldi: MT narxi va sifati nisbati. ikkinchisining foydasiga emasligi aniq. , va texnik va ilmiy matnlarni tarjima qilish ehtiyojlari uchun inson resurslari etarli edi. ALPAC hisobotidan so'ng AQSh hukumati tomonidan MT tadqiqotlari uchun ajratiladigan mablag'lar qisqartirildi - o'sha paytda bir qator harbiy va ilmiy tashkilotlar tomonidan kamida uchta turli MT tizimlari muntazam ravishda qo'llanilganiga qaramay.
Keyingi o'n yil davomida (60-yillar) MT tizimlari Qo'shma Shtatlarda Provo, Yuta shahridagi Brigham Young universiteti tomonidan ishlab chiqilgan (erta tijorat tizimlari WEIDNER va ALPS) va Bibliya tarjimasiga qiziqqan Mormon cherkovi tomonidan moliyalashtirilgan; Kanadada tadqiqot guruhlari, shu jumladan Monrealdagi TAUM METEO tizimi bilan; Evropada - GENA (Grenoble) va SUSY (Saarbrücken) guruhlari tomonidan. ETAP lingvistik protsessorini yaratgan I.A.Melchuk va Yu.D.Apresyan (Moskva) kabi mahalliy tilshunoslarning ushbu sohadagi ishlari alohida e'tiborga loyiqdir. 1960 yilda Leningraddagi Matematika va mexanika ilmiy-tadqiqot instituti tarkibida mashina tarjimasi uchun eksperimental laboratoriya tashkil etildi, keyinchalik u Leningrad davlat universitetining matematik tilshunoslik laboratoriyasiga aylantirildi.
70-yillarning oxirlarida kompyuter texnologiyalarining rivojlanishi bilan (mikrokompyuterlarning paydo bo'lishi, tarmoqlarning rivojlanishi, xotira resurslarining ko'payishi) mashina tarjimasi yangi bosqichga kirdi. Shu bilan birga, urg'u biroz o'zgardi: tadqiqotchilar endi tarjima jarayonining turli bosqichlarida inson ishtirokini nazarda tutgan "real" MT tizimlarini ishlab chiqishni maqsad qilib qo'yishdi.
MT tadqiqotlaridagi yangi yuksalish 1970-yillarda boshlangan va intellektual faoliyatni kompyuter modellashtirishda katta yutuqlar bilan bog'liq edi. Deputatdan biroz keyinroq paydo bo'lgan tegishli tadqiqot sohasi chaqirildi sun'iy intellekt, va mashina tarjimasi tizimlarini yaratish 1970-yillarda ushbu yangi tadqiqot yo'nalishining o'ziga xos vazifalaridan biri sifatida tushunilgan.
Zamonaviy dunyoda mashina tarjimasi ishini rivojlantirish uchun ikkita asosiy rag'bat mavjud. Birinchisi, aslida ilmiy; kompyuter tarjimasini modellashtirishning murakkabligi va murakkabligi bilan belgilanadi. Til faoliyatining bir turi sifatida tarjima tilning barcha darajalariga - grafemalarni (va og'zaki nutqni tarjima qilishda fonemalarni) tan olishdan tortib, nutq va matn ma'nosini uzatishgacha bo'lgan ta'sir ko'rsatadi. Bundan tashqari, tarjima qayta aloqa va ma'lum til darajalarining tuzilishi va taklif qilingan algoritmlarning samaradorligi haqidagi nazariy farazni darhol sinab ko'rish qobiliyati bilan tavsiflanadi. Umuman tarjimaning, xususan, mashina tarjimasining bu xarakterli xususiyati nazariyotchilar e’tiborini tortadi, buning natijasida tarjimani avtomatlashtirish va lingvistik ma’lumotlar va jarayonlarni rasmiylashtirishning yangi nazariyalari vujudga kelishda davom etmoqda.
Ikkinchi rag'bat ijtimoiy bo'lib, u har yili hajmi ortib borayotgan tillararo muloqotni ta'minlashning zaruriy sharti sifatida zamonaviy dunyoda tarjima amaliyotining o'zining roli ortib borayotgani bilan bog'liq. Muloqotdagi til to'siqlarini bartaraf etishning boshqa usullari - bitta tilni ishlab chiqish yoki o'zlashtirish, shuningdek, chet tillarini o'rganish - samaradorlik nuqtai nazaridan tarjima bilan taqqoslab bo'lmaydi. Shu nuqtai nazardan qaraganda, tarjimaga muqobil yo‘q, deyish mumkin, shuning uchun yuqori sifatli va yuqori unumli mashina tarjimasi tizimlarini ishlab chiqish eng muhim ijtimoiy va kommunikativ muammolarni hal qilishga yordam beradi.
1978-93 yillarda AQSHda MT sohasidagi tadqiqotlarga 20 million dollar, Yevropada 70 million, Yaponiyada 200 million dollar sarflandi.
Yangi ishlanmalardan biri TM (tarjima xotirasi) texnologiyasi boʻlib, u jamlash tamoyili asosida ishlaydi: tarjima jarayonida asl segment (gap) va uning tarjimasi saqlanadi, buning natijasida lingvistik maʼlumotlar bazasi shakllanadi. ; agar yangi tarjima qilingan matnda bir xil yoki o'xshash segment topilsa, u tarjima va foiz mosligi ko'rsatkichi bilan birga ko'rsatiladi. Keyin tarjimon qaror qabul qiladi (tarjimani tahrirlash, rad etish yoki qabul qilish), uning natijasi tizim tomonidan saqlanadi. Hozirgi vaqtda TM texnologiyasiga asoslangan mashhur tijorat tizimining ishlab chiqaruvchisi TRADOS tizimi (1984 yilda tashkil etilgan).
SSSRda 1974 yilda Butunittifoq ilmiy-texnikaviy adabiyotlar va hujjatlarni tarjima qilish markazi (VTsP) mashina tarjimasi bo'yicha bosh tashkilot etib belgilandi, u milliy miqyosdagi ishlarni muvofiqlashtirishni o'z zimmasiga oldi. Uning rahbarligida mashina tarjimasi va ilmiy-texnik tarjima muammolariga bag‘ishlangan qator yirik xalqaro ilmiy anjumanlar o‘tkazildi. VTsPda ingliz tilidan rus tiliga AMPAR (Yu.A. Motorin jamoasining tadqiqotlari va ishlanmalari asosida), nemis tilidan rus tiliga NERPA, frantsuz tilidan rus tiliga FRAP, avtomatlashtirilgan terminologik lug'atlar yaratilgan. inson tarjimoni ... AMPAR tizimi uzoq vaqtdan beri tijorat faoliyatida; keyinchalik uning asosida SPRINT oilasining shaxsiy kompyuterlari uchun yanada samarali MT tizimlari yaratildi. HCOC shuningdek, MP tizimini rus tilidan ingliz tilidan ASPERAga ishlab chiqdi. Sanoat MP tizimlarini rivojlantirishga R.G.Piotrovskiy boshchiligidagi Leningrad umumittifoq “Nutq statistikasi” guruhi, shuningdek Minsk (A.V. Zubov), Kishinyov (VA)dagi kompyuter tilshunosligi bo‘yicha mutaxassislar guruhlari katta hissa qo‘shdilar. Chijakovskiy), Maxachqal’a (A.I.Chaplya), Chimkent (K.B.Bektayev), Samarqand (H.A.Arziqulov) va boshqalar.Stilus, Sokrat va boshqalar kabi mashina tarjima tizimlaridan foydalangan holda.
1980-yillarning o'rtalarida amaliy foydalanishni topgan birinchi tijorat mashina tarjimasi mahsulotlari paydo bo'ldi.
Hozirgi vaqtda Rossiya Federatsiyasida "matn-ma'no-matn" yondashuviga asoslangan MT tizimlarida ba'zi ishlar ahamiyatsiz miqyosda davom etmoqda. mashinalarsiz, algoritmlarsiz "(ushbu yo'nalishdagi ishlarni ko'rib chiqing, LN Belyaeva va M.I. Otkupshchikova). Yondashuv g'oyasi shundan iborat ediki, tilshunosdan faqat til faktlarini deklarativ tarzda tasvirlash talab qilinadi (ya'ni, ayniqsa aniq va rasmiylashtirilgan deb da'vo qiladigan lingvistik nazariya) va tarjima algoritmlari dasturchi va matematik. Ushbu tadqiqotlar doirasida muhim nazariy va lingvistik natijalarga erishildi (xususan, lug'atshunoslikda qo'llanilgan leksik funktsiyalar nazariyasi yaratildi), ammo bunday amaliy tizimlarni yaratish uchun yondashuv yetarli darajada samarali emasligi ma’lum bo‘ldi. So'nggi o'n yilliklarda beqiyos o'sgan hisoblash texnikasi imkoniyatlari va yangi dasturlash yondashuvlari keyinchalik ma'noga o'tish bilan faqat sintaktik tuzilmani aniqlash ustuvorligiga asoslangan tahlil va sintez g'oyalarini amalga oshirishga hech qanday yordam bera olmaydi. Inson-mashina interfeysi doirasida matn mazmunini ochish, har qanday amaliy vazifada bo'lgani kabi, faqat deklarativ va protsessual bilimlardan foydalangan holda va lug'atga jiddiy tayangan holda amalga oshirilishi mumkin. Bu nuqtai nazar, xususan, dasturlash va sun'iy intellekt bo'yicha rossiyalik mutaxassis A.S.Narinyanining so'nggi asarlarida isbotlangan.
1.2 Mashina tarjimasi qanday ishlaydi.
MT tizimlari avtomatlashtirilgan matn tarjimasini amalga oshiradi. Bunday holda, tarjima birliklari so'zlar yoki iboralar bo'lib, so'nggi ishlanmalar tarjima qilingan so'zning morfologiyasini hisobga olishga imkon beradi. Ishlab chiqilgan MT tizimlari tarjimani ishlab chiquvchi tomonidan belgilangan va/yoki foydalanuvchi tomonidan sozlangan tarjima algoritmlariga muvofiq amalga oshiradi. Mashina tarjimasini amalga oshirish uchun kompyuterga tarjima algoritmini amalga oshiradigan maxsus dastur kiritiladi, bu A1 - A2 tillarining berilgan juftligida tarjima mosligini topish uchun matnda aniq va qat'iy belgilangan harakatlar ketma-ketligini bildiradi. berilgan tarjima yo'nalishi (bir aniq tildan ikkinchisiga). Mashina tarjimasi tizimi ekvivalent, variant va transformatsion tarjima mosliklarini uzatishni ta'minlash uchun zarur grammatik ma'lumotlar (morfologik, sintaktik va semantik) bilan jihozlangan ikki tilli lug'atlarni, shuningdek, avtomatik ravishda qabul qilingan har qanday rasmiy grammatikani amalga oshiradigan algoritmik grammatik tahlil vositalarini o'z ichiga oladi. matnni qayta ishlash.... Uch yoki undan ortiq tillarga tarjima qilish uchun moʻljallangan alohida mashinali tarjima tizimlari ham mavjud, biroq ular hozirda eksperimental hisoblanadi. Mashina tarjimasi tizimida tahlil va sintezni taʼminlovchi quyidagi rasmiy amallar ketma-ketligi eng keng tarqalgan: 1. Birinchi bosqichda matn kiritiladi va kirish soʻz shakllari (maʼlum grammatik shakldagi soʻzlar, masalan, orttirma soʻz) koʻplik) kiruvchi lugʻatda (tarjima qilingan til lugʻati) qoʻshimcha morfologik tahlil bilan izlanadi, bunda berilgan soʻz shaklining maʼlum leksemaga (lugʻat birligi sifatidagi soʻz) tegishliligi aniqlanadi. Tahlil jarayonida til tizimini tashkil etishning boshqa darajalariga oid ma’lumotlar so‘z shaklidan ham olinishi mumkin. 2. Keyingi bosqich ma'lum bir mavzu bo'yicha idiomatik iboralar, frazeologik birliklar yoki shtamplarni tarjima qilishni o'z ichiga oladi (masalan, inglizcha-ruscha tarjimada shunga o'xshash iboralar shuning uchun bitta raqamli ekvivalentni olish shaklida va ulardan chiqarib tashlanadi. keyingi grammatik tahlil); kirish matni elementlarining asosiy grammatik (morfologik, sintaktik, semantik va leksik) xususiyatlarini (masalan, berilgan matndagi otlar soni, fe'l zamoni, so'z shakllarining sintaktik vazifalari) aniqlash ; homografiya o'lchamlari (so'z shakllarining konversiya omonimiyasi - aytaylik, ingliz. nima uchun ot, kesim, ergash gap bo'lishi mumkin); leksemalarning leksik tahlili va tarjimasi. Odatda, bu bosqichda bir ma'noli so'zlar ko'p ma'noli so'zlardan ajratiladi (aniq tilda bir nechta tarjima ekvivalentiga ega), shundan so'ng bir ma'noli so'zlar ekvivalentlar ro'yxati bo'yicha tarjima qilinadi va polisemantik so'zlarni tarjima qilish uchun kontekstologik lug'atlardan foydalaniladi. lug'at yozuvlari qiymatning kontekstli determinantlari mavjudligi / yo'qligi bo'yicha kontekstni so'rash algoritmlari bo'lgan so'zlar.3. Yakuniy grammatik tahlil, uning davomida maqsadli tilning ma'lumotlarini inobatga olgan holda zarur grammatik ma'lumotlar aniqlanadi (masalan, ruscha sleigh, qaychi kabi otlar bilan fe'l ko'plik shaklida bo'lishi kerak, shunga qaramay. Asl nusxada birlik bo‘lishi mumkin. Lekin shu bilan birga, “ruscha” “cho‘chqa” so‘zi ot ma’nosini bildiruvchi refleksiv fe’l bo‘lib chiqadi. lingvistik nuqtai nazardan, uni refleksiv fe'llar bilan mutlaqo taqqoslab bo'lmaydi - Xia... So'zning lingvistik artikulyatsiyasi va so'zning mashina uchun "qulay" artikulyatsiyasi umumiy narsaga ega emas. (№ 4))
4. Chiqaruvchi so‘z shakllari va umuman gaplarning chiqish tilida sintezi. Muayyan til juftligining morfologiyasi, sintaksisi va semantikasining xususiyatlariga, shuningdek tarjima yo'nalishiga qarab, umumiy tarjima algoritmi boshqa bosqichlarni, shuningdek nomdagi bosqichlarni yoki ularning tartibini o'zgartirishni o'z ichiga olishi mumkin, ammo buning o'zgarishi. zamonaviy tizimlarda odatda ahamiyatsiz. Tahlil va sintez ham iboralarda, ham kompyuter xotirasiga kiritilgan butun matn bo'yicha amalga oshirilishi mumkin; ikkinchi holda, tarjima algoritmi anaforik bog'lanishlar deb ataladigan narsalarni aniqlashni ta'minlaydi.
Mavjud mashina tarjimasi tizimlari ma'lum til juftliklarini (masalan, frantsuz va rus yoki yapon va ingliz) maqsad qilib qo'yadi va odatda tarjima mosliklarini yuzaki darajada yoki kirish va chiqish tillari o'rtasida oraliq darajada ishlatadi. Mashina tarjimasining sifati lug‘at hajmiga, leksik birliklarga berilgan ma’lumotlarning miqdoriga, tahlil va sintez algoritmlarini tuzish va ishini tekshirishning puxtaligiga, dasturiy ta’minotning samaradorligiga bog‘liq. Har qanday etarlicha yaxshi lug'at nafaqat so'zlarni, balki tez-tez uchraydigan so'z birikmalarini ham qamrab oladi, ya'ni. tegishli birliklarning mikrokonteksti. Masalan, "hozir" so'zi bilan "hozirda" birikmasi berilishi mumkin - gegenwartig, actuellement, "tajriba" so'zi bilan - kombinatsiya: "eksperimentni amalga oshirish" - Eksperiment, durchfiihren va "tajriba tomonidan" birikmasi " - Eksperiment mit (tajribalar sur, essais de).
Shu bilan birga, yaxshi lug'at "pochta buyurtmasi", "pul buyurtmasi" - bu kombinatsiyani ko'rsatadi. Post "s anweisung, frantsuz mandat poste va biz bu kombinatsiyani uchratmaganimiz uchun, tegishli tarjimalar chiqarib tashlanadi. (№ 18)
Zamonaviy apparat va dasturiy ta'minot batafsil grammatik ma'lumotlarni o'z ichiga olgan katta lug'atlardan foydalanishga imkon beradi. Axborot deklarativ (tavsifiy) va protsessual (algoritm ehtiyojlarini hisobga olgan holda) shaklda taqdim etilishi mumkin.
Zamonaviy mashina tarjimasini inson tarjimoniga yordam berish uchun kompyuterlardan foydalanishdan farqlash kerak. Ikkinchi holda, biz odamga kerakli tarjima ekvivalentini tezda tanlashga yordam beradigan avtomatik lug'atni nazarda tutamiz. Garchi ikkala holatda ham kompyuter shaxs (tarjimon yoki muharrir) bilan birga ishlaydi. "Mashinali tarjima" atamasining mazmuni mashina tarjima qilish va tarjima ekvivalentlari va tarjima yozishmalarini topish bo'yicha ishlarning asosiy qismini, ko'p qismini o'z zimmasiga oladi, odamga faqat xatolarni nazorat qilish va tuzatish uchun qoldiradi, kompyuter lug'ati esa yordam beradi. odam - bu faqat tarjima mosligini tezda topish uchun yordamdir; shu bilan birga, bunday lug'atlarda, cheklangan darajada, mashina tarjimasi tizimlariga xos bo'lgan ba'zi funktsiyalar amalga oshirilishi mumkin.
Tarjima amaliyotida va axborot texnologiyalarida mashina tarjimasiga ikkita asosiy yondashuv mavjud. Bir tomondan, mashina tarjimasi natijalari notanish tildagi hujjat mazmuni bilan yuzaki tanishish uchun ishlatilishi mumkin. Bunday holda, u signal ma'lumoti sifatida ishlatilishi mumkin va ehtiyotkorlik bilan tahrirlashni talab qilmaydi. Yana bir yondashuv - odatiy "inson" tarjimasi o'rniga mashina tarjimasidan foydalanish. Bu ma'lum bir mavzu bo'yicha tarjima tizimini sinchkovlik bilan tahrirlash va moslashtirishni nazarda tutadi. Bu yerda lug‘atning to‘liqligi, uning tarjima matnlarining mazmuni va lingvistik vositalari majmuiga yo‘naltirilganligi, leksik polisemiyani yechish usullarining samaradorligi, grammatik ma’lumotlarni ajratib olish algoritmlarining samaradorligi, tarjima muvofiqliklarini topish va sintez algoritmlari muhim rol o‘ynaydi. Amalda, tarjimaning ushbu turi iqtisodiy jihatdan foydali bo'ladi, agar tarjima qilingan matnlar hajmi etarlicha katta bo'lsa (yiliga kamida bir necha o'n ming sahifalar), agar matnlar etarlicha bir hil bo'lsa, tizim lug'atlari to'liq bo'lsa va yanada kengaytirishga imkon beradi; va dasturiy ta'minot post-tahrir qilish uchun qulay. Ushbu turdagi mashina tarjimasi tizimlari tezkor va sifatli tarjimalarga bo'lgan ehtiyoj juda katta bo'lgan tashkilotlarda qo'llaniladi.
1.3 Mashina tarjimasi tizimlari va ularning tasnifi.
1990 yilda mashina tarjimasi bo'yicha mutaxassis Larri Childs mashinaning inson harakatlaridan mustaqilligi printsipiga asoslangan MT tizimlarining quyidagi tasnifini taklif qildi, bu hozirda umumiy qabul qilingan:
FAMT (Fully - automated machine translation) - to'liq avtomatlashtirilgan mashina tarjimasi;
HAMT (Human - assisted machine translation) - inson yordamida mashina tarjimasi;
MAHT (Machine - assisted human translation) - kompyuter yordamida shaxs tomonidan amalga oshiriladigan tarjima.
Ushbu toifalarning birinchisining mashina tarjimasi dasturlari uzoq kelajak masalasidir, chunki umuman olganda ham matnlarni avtomatik tushunish, tarjima qilish va sintez qilish muammolari hal etilmagan. Asosiy muammo - bu tilning murakkabligi. Masalan, inglizcha "can" so'zining ma'nolarini olaylik. Modal ko‘makchi fe’lning asosiy ma’nosidan tashqari, “can” so‘zi ot sifatida bir qancha rasmiy va jargon ma’nolarga ega: “bo‘ladi”, “bo‘ladi”, “to‘xta”, “to‘xta”, “mo‘ri qopqog‘i”, “qamoqxona”. ". Bundan tashqari, bu so'zning arxaik ma'nosi bor - "bilish yoki tushunish". Agar maqsad tilda ushbu ma'nolarning har biri uchun alohida so'z bor deb faraz qilsak, kompyuter ularni qanday ajratishi mumkin?
Ma’lum bo‘lishicha, kontekstga qarab ma’noni farqlovchi tarjima dasturlarini ishlab chiqishda ma’lum yutuqlarga erishilgan. Keyinchalik matnlarni tahlil qilishda ko'proq ehtimollik nazariyasiga tayanadi. Shunga qaramay, bugungi kunda barcha "qutili" mahsulotlar tarjimonlar bo'lib, onlayn xizmatlar faqat FAMT sxemasiga muvofiq qurilgan.(No8,15)
Ikkinchi toifadagi ishlab chiquvchilar dasturlarni MT-dasturlar (Mashina tarjimasidan - mashina tarjimasi) deb atashadi. Haqiqiy avtomatlashtirilgan (odam ishtirokida) mashina tarjimasi faqat sun'iy cheklangan tilda, ham lug'at, ham grammatika nuqtai nazaridan mumkin. Inson yordami bilan mashina tarjimasi odatda matnlarni kompyuterda qayta ishlashdan oldin ham, keyin ham tahrirlashni anglatadi. Inson tarjimonlari matnlarni mashinalar tomonidan tushunilishi uchun o'zgartiradilar. Kompyuter tarjimani amalga oshirgandan so'ng, odamlar yana qo'pol mashina tarjimasini tahrir qilib, maqsadli tilni to'g'ri qiladi. Ushbu ish tartibiga qo'shimcha ravishda, tarjima paytida kompyuterga ayniqsa murakkab yoki noaniq tuzilmalarni tarjima qilishda yordam beradigan inson tarjimonining doimiy ishtirokini talab qiladigan MT tizimlari mavjud. Inson yordami bilan mashina tarjimasi ko'proq cheklangan lug'atga ega bo'lgan tor mavzulardagi matnlarga nisbatan qo'llaniladi. Inson yordami bilan mashina tarjimasining iqtisodiy samaradorligi hali ham munozarali masala. Dasturlarning o'zi odatda ancha qimmat va ularning ba'zilari ishlashi uchun maxsus apparat talab qilinadi. Oldindan va keyingi tahrir qilishni o'rgatish kerak. So'z ma'lumotlar bazalarini yaratish va saqlash juda mashaqqatli va ko'pincha maxsus ko'nikmalarni talab qiladi.Ob-havo prognozlarini frantsuz tilidan ingliz tiliga va aksincha tarjima qiladigan nemis Meteo tizimi har doim haqiqiy muvaffaqiyatli loyiha sifatida MT-dastur deb ataladi.
MT dasturlari, shuningdek, PROMT kompaniyasining mashina tarjimasi mahsulotlarini ham o'z ichiga oladi.
Uchinchi toifadagi ishlab chiquvchilar TM dasturlari deb ataladi (tarjima xotirasidan - tarjima xotirasi). Kompyuter yordamida inson tarjimasi. Bunday yondashuvda inson tarjimoni tarjima jarayonining markaziga joylashtiriladi, kompyuter dasturi esa tarjima jarayonini yanada samaraliroq va tarjimani aniqroq qilish vositasi sifatida qaraladi. Mana eng mashhur TM tizimlari ro'yxati: - Shveytsariyaning Star kompaniyasidan tranzit, - Trados (AQSh), - IBM'dan tarjima menejeri, - Frantsiyaning LANT kompaniyasidan Eurolang Optimizer, - ATRIL (AQSh) dan DejaVu, - WordFisher (Vengriya). TM tizimlari bir xil matn qismlarini takroriy tarjima qilishni istisno qilish imkonini beradi. Segmentni tarjima qilish tarjimon tomonidan faqat bir marta amalga oshiriladi, so'ngra har bir keyingi segment ma'lumotlar bazasi bilan mos kelishi (to'liq yoki noaniq) uchun tekshiriladi va agar bir xil yoki o'xshash segment topilsa, u tarjima varianti sifatida taklif etiladi. . TM tizimlarining keng assortimentiga qaramay, ular bir nechta umumiy funktsiyalarga ega: - tekislash funktsiyasi. TM tizimlarining afzalliklaridan biri bu mavzu bo'yicha allaqachon tarjima qilingan materiallardan foydalanish qobiliyatidir. TM ma'lumotlar bazasini asl va tarjima fayllarini segmentlar bo'yicha taqqoslash orqali olish mumkin. - Import-eksport filtrlarining mavjudligi. Bu xususiyat TM tizimlarining turli matn protsessorlari va nashriyot tizimlari bilan mosligini ta'minlaydi va tarjimonga mijozdan nisbatan mustaqillikni beradi. - Loyqa yoki to'liq mos keladigan qidiruv tizimi. Aynan shu mexanizm TM tizimlarining asosiy afzalligi hisoblanadi. Agar matnni tarjima qilishda tizim avvalgi tarjima qilinganiga o'xshash yoki yaqin bo'lgan segmentga duch kelsa, u holda allaqachon tarjima qilingan segment tarjimonga joriy segment uchun tarjima varianti sifatida taklif qilinadi, uni tuzatish mumkin. Loyqa moslik darajasi foydalanuvchi tomonidan belgilanadi. - Tematik lug'atlarni qo'llab-quvvatlash. Bu funksiya tarjimonga lug'atga rioya qilishga yordam beradi. Qoidaga ko'ra, agar tarjima qilinadigan segmentda mavzuli lug'atdagi so'z yoki ibora topilsa, u rang bilan ajratib ko'rsatiladi va tarjima qilingan matnga avtomatik ravishda kiritilishi mumkin bo'lgan tarjimasi taklif etiladi. - Matn qismlarini qidirish vositalari. Ushbu vosita tarjimani tahrirlashda juda qulay. Agar ish jarayonida matnning istalgan bo'lagini tarjima qilishning yaxshiroq versiyasi topilgan bo'lsa, unda bu fragmentni barcha TM segmentlarida topish mumkin, shundan so'ng TM segmentlariga kerakli o'zgartirishlar ketma-ket kiritiladi. Albatta, har qanday dasturiy mahsulot kabi TM tizimlarining ham o‘ziga xos afzalliklari va kamchiliklari, qo‘llanish sohasi mavjud. Biroq, TM tizimlariga kelsak, asosiy kamchilik ularning yuqori narxidir. Ayniqsa, foydalanuvchi qo‘llanmalari, foydalanish yo‘riqnomalari, dizayn va biznes hujjatlari, mahsulot kataloglari va shunga o‘xshash ko‘p sonli tasodifiy hujjatlar kabi hujjatlarni tarjima qilishda TM tizimlaridan foydalanish qulay.
TM dasturlari ko'pincha MT dasturlari bilan birgalikda qo'llaniladi. Dunyodagi eng mashhur TM asboblar to'plami Trados 'Translation' s Workbench (ko'pincha qisqacha Trados deb ataladi).
Biroq, bu yo'nalishni rivojlantirish uchun resurslar deyarli tugaydi va yangi texnologiyalarga o'tmasdan, tarjima sifatini tubdan yaxshilashga erishib bo'lmaydi, degan taassurot mavjud. Ushbu yangi texnologiyalar foydalanuvchilarning tarjima jarayonida ishtirok etishini, shuningdek:
· Tarjima uchun adekvat lug'at ma'nolarini tanlash uchun so'zdan foydalanish kontekstini avtomatik aniqlash;
· Mavzu bo'yicha ma'lumotlar to'planadigan bilim bazalaridan foydalanish;
· Foydalanuvchi bilan o'zaro munosabatlar jarayonida tizimni o'z-o'zini o'rganish.
Yaqin vaqtgacha shaxsiy kompyuterda bunday imkoniyatlar haqida gap bo'lishi mumkin emas edi. Endi quvvat va xotira hajmi allaqachon yetarli, faqat yaxshi tarjima sifatini ta'minlaydigan tizimlar mavjud emas.(№15)
Zamonaviy tijorat mashina tarjimasi mahsulotlari mahalliy firmalar tomonidan taklif etiladi:
· Vista Technologies va Adventis, 1991 yilda VINITIdan ajratilgan ishlab chiquvchilar jamoasi tomonidan tuzilgan;
· PROMT, 1991 yilda tuzilgan;
· "Media Lingua".
Chet elda ishlaydigan eng mashhur mashina tarjimasi tizimi SYSTRAN Software Inc tomonidan ishlab chiqilgan va qo'llab-quvvatlanadigan SYSTRAN tizimidir. va Yevropa Ittifoqi Komissiyasining mashina tarjimasi xizmati tomonidan foydalaniladi. Yiliga taxminan 2,5 million sahifani tarjima qiladigan xizmat ingliz tilidan nemis, frantsuz, ispan, yunon va italyan tillariga hamda frantsuzdan ingliz, ispan va italyan tillariga tarjima qilish uchun SYSTRAN’dan foydalanadi. Tizim afzalliklari:
· Olingan matnni oson va tez tahrirlash mumkin;
· Katta hajmdagi ilmiy-texnikaviy materiallarni tarjima qilish mumkin;
· Tizim "ko'p tilli";
· Muhandislik yechimlari juda oddiy (standart kompyuterlar).
Asosiy afzalliklardan biri shundan iboratki, MT izchil, izchil terminologiyaga rioya qilishni ta'minlaydi, ayni paytda terminologik lug'atning inson tomonidan tarjima qilinishida ko'pincha nomuvofiqlik mavjud. Bu afzallik ilmiy va texnik tarjima uchun zarurdir. Tarjima tezligi soatiga 1 million so'zni tashkil qiladi (CPU ishlaydi.
Tizim diagrammalar, grafiklar va boshqa matnli bo'lmagan qo'shimchalarning to'g'ri tarjimasini ta'minlaydi. O'zgarishlar kompyuterga kiritilishi mumkin, masalan, terminologiya standarti o'zgarganda. Tahririyatning tuzatishlari ham asta-sekin to'planib, lug'atga kiritiladi.
SISTRAN lingvistik analizatori quyidagi to‘rtta asosiy bosqichdan iborat. Birinchi bosqich homografiyaga imkon beradi. Ikkinchisi gapni o'ngdan chapga qarab tekshiradi, so'zdan so'zga o'tayotganda, duch kelgan so'z turlarini hisobga olgan holda, har bir mustaqil gap ichida sintaktik munosabatlarning qanday turlari potentsial bo'lishi mumkinligini eslaydi. Sintaktik munosabatlarning mumkin bo'lgan turlari haqida ma'lumotni o'z ichiga olgan registrlar to'plamidan foydalanib, bu bosqich jumla ichidagi asosiy tuzilmalarni (fe'l ortiqcha ob'ekt, predlog va ob'ekt va boshqalar) o'rnatadi. Uchinchi bosqich, chapdan o'ngga qarab, ushbu munosabatlarni aniqlaydi, ob'ektlarning turlarini tan oladi, tuzilmalarni aniqlaydi va hokazo.
Shuni ta'kidlash kerakki, ba'zi hollarda ma'lumotlar bir gapdan boshqasiga o'tkazilishi mumkin. Bunday ma'lumotlar uchun kompyuter xotirasi alohida o'rin tutadi. Bu, ayniqsa, boshqa gapda bo'lishi mumkin bo'lgan olmoshlarni tarjima qilish uchun zarurdir. SISTRAN universal dasturiy ta'minoti tomonidan bajariladigan asosiy vazifalar quyidagilardan iborat:
· Matnni o‘qish;
· Matnni so‘zlarga bo‘lish;
· Turli lug'atlardan so'zlarni qidirish;
· Matndagi so‘z yoki iboralarga lug‘at kodlarini kiritish;
· Tahlil qilingan gaplar uchun xotirani ajratish;
· Tarjima dasturlari bajarilishini nazorat qilish;
· Tarjimani chop etishga tayyorlash, mikrofishga chiqarish va h.k.
Tizim dasturiy ta'minoti soatiga 200 000-300 000 so'zni tarjima qilish tezligini ta'minlaydi. (№ 11)
90-yillar o'zlari bilan shaxsiy kompyuterlar bozori (ish stolidan cho'ntagiga) va axborot texnologiyalarining jadal rivojlanishini, Internetdan keng foydalanishni olib keldi (bu tobora xalqaro va ko'p tilli bo'lib bormoqda). Bularning barchasi, eng muhimi, talabga ega bo'lgan MT tizimlarini yanada rivojlantirishga imkon berdi. Neyron tarmoqlardan foydalanish, ulanish tushunchasi va statistik usullar asosida yangi texnologiyalar paydo bo'lmoqda.
Zamonaviy MT tizimining samaradorligi hal qiluvchi darajada uning tabiiy tilning ma'lum bir subtiliga (yoki mikrosubtiliga), ma'lum bir lug'atga va ma'lum bir mavzu sohasidagi matnlarga xos bo'lgan cheklangan grammatik vositalar to'plamiga muvaffaqiyatli moslashishiga bog'liq. shuningdek, ayrim turdagi hujjatlarga. Mashina tarjimasi nuqtai nazaridan subtillar haqidagi ta'limot birinchi marta 1967 yilda N.D. Andreev (Leningrad universiteti) tomonidan shakllantirilgan, garchi til registrlari, uslublari, yozma matn janrlari va boshqalar haqidagi g'oyalar. an’anaviy tilshunoslikda ham ma’lum bo‘lgan. Subtil, MT nuqtai nazaridan, birinchi navbatda, matnlarning ma'lum bir boshlang'ich to'plami bilan belgilanadi, ular ichida kirish va chiqish lug'atlar, leksemalarning tarqalish darajasi va leksik noaniqligining tabiati, tabiati va tarqalishi. sintaktik konstruktsiyalar, ularni ma'lum til juftligida tarjima qilish usullari va boshqalar aniqlanadi.. rolini parallel matnlar va lug'atlar-konkordanslar o'ynaydi, ular yordamida leksik mosligi va tarqalishi (tarqalishi) o'rganish va foydalanish mumkin. lingvistik elementlar nutqda (diskurs, matn) juda samarali va algoritmlarni tuzishda. Subtillarning statistik xarakteristikalari tegishli tahlil va sintez algoritmlarining tuzilishini tartibga solishga yordam beradi. Muayyan til juftligidagi yozishmalarning asosiy turlarini sintez qilish va etkazish ehtiyojlariga qaratilgan chiqish lug'ati qabul qilinadigan chiqish matnini ta'minlaydi. Mashina tarjimasining har qanday zamonaviy turlari inson muharririning ishtirokini talab qiladi, uning qulayligi tegishli dasturiy ta'minotning sifati va ishonchliligi bilan ta'minlanadi.
Mashina tarjimasini rivojlantirish istiqbollari mashina va “inson” tarjima nazariyasi va amaliyotini yanada rivojlantirish va chuqurlashtirish bilan bog‘liq. Nazariyani rivojlantirish uchun qiyosiy tilshunoslik natijalari, tarjimaning umumiy nazariyasi, muntazam yozishmalar nazariyasi, bilimlarni ifodalash usullari, lingvistik algoritmlarni optimallashtirish va takomillashtirish muhim ahamiyatga ega. Kerakli lug'at ma'lumotlariga ega yangi va samaraliroq lug'atlar, lug'at terminologiyasining qat'iy nazariyalari, pastki tillar bilan ishlash nazariyasi va amaliyoti leksik birliklarni tarjima qilish sifatini yaxshilashga yordam beradi. Tarjimaga yo'naltirilgan rasmiy grammatikalar ma'lum bir kommunikativ vaziyatda tarjima yozishmalarini topish algoritmlarini optimallashtirishga imkon beradi, ularni bilimlarni ifodalashning tegishli amaliy nazariyalari doirasida tavsiflash mumkin. Nihoyat, yangi dasturlash va hisoblash qobiliyatlari ham mashina tarjimasi nazariyasi va amaliyotini takomillashtirish va yanada rivojlantirishga yordam beradi “Mashina tarjimasi hali ham mukammallikdan yiroq, lekin unga yordam berishni istagan har bir kishi. Hech bo'lmaganda hujjatning asosiy ma'nosini tushunish mumkin. (Luis Monier, AltaVista bosh texnologiya direktori.)
1.4 Mashina tarjimasi sifati
"Mashina tarjimasi nazariyasi nafaqat grammatikaning barcha eng muhim an'anaviy tushunchalarini (so'zlar, nutq bo'laklari, jumla a'zolari va boshqalar) tanqidiy qayta ko'rib chiqishga, balki ular atrofida olib borilgan ilmiy munozaralarni to'xtatib qo'yishga ham imkon beradi. Mashina tarjimasi bilan belgilanadigan pozitsiyadan kelib chiqadigan bo'lsak, "so'z harflar orasidagi interval bilan cheklangan narsa" va" jumla ma'lum bir tinish belgilari bilan chegaralangan narsadir. " bir tildan boshqa tilga ma'lum darajada tarjima qiladi. U bir tildan ikkinchi tilga o‘tkazayotgan rasmiy toifalar nimani anglatishi muhim emas.(4-son)
Shunday qilib, ko'pchilik, masalan, hissiy rangdagi so'zlar yoki ma'lum iboralar turli odamlar tomonidan turlicha idrok etilishi mumkin (mashina haqida gapirmasa ham) va bu odamlar turli lingvistik va etnik guruhlarni ifodalaydi (No1).Hozirgi vaqtda mashina tarjimasi sifati qoldiradi. ko'p narsa orzu qilingan va bunday tizimlarning mavjudligini ilmiy tadqiqot mavzusi sifatida qabul qilish to'g'riroq. Ko'pgina hollarda loyiha ustida ishlashda MT tizimlaridan foydalanish oqlanmaydi, chunki: - MT tizimlari chiqish matnining maqbul sifatini ta'minlamaydi. Tarjima qilingan matnning kichik hajmlari uchun mutlaqo qabul qilinishi mumkin bo'lmagan tizimni oldindan sozlash va / yoki keyingi tahrirlash orqali yuqori sifatga erishish mumkin va bu faqat tarjimon ko'r-ko'rona yozishdan foydalansa, ishni sekinlashtiradi. - MT tizimlari, ayniqsa, tarjimonlar jamoasi katta loyiha ustida ishlayotganda, terminologiyaning bir xilligiga rioya qilishni kafolatlamaydi. Aksincha, ular foydalanuvchi lug'atlariga juda ehtiyotkorlik bilan munosabatda bo'lish sharti bilan kafolat berishlari mumkin va bu har doim ham ishonishga arzimaydi. Biroq, ba'zi hollarda, MT tizimlaridan foydalanish hali ham vaqt xarajatlarini kamaytirishga yordam beradi. Agar matn etarlicha uzun bo'lsa va monoton terminologiyani o'z ichiga olgan bo'lsa, bu sizga MT tizimini nisbatan tez sozlash imkonini beradi. Keyin matnni tahrirlash juda ko'p vaqt talab qilmaydi. Biroq, bu holda, ayniqsa, tarjima matnining uslubiga ehtiyot bo'lishingiz kerak. Mashina tarjimasi rasmiydir, shuning uchun asl tilning sintaktik tuzilmalarini kuzatish ehtimoli katta, bu umuman tarjimaga xosdir va shuning uchun tahrirlash paytida o'tkazib yuborilishi mumkin. Umuman olganda, MT tizimlari eng standartlashtirilgan til oddiy grammatika va nisbatan kichik lug'at bilan qo'llanilganda yaxshi qo'llanilishi mumkin. Ob-havo prognozlarini frantsuz tilidan ingliz tiliga va aksincha tarjima qiladigan Germaniyaning Meteo dasturi MP tizimining juda muvaffaqiyatli loyihasi hisoblanadi. Tarjimonlar va texnik yozuvchilarning ishini engillashtirish uchun Boeing bir vaqtlar Boeing English deb nomlanuvchi texnik hujjatlarni yozish uchun til standartini ishlab chiqdi.
Filologiya nuqtai nazaridan tarjima - bu inson tarjimoni matn ustida bajaradigan mualliflik operatsiyasi. Vazifaning mohiyatini tushunib, ma'lum darajada onglilik, e'tibor va iroda zo'riqishlari bilan harakat qilib, tarjimon asl nusxa muallifi qabul qilgan kommunikativ effektga erishadi. Tarjimon yangi matn yaratadi, u ideal holda asl nusxaning barcha xususiyatlariga ega. Tarjimonning asl nusxani oldindan o'qishi ma'lum bir "stilistik harakat" qo'llash imkoniyatini beradi, chunki har safar shaxs tomonidan tuzilgan matnda qabul qilingan me'yorga zid ma'lum xatolar mavjud. Bu xatolar turli sabablarga ko'ra yuzaga kelishi mumkin, lekin ular asosan so'zlovchining iroda erkinligining natijasi bo'lib, u yangi effektga erishish uchun foydalanadi, shuningdek, uslubiy harakatlarni qo'llaydi. Normativ huquqbuzarliklar tufayli har qanday rasmiy grammatika to'liq bo'lmaydi va matnlarni to'liq qamrab olmaydi. Matnning psixolingvistik xabardorligi tarjima qilingan matnni o'quvchi uchun ham, asl matnni o'quvchi uchun ham muhimdir.
Mashina tarjimasi - tarjimon muallifligisiz tarjima. Algoritmlar va lug'atlarni yaratish va keyinchalik to'ldirish jamoaning ishi bo'lgan darajada, MT shaxssiz jamoaviy tarjimadir. MP sof tarjima qilingan, lingvistik yozishmalarga asoslanadi, MP tizimi matnni dastlabki o'qishni hosil qila olmaydi, shuning uchun MP matn tahlilini istisno qiladi. MTda ma'noni uzatish maxsus belgi transformatsiyasi orqali amalga oshiriladi, chunki MT: belgining mazmuni bir xil bo'lishi sharti bilan tilda ma'lum bir operatsiya mavjud. Muntazam tillararo korrelyatsiyalar asosida mexanik sinonimik almashtirishlarni amalga oshiradi. Ushbu muntazam yozishmalar omborlardan yoki lug'atga o'xshash qurilmalardan avtomatik ravishda olinmaydi. Tabiiy tilning kommunikativ funksiyasini modellashtirish mumkin emas, agar uni faqat kod tizimi deb hisoblasak; tarjima yozishmalar tildan foydalanish dinamikasining elementidir va tarjimani qoniqarli tarzda taqlid qiluvchi tizim tarjima yozishmalarini keng qamrovli, ko'p bosqichli, lekin har safar yangi shakllanishlar deb hisoblamaydi. Tarjima yozishmalarining o'zi emas, balki ular matnlarda paydo bo'ladigan va ular yordamida tafsilotlarda topish mumkin bo'lgan naqshlar tarjima uchun muhim va zarur bo'lishi kerak. Bunday rasmiylashtirish tarjimonning harakatlarini modellashtirish orqali mumkin bo‘lib, unda barcha foydalanuvchilar tomonidan an’anaviy tushuniladigan tilga yaqin atamalarda semantik va sintaktik tahlilga alohida e’tibor beriladi.(No11).
Tarjima mashinasi hech qanday stilistik harakatlar qilmaydi. Ushbu sa'y-harakatlarni qo'llash vazifasi mashina tarjimasi o'quvchi yoki muharrirga yuklanadi. Kompyuterning matn ustida bajaradigan mexanik operatsiyalari murakkab: tizim belgilarning eng to'liq rekombinatsiyasini va tildagi ommaviy axborotni har tomonlama qayta ishlashni amalga oshiradi. Ikki tilning turli toifalarini tanib olish, farqlash va tarjima qilish, sinonim va omonimlarni ajratish, gap a'zolarining jarayonli rivojlanishi amalga oshiriladi, buning natijasida uning boshqa tilga o'tishida ma'noning muhim semantik belgilarining o'zgarmasligi ta'minlanadi.
Tizimli tashkil etish kontseptsiyasidan kelib chiqqan holda, MPda lug'atga alohida e'tibor beriladi. MT uchun lug'at bir vaqtning o'zida tabiiy tilda ma'lumotlarni avtomatik qayta ishlashning boshqa tizimlarida o'xshash bo'lgan mashina lug'ati bo'lganligi sababli, umumlashtirishlar qilish va mashina lug'atlarining umumiy xususiyatlari haqida gapirish mumkin bo'ladi. Bu umumiy xususiyatlar oddiy lug‘atlarning xususiyatlariga qarama-qarshi ko‘rib chiqiladi, lekin mavhum ma’noda emas (bunday qarama-qarshiliklarni inson va fikrlash mashinasi o‘rtasidagi farq o‘chirilganidek o‘chirish mumkin), balki muhandislik tushunchalarida. tilshunoslik - texnik muammolarni hal qilishga qaratilgan amaliy tilshunoslik.
Mashina tarjimasi muammosining asosiy qiyinchiliklarini bartaraf etish uchun kontekstni avtomatlashtirilgan tarzda taqdim etish vazifalari, tarjima qilingan matnning semantik mazmuni, tarjima matni tegishli bo'lgan mavzu sohasi tushunchalarini bilish kerak. Birinchi tizimlarda tarjimaning "to'g'ridan-to'g'ri" deb ataladigan yondashuvi amalga oshirildi, uning doirasida, yuqorida aytib o'tilganidek, tarjima paytida amalga oshirilgan barcha operatsiyalar tillararo o'tish operatsiyalari - asl matnni tarjima qilingan matnga aylantirish operatsiyalari sifatida talqin qilingan. Mashina tarjimasida, tegishli ma'noda, bu yondashuv "jami strategiyalar" deb ataladigan narsaga olib keladi (№ 10). Umumiy strategiyalarning umumiy xususiyati tilning semantik darajasidan maksimal darajada foydalanish orqali to'liq avtomatlashtirilgan yuqori sifatli mashina tarjimasini olish istagi. Ushbu yondashuv mashina tarjimasi nazariyasiga ham, amaliyotiga ham katta hissa qo'shdi.
Ikkinchi yondashuv xronologik jihatdan birinchisidan oldin paydo bo'lgan. Ushbu yondashuv oraliq tilga tegishli va sof lingvistik darajadagi tarjima yozishmalari g'oyasi bilan chambarchas bog'liq. Bu yondashuvning uslubiy mohiyati quyidagilardan iborat: lisoniy birliklarning, ayniqsa, lingvistik kontekstdagi xatti-harakatlarini o‘rganishda; inson tilini bilish darajasini modellashtirishda, ayniqsa, tillararo tarjima jarayonida; oddiydan murakkabga o'tishda. Ko'pgina tadqiqotchilar, masalan, Marchuk Yu.N., Nelyubin L.L., Revzin I.I. Grammatik dasturiy ta'minot til tuzilishining mavjud nazariyalari va shoshilinch ravishda ixtiro qilingan qoidalarga asoslangan deb ishoniladi.
Ishlab chiqilgan dasturlar shu qadar yomon tarjima qildiki, uni tushunishning iloji yo'q edi. Muammo shundaki, tabiiy tildagi matnning ma'nosi nafaqat gapning o'ziga, balki kontekstga ham bog'liq.
Ehtimol, bu birinchi loyihalar haqiqatan ham haqiqiy natijalarni bermadi. Shu bilan birga, matnlarni tabiiy tilga tarjima qilishning ko'plab asosiy muammolari aniqlandi: so'zlar va sintaktik konstruktsiyalarning ko'p ma'noliligi, hatto cheklangan mavzu sohasida ham dunyoning semantik tuzilishini global tavsiflashning amaliy mumkin emasligi, matnni tarjima qilishning samarali rasmiy usullarining yo'qligi. lingvistik qoliplarni tavsiflash va boshqalar (8-son).MT ning hozirgi holati ikki yondashuv natijalarining ma'lum bir qo'shilishi bilan tavsiflanadi, lekin natijalarning mexanik kombinatsiyasi bilan emas, balki ularni asosiy e'tiborni tarjima qilishning haqiqiy tarjima jihatiga e'tibor qaratgan holda yaratilgan yangi modellar asosida birlashtirish bilan tavsiflanadi. tabiiy tilni bilish. Zamonaviy MTning tadqiqot markazi inson tarjimonining harakatlarini modellashtirish, ayniqsa uning bir tildan ikkinchi tilga tarjima qilishda ikki va ko'p ma'noli tarjima yozishmalaridan foydalanish nuqtai nazaridan. Tilshunoslikdan tashqarida paydo bo'lgan MT unga asosan modellashtirishning muhim jihati tufayli kirib keldi.Tarjima sifatini texnologiya, lug'atlarning ko'p o'lchovli arxitekturasi (har bir so'z uchun tarjimaning ikki darajasi: faol va passiv), assotsiativ xotira mexanizmi, foydalanuvchi lug'atlarini yaratish va tahrirlash, shuningdek, katta hajmdagi ixtisoslashtirilgan va umumiy lug'atlarni ulash. (№ 14)
Mashina tarjimasi aniqligining sekin yaxshilanishi qisman bunday dasturga o'xshash iboralarni taqqoslash va ularni tushunish kunlarida matnlarning juda katta ma'lumotlar bazasiga muhtojligi bilan bog'liq (No 19).
1956 yilda amerikalik psixologlar Miller va Beebe-Center tarjima sifatini baholashning quyidagi usullarini taklif qilishgan:
· Tarjima sifatini sub'ektlar tomonidan barqaror shkala bo'yicha baholash;
· Tahrirlanmagan va tahrirlangan tarjimada mos keladigan so‘zlarning foizini hisoblash;
· Asl matn bo'yicha berilgan savollarga faqat tarjimani o'qigan shaxsning javoblarini o'rganish.
Psixolog S. Pfafflin tarjima sifatini baholash uchun quyidagi ikkita mezondan foydalanadi:
Matn yuzasidan savollar berish orqali tarjimani tushunish darajasini baholash;
Tarjima ma'nosining ravshanligini "aniq", "noaniq", "ma'nosiz" shkalasi bo'yicha baholash Ushbu usullarning hech biri mashina tarjimasining sifat mezonlari qanday va maqbul daraja qanday degan savolga aniq javob bermaydi. sifatli. (№ 11)
BobII... Mashina tarjimasi tizimiPROMT
2.1 PROMT oilasining mashina tarjimonining xususiyatlari.
1990-yillarning boshidan beri. mahalliy ishlab chiquvchilar shaxsiy kompyuter tizimlari bozoriga kirishadi. 1990 yil iyul oyida Moskvada bo'lib o'tgan PC forumida Rossiyada birinchi tijorat mashina tarjimasi tizimi PROMT (dasturchining mashina tarjimasi) nomi ostida taqdim etildi, MP tizimlarini etkazib berish bo'yicha NASA tenderida g'olib chiqdi (PROMT yagona bo'lmagan edi. Amerika kompaniyasi ushbu tanlovda.) 1992 yilda PROMT STYLUS yangi nomi ostida ingliz, nemis, frantsuz, italyan va ispan tillaridan rus va rus tillariga ingliz tiliga tarjima qilish uchun butun tizimlar oilasini chiqardi va Windows uchun dunyodagi birinchi MT tizimi 1993-yilda STYLUS asosida yaratilgan. 1994-yilda STYLUS 2.0, 1995-1996-yillarda esa Windows 95/NT uchun toʻliq 32-bitli STYLUS 3.0 mashinali tarjima tizimlarining uchinchi avlodi, shu bilan birga ishlab chiqildi. butunlay yangi, dunyodagi birinchi rus-nemis va rus-fransuz MP tizimlari muvaffaqiyatli yakunlandi.
1997-yilda frantsuzning Softissimo firmasi bilan frantsuz tilidan nemis va ingliz tiliga va aksincha tarjima tizimlarini yaratish bo‘yicha shartnoma imzolandi va shu yilning dekabr oyida dunyoda birinchi nemis-fransuz tarjima tizimi chiqarildi. Xuddi shu yili PROMT kompaniyasi Gigant texnologiyasidan foydalangan holda amalga oshirilgan tizimni chiqardi - bitta qobiqda bir nechta til yo'nalishlarini qo'llab-quvvatlash uchun, shuningdek, WebTranSite Internetda ishlash uchun maxsus tarjimon.
1998 yilda PROMT 98 yangi nomi ostida dasturlarning butun turkumi chiqarildi. Bir yil o'tgach, PROMT ikkita yangi mahsulot chiqardi: Internetda ishlash uchun noyob dasturiy ta'minot to'plami - PROMT Internet va korporativ pochta tizimlari uchun tarjimon - PROMT Mail Tarjimon. Korporativ mijozlar uchun maxsus server yechimlari ham ishlab chiqilgan - PROMT Translation Server (PTS) korporativ tarjima serveri va PROMT Internet Translation Server (PITS) Internet yechimi. 2000 yilda PROMT yangi avlod MP tizimlarini chiqarish orqali hamma narsani yangiladi: PROMT Translation Office 2000, PROMT Internet 2000 va Magic Gooddy 2000.
Barcha PROMT mahsulotlari yagona tarjima yadrosiga asoslangan - kiritilgan matnni tahlil qilish va chiqishda izchil tarjimani sintez qilish tizimi; ular tarjimani avtomatlashtirishning umumiy tamoyillarini ham amalga oshiradilar. PROMT lingvistik muharriri hujjatlarni tarjima qilish, hujjat mavzusini sozlash va matnni tahrirlash imkonini beradi. Dastur deyarli barcha matn muharrirlarini qo'llab-quvvatlaydigan tezkor tarjimani ta'minlaydi. Tarjima qilingan matnning hajmi faqat kompyuterning o'zi resurslari bilan cheklangan.
Tarjimondan ikkita rejimda foydalanish mumkin: tezkor tarjima qilish sozlamalarisiz (faqat asosiy lug'at kiritilgan) va yaxshi tarjimani ta'minlash uchun qo'shimcha sozlamalar bilan (qo'shimcha tematik lug'atlarni ulash). Dastur 100 dan ortiq ixtisoslashtirilgan lug'atlarni o'z ichiga oladi, bu esa tarjimani yanada aniqroq qilish imkonini beradi, lekin hatto ko'p sonli maxsus lug'atlar ham foydalanuvchi lug'atini almashtira olmaydi.
PROMTning so'nggi versiyalarida amalga oshirilgan noyob texnologiya bu assotsiativ xotira (AP) mexanizmi. Gap shundaki, ko'pgina hujjatlarda tez-tez uchrab turadigan bir xil iboralar va hatto bir marta tarjima qilish va keyin tayyor tarjimani qo'llash mantiqiy bo'lgan matn parchalari mavjud. Asl va tarjima qilingan matnlarning segmentlari AP tarjima ma'lumotlar bazasida saqlanadi, ular matnning o'xshash qismini tarjima qilish zarur bo'lganda foydalaniladi. Bu tizimni o'rgatish va foydalanuvchi ishining natijalarini keyinchalik foydalanish uchun saqlash imkonini beradi.
So'nggi avlod dasturlarining foydali xususiyati - tegishli nomlarni transliteratsiya qilish imkoniyati bilan tarjima qilish jarayonidan chiqarib tashlash qobiliyati. Moslashtirishning yana bir usuli - lingvistik algoritmlarni tanlash. Tarjimaning har bir yo'nalishi foydalanuvchi tomonidan sozlanishi mumkin bo'lgan algoritmlarning o'z ro'yxatiga ega. (8.5-son)
PROMT XT tizimi quyidagi sohalarda tarjima qiladi: inglizcha-ispancha, inglizcha-nemischa, inglizcha-ruscha, inglizcha-fransuzcha, ispancha-inglizcha, ispancha-ruscha, ispancha-fransuzcha, italyancha-ruscha, nemischa-inglizcha, nemischa-ruscha, Nemis -fransuz, ruscha-inglizcha, ruscha-nemischa, ruscha-fransuzcha, fransuzcha-inglizcha, fransuzcha-ispanchacha, fransuzcha-nemischacha, fransuzcha-ruscha. Tizim interfeysi tili: ingliz, rus, frantsuz, nemis.
Tizim quyidagi qo'shimcha funktsiyalarni taqdim etadi:
o foydalanuvchi lug'atlaridagi lug'at yozuvlarini tahrirlash (ba'zi maxsus so'zlardan tashqari: predloglar, bog'lovchilar, olmoshlar, ayrim omonim shakllar);
o bog'langan lug'atlar ierarxiyasini aniqlash (agar bir nechta tarjima variantlari mavjud bo'lsa, tizim lug'atdan tarjimani tanlaydi, uning ustuvorligi foydalanuvchi tomonidan eng yuqori deb belgilanadi);
o elektron lug'atlardan tarjimalarni izlash (faqat inglizcha-ruscha va ruscha-inglizcha yo'nalishlar uchun);
o matn mavzusini avtomatik aniqlash (kalit so'zlar bo'yicha) va maxsus lug'atlarni ulash;
o ba'zi konstruktsiyalar uchun tarjima algoritmlarini o'rnatish (masalan, siz ingliz tilidan "siz", "siz" yoki "siz" deb tarjima qilish;
o preprotsessorlarni ulash (fayl nomlari, elektron pochta manzillari va veb-sahifalar kabi ba'zi maxsus elementlarni tarjima qilmaslikka ruxsat berish);
o dastur tomonidan tarjima qilinmaydigan zahiradagi so'zlarning ta'rifi (masalan, atamalar, tegishli nomlar)
o tarjima xotirasi assotsiativ xotirasidan foydalanish (Tarjima xotirasi texnologiyasining soddalashtirilgan versiyasi).
PROMT kompaniyasining so'nggi ishlanmasi, elektron tarjimon PROMT XT Office Associated Memory texnologiyasi asosida avtomatik tarjimaning yangi kontseptsiyasini amalga oshiruvchi birinchi mahsulotdir. Lingvistik algoritmlarning yangi darajasi jumlalarning kamida 55% uchun yaxshilangan tarjima sifatini ta'minlaydi.
PROMT XT Office quyidagi vazifalarni hal qiladi:
· Quyidagi formatdagi hujjatlarni tarjima qilish: DOC, RTF, TXT, HTML. Birinchi marta hujjatlarni Adobe Acrobat formatida tarjima qilish imkoniyati joriy etildi.
· Microsoft Word, Excel, PowerPoint dasturlarida chet tilidagi hujjatlar bilan qulay ishlash dasturni MS Office 2000/XP va Microsoft Office System 2003 ilovalariga integratsiyalash orqali ta’minlanadi.
· Elektron pochtani tarjima qilish.
· Formatlash saqlanib qolgan veb-saytlarni onlayn tarjima qilish. (№ 9)
Tarjima yo'nalishlari: Ingliz tili<->rus nemis<->Rus, frantsuz<->Rus, ispan<->Ruscha, italyancha -> Ruscha, Gigant (ing.<->Rus, nemis<->Rus, frantsuz<->ruscha)
Tarjima tizimining asosiy xususiyatlari:
· Hujjatlarni asosiy formatlarda tarjima qilish: DOC, RTF, HTML, TXT.
· Tarjima paytida formatlashning saqlanishi.
· Tarjima natijasini RTF va TXT formatidagi fayllarda saqlash.
· PDF hujjatlarini to'g'ridan-to'g'ri Adobe Acrobat 4.x / 5.x va Adobe Acrobat Reader 4.x / 5.x dasturlariga tarjima qilish.
· Tarjima funksiyalarini barcha asosiy Microsoft Office 2000 / XP ilovalariga (Word, Excel, PowerPoint, FrontPage) va Microsoft Office System 2003 * ga joylashtirish.
· Elektron pochtani tarjima qilish. Elektron pochtani Microsoft Outlook-ga avtomatik tarjima qilish. Papkalar bo'yicha pochtani yo'naltirish.
o Formatlash saqlanib qolgan holda Internet-saytlarni onlayn tarjima qilish uchun hamma narsa.
o Qidiruv tizimlari uchun so'rovlarni tarjima qilish va belgilangan serverga yuborish.
o SmartURL texnologiyasi asosida tarjimani sozlash - dasturning o'zi sahifani tarjima qilish sozlamalarini eslab qoladi. Sahifaga yana tashrif buyurganingizda, tarjima sozlamalari tiklanadi.
o integratsiyalashgan tarjima modullaridan foydalangan holda FrontPageda chet tilida saytlar yaratish.
· Windows almashish buferining mazmunini tarjima qilish.
· Associated Memory yordamida tizimni o'z-o'zini o'rganish uchun aqlli algoritmlar. Associated Memory (AP) - to'plash printsipi bo'yicha ishlaydi: tarjima jarayonida asl segment (gap yoki uning bir qismi) va uning tarjimasi saqlanadi. AP ma'lumotlar bazasini ulashda tizim har bir jumlani ma'lumotlar bazasida saqlangan segmentlar bilan taqqoslaydi. Agar asl nusxaga o'xshash segment topilsa, uni tarjima qilish uchun ishlatish mumkin.
· Interaktiv tarjimani boshqarish imkoniyatini beruvchi kuchli lingvistik PROMT muharriri.
o Tarjimani tahrirlashning qulay vositalari - asl nusxa va uning tarjimasini bir vaqtda "aylantirish". Asl nusxada va tarjimada tegishli bo'laklarni rang bilan ajratib ko'rsatish.
o Sichqoncha kursorini harakatlantirganda istalgan so'zning tezkor tarjimasi. Tanlangan so'zning barcha tarjimalari va so'z shakllarini ko'ring.
o Matn tili va mavzusini avtomatik aniqlash uchun aqlli algoritmlar.
o Tarjima parametrlarini mavzu shablonlarida saqlash.
· Shaxsiy sozlamalar tufayli tarjima sifatini yaxshilash:
o turli fan sohalari uchun PROMT tomonidan ishlab chiqarilgan maxsus lug'atlarni ulash imkoniyati;
o O'zingizning foydalanuvchi lug'atlaringizni yaratish va to'ldirish.
o Zaxira qilingan so'zlar ro'yxatini yarating. Belgilangan formatdagi so'zlarni zaxiralaydi, masalan, kursiv. Tanlangan matn qismlarini zaxiralash.
o notanish so'zlarning transliteratsiyasi belgilarini o'rnatish.
o Tarjima algoritmlarini tanlash (lug'at ma'lumotlarini o'zgartirish orqali boshqarilmaydigan ba'zi til konstruktsiyalarining tarjima rejimlari).
o Manba va tarjima matnini qayta ishlash uchun makroslarni ulash.
o Associated Memory (AP) bazalaridan foydalanish.
Lug'atlarni sozlash uchun samarali vosita - Lug'at muharriri:
o Foydalanuvchi lug'atlaridan lug'at yozuvlarini ko'rish, tahrirlash, nusxalash, o'chirish va tiklash imkoniyati.
o Lug'at yozuvlari tarkibiga kirishning turli usullari - "Boshlang'ich" va "Mutaxassis".
o Lug'atni to'ldirish uchun aqlli algoritmlar.
o Bog'langan lug'atlarni ikki yo'nalishda bir vaqtda to'ldirish.
o Matn faylidan lug'atga kirish va lug'at yozuvlarini matnli fayl yoki RTF hujjatiga eksport qilish imkoniyati.
· Alohida so'zlarni tarjima qilish uchun katta elektron lug'at (inglizcha-ruscha, ruscha-inglizcha, frantsuzcha-ruscha, ruscha-fransuzcha, nemischa-ruscha va ruscha-nemischa tarjima yo'nalishlari uchun amalga oshirilgan).
· Tashqi skanerlash dasturlari, imlo tekshiruvi va elektron lug'atlarni qo'llab-quvvatlash.
· Kompyuterda o'rnatilgan matndan nutqqa (TTS) nutqni sintez qilish vositalari. (22.23-son)
PROMT kompaniyasining dasturiy mahsulotlari bir qator mahalliy va xorijiy mukofotlarga sazovor bo'lgan, xolisona ular mamlakatimizda mashina tarjimasi uchun eng yaxshi dasturlardir.
2.2 Mashina tarjimasi tizimi va inson tomonidan qilingan badiiy va siyosiy matn tarjimalarining qiyosiy tahlili.
MT tizimlarining ishlash tamoyillarini, lug'atlardan foydalanish usullarini, o'rganilayotgan tilda grammatikani tahlil qilish va tuzilmalarni sintez qilish usullarini yaxshiroq tushunish uchun amaliyotda bir nechta tajribalar o'tkazish va matnlarni (uslublar va mavzularda afzalroq) tarjima qilish kerak. mashina tarjimasi tizimlaridan biri.
Badiiy matn tarjimasini solishtirish uchun PROMT XT mashina tarjimasi tizimidan foydalaniladi. Ushbu matn ham tarjima qilinadi va natijalarning qiyosiy tahlili amalga oshiriladi.
Keling, ingliz tilidagi “Kichik shahzoda” ertakidan parcha bilan boshlaylik:
"Kichik shahzoda yana atirgullarga qarash uchun ketdi.
"Siz mening atirgulimga umuman o'xshamaysiz", dedi u. “Hali sen hech narsa emassan, hech kim qo'lga kiritmagansen esa hech kimni o'zlashtirganing yo'q. Va atirgullar juda xijolat bo'lishdi.
- Siz go'zalsiz, lekin siz bo'm-bo'sh, - dedi u. "Siz uchun o'lish mumkin emas. Bo'lishAlbatta, oddiy o'tkinchi mening atirgulim xuddi sizga - menga tegishli atirgulga o'xshaydi, deb o'ylardi. Ammo u faqat o'zi uchun boshqa atirgullardan ko'ra muhimroqdir. Va u tulkini kutib olish uchun qaytib ketdi. — Xayr, — dedi tulki. "Va endi mening sirim, juda oddiy sir: faqat yurak bilan to'g'ri ko'rish mumkin; asosiy narsa ko'zga ko'rinmaydi."
"Asosiy narsa ko'zga ko'rinmas", deb takrorladi Kichkina shahzoda shunday qilish uchuneslab qoling.
"Atirgulingiz uchun behuda sarflagan vaqtingiz sizning atirgulingizni juda muhim qiladi."
"Atirgulim uchun behuda vaqt sarfladim ..." dedi Kichkina shahzoda shunday bo'lsin debalbatta eslash kerak.
— Erkaklar bu haqiqatni unutgan, — dedi tulki. "Ammo siz buni unutmasligingiz kerak. Siz bo'lasizSiz o'zlashtirgan narsangiz uchun abadiy javobgardir. Siz gulingiz uchun javobgarsiz ... "
"Men atirgulim uchun javobgarman", deb takrorladi Kichkina shahzoda ishonch hosil qilish uchunesda tuting."(№ 16)
Mana bu parchaning tarjimon tomonidan tarjimasi:
Kichkina shahzoda atirgullarga qarash uchun ketdi.
Siz mening atirgulimga o'xshamaysiz, - dedi u ularga. - Siz hali hech narsa emassiz. Sizni hech kim o'zlashtirgani yo'q, siz ham hech kimni qo'lingizga olmadingiz. Va atirgullar juda xijolat bo'lishdi.
Siz go'zalsiz, lekin bo'm-bo'sh, - davom etdi kichkina shahzoda. "Hech kim siz uchun o'lishni xohlamaydi. Albatta, tasodifiy o'tkinchi mening atirgulimga qarab, u siznikiga o'xshaydi, deydi. Ammo u men uchun hammangizdan ham azizroq
Va kichkina shahzoda Tulkiga qaytib keldi.
Xayr... - dedi.
Xayr, dedi Tulki. - Mana mening sirim, bu juda oddiy: faqat bitta yurak o'tkir. Siz eng muhim narsani ko'z bilan ko'ra olmaysiz.
- O'zi Siz asosiy narsani ko'zingiz bilan ko'rmaysiz, - takrorladi Kichkina shahzoda yaxshiroq eslab qolish uchun.
Sizning atirgulingiz siz uchun juda qadrli, chunki siz unga butun kuningizni berdingiz.
Chunki men unga butun kunimni berdim ... - yaxshi eslab qolish uchun takrorladi Kichkina shahzoda.
Odamlar bu haqiqatni unutib qo'yishdi, - dedi Tulki, - lekin unutmang: siz o'z qo'lingizga olgan har bir kishi uchun abadiy javobgarsiz. Siz gulingiz uchun javobgarsiz.
Men atirgulim uchun mas'ulman ... - yaxshi eslab qolish uchun kichkina shahzoda takrorladi.
Ayrim jumlalarda so‘z tartibini o‘zgartirishga to‘g‘ri keldi. Tarjimadan bir nechta so'zlar "tashlab tashlandi", chunki ularning yo'qligi yoki mavjudligi tarjimaning ma'nosi va uslubiga ta'sir qilmaydi. Biroq, ayni paytda, u "quloqni kesishi" mumkin, chunki "ruscha" bunday gapirilmaydi. Mana, xuddi shu parchaning tarjimasi PROMT XT tizimi tomonidan qanday amalga oshirilgan.
“Kichik shahzoda yana atirgullarga qarashga ketdi.
"Siz mening atirgulimga o'xshamaysiz", dedi u. "Hali sen hech narsa emassan. Hech kim seni qo'lga olmadi, sen esa hech kimni..."
Va atirgullar juda xavotirda edilar. - Siz go'zalsiz, lekin siz bo'm-bo'sh, - davom etdi u. "Siz uchun o'lishning iloji yo'q edi. Shubhasiz, oddiy o'tkinchi mening atirgulim sizga o'xshab ko'rinadi, menga tegishli atirgul, deb o'ylardi. Lekin bir o'zi uning o'zi sizlardan boshqa yuzlab atirgullardan muhimroqdir. ...
"Va u tulkini kutib olish uchun qaytib keldi.
— Xayr, — dedi tulki. "Va endi mening sirim, juda oddiy sir: faqat yurak bilan to'g'ri ko'rish mumkin; asosiy narsa ko'zga ko'rinmaydi."
"Asosiy narsa ko'zga ko'rinmas", deb takrorladi Kichkina shahzoda, albatta, eslab qolish uchun.
"Bu sizning atirgulingiz uchun behuda sarflagan vaqtingiz, bu sizning atirgulingizni juda muhim qiladi."
"Atirgulim uchun behuda sarflagan vaqtim keldi ..." dedi Kichkina shahzoda, albatta, eslashi uchun.
"Erkaklar bu haqiqatni unutdilar", dedi tulki. “Ammo buni esdan chiqarmaslik kerak, siz o'z qo'lingizga olgan narsangiz uchun abadiy javobgar bo'lasiz.
Siz atirgulingiz uchun javobgarsiz ... "
"Men atirgulim uchun javobgarman", deb takrorladi Kichkina shahzoda, albatta, eslab qolish uchun.
Ko'rib turganimizdek, matn tarjimasi so'zma-so'z amalga oshiriladi. Dastur jumlalardagi so'zlarni almashtira olmaydi, ya'ni chiqish tilida so'z tartibi deyarli har doim kirish tilidagi kabi bo'ladi. Shuningdek, "atirgul" so'zining tarjimasi juda ajoyib - "ko'tarilgan", men roziman, "atirgul" so'zi juda noaniq. Ammo lug'at tarjimada aynan "atirgul" so'zining birinchi ma'nosini beradi, tizim uni variant sifatida ham taklif qilmaydi. Ammo shu bilan birga, tizim "atirgul" so'zini ko'plikdagi "atirgullar" ni to'g'ri tarjima qiladi ("atirgullar" - n, pl, AmE, sl "U atirgullardan foydalanadi - U dorixonani uradi" ni hisobga olmaganda ). Shubhasiz, bu kontekstda so'z "atirgul" deb tarjima qilinishi kerak, ammo tizim kontekstni tahlil qila olmaydi va shuning uchun to'g'ri ekvivalentni tanlay olmaydi. Katta harf bilan yozilgan "siz" so'zlari bilan chalkashib ketgan, aniqki, ushbu foydalanuvchi sozlamalarida "siz" so'zi bosh harf bilan "siz" deb tarjima qilinishi kerak. "Siz" yoki "siz" kabi emas. Ammo dasturning ushbu versiyasida uni osongina tuzatish mumkin, joriy foydalanuvchi uchun sozlamalarni o'zgartirish kifoya. "Qarash" so'zi "qarash" deb tarjima qilinadi, bu holda "qarash" deb tarjima qilinishi mumkin bo'lgan narsani hisobga olmagan holda, bu holda afzalroqdir. "Yolg'iz o'zida" iborasi "o'zida" deb tarjima qilingan. Tabiiyki, inglizcha otlar jinsning grammatik toifasini yo'qotganligini hamma biladi. Shuning uchun ularning barchasi 3 shaxs birlik olmoshiga qo'shiladi - neter jins. Rus tilida jins kategoriyasi otlarda mavjud. Tizimni nazorat qilish maqsad tilda jinsni moslashtirishning mumkin emasligidir. Rus tilidagi "atirgul" so'zlari ayollikdir. Qavs ichida berilgan so'zlar so'zlarni tarjima qilish variantlari (ikkinchi ma'nolari) bo'lib, uni tizim tarjimon muharririning tanloviga qoldiradi. "To'g'ri" so'zi qo'shimcha variantlarsiz birinchi ma'noda tarjima qilingan. "Asosiy" so'zi bilan ham xuddi shunday. Boshlang'ich bo'lmagan shaklda ko'rsatilgan "isrof" so'zi ABBY Lingvo elektron lug'ati tomonidan shunday tarjima qilingan: "isrof qilingan" adj. ozg'in, ozg'in; bo'yi past; rangpar; bu matnda "sarflangan", "bergan" deb tarjima qilinishi kerak.
Ishning ushbu bosqichida frantsuz tilidan tarjima qilishda grammatika va lug'atda bir xil muammolar mavjudligini vizual aniqlash uchun ingliz tilidan qilingan tarjimalarni frantsuz tilidan (asl til) tarjimalari bilan solishtirish tavsiya etiladi.
Le Petit Prince s "en fut revoir les Roses:
"Vous n" êtes pas du tout semblables à ma rose, vous n "êtes rien encore, leur dit-il. Personne ne vous a apprivoisées et vous n "avez apprivoisé personne".
Et les roses étaient bien gênées.
“Vous êtes belles, mais vous êtes vides, leur dit-il encore. On ne peut pas mourir pour vous. Bien sûr, ma rose à moi, un passant ordinaire croirait qu "elle vous o'xshash. Mais à elle seule elle est plus importante que vous toutes
Et il revint vers le renard:
“Assalomu alaykum...
Mayli, dit le renard. Ovozning siri. Il est très simple: on ne voit bien qu "avec le cœur. L" essentiel est invisible pour les yeux.
L "essentiel est invisible pour les yeux, répéta le petit prince, afin de se yodgorlik.
C "est le temps que tu as perdu pour ta rose qui fait ta rosé si importante.
C "est le temps que j" ai perdu pour ma rose ..., fit le petit prince, afin de se suvenir.
Les hommes ont oublié cette vérité, dit le renard. Mais tu ne dois pas l "oublier. Tu deviens responsable pour toujours de ce que tu as apprivoisé. Tu es responsable de ta rose ...
Je suis responsable de ma rose ... ”, répéta le petit prince, afin de se suvenir. (№ 5)
Tarjimon tomonidan tarjima qilingan:
“Kichkina shahzoda atirgullarga qarashga ketdi.
Siz mening atirgulimga o'xshamaysiz, - dedi u ularga. - Siz hali hech narsa emassiz. Sizni hech kim o'zlashtirgani yo'q, siz ham hech kimni qo'lingizga olmadingiz.
Va atirgullar juda xijolat bo'lishdi.
Siz go'zalsiz, lekin bo'm-bo'sh, - dedi u nihoyat. "Hech kim siz uchun o'lishni xohlamaydi. Albatta, tasodifiy o'tkinchi mening atirgulimga qarab, siznikiga o'xshaydi, deydi. Ammo men uchun u barchangizdan azizroq va muhimroqdir
Va kichkina shahzoda tulkiga qaytib keldi.
Xayr... - dedi.
Xayr, dedi Tulki. - Bu mening sirim, bu juda oddiy: siz faqat qalbingiz bilan ko'rishingiz mumkin. Eng muhimi, ko'zga ko'rinmas.
Eng muhimi, ko'zga ko'rinmas, - takrorladi Kichkina shahzoda yaxshiroq eslab qolish uchun.
Atirgulingizga ko'p vaqt berganingiz uni o'ziga xos qiladi.
Men unga juda ko'p vaqt berganim uchun ... - takrorladi Kichkina shahzoda yaxshiroq eslab qolish uchun.
Odamlar bu haqiqatni unutishdi, - dedi Tulki, - lekin siz unutmaysiz: siz o'z qo'lingizga olgan har bir kishi uchun abadiy javobgarsiz. Siz gulingiz uchun javobgarsiz.
Men atirgulim uchun javobgarman ... - yaxshi eslab qolish uchun kichkina shahzoda takrorladi.
PROMT tizimi tomonidan frantsuz tilidan rus tiliga tarjima qilingan:
Kichkina shahzoda yana atirgullarni ko'rishi kerak edi:
“Sen mening atirgulimga o‘xshamaysan, boshqa hech kim emassan, deydi u ularga, seni hech kim qo‘lga olmadi, hech kimni qo‘lga olmading.
"Va atirgullar juda uyatchan edi.
"Siz go'zalsiz, lekin siz bo'm-bo'sh, u ularga aytadi. Biz siz uchun o'la olmaymiz. Albatta, mening atirgulim, oddiy o'tkinchi, u siz kabi bo'ladi deb o'ylardi. Lekin u sizdan ko'proq narsani import qiladi. hammasi
Va u tulkiga qaytib keldi:
— Xayr, deydi u
Xayr, deydi tulki. Bu mening sirim. Bu juda oddiy: biz faqat c va * 339 bilan yaxshi ko'ramiz; ur. Muhim qismi ko'zga ko'rinmas.
Muhim qism ko'zga ko'rinmas, - deb takrorladi Kichkina shahzoda, eslab qolish uchun.
Bu sizning atirgulingiz uchun yo'qotgan vaqtingiz, bu sizning atirgulingizni juda muhim qiladi.
Bu mening atirgulim uchun yo'qotgan vaqtim edi, eslash uchun Kichkina shahzoda qildim.
Odamlar bu haqiqatni unutdilar, deydi tulki. Ammo siz uni unutmasligingiz kerak. Siz o'zingiz egallab olgan narsangiz uchun abadiy javobgar bo'lasiz.
Siz atirgulingiz uchun mas'ulsiz - men o'zimning atirgulim uchun javobgarman, - deb takrorladi Kichkina shahzoda eslash uchun.
Umuman olganda, tarjima juda to'g'ri, parchaning umumiy ma'nosi aniq. Tarjima ham so'zma-so'z amalga oshiriladi, bu bizga tizim maqsadli tildagi so'zlarning tartibini o'zgartira olmasligini tasdiqlaydi. Tizim 2 ta soʻzni tarjima qila olmadi, ulardan birini tarjima qildi va “que avec le soeur” iborasi “qu`avec le soeur” deb yozilganligi sababli ulardan birini raqamli kod bilan almashtirdi. "e" unlisi bunday hollarda doimo tushib qoladi va yozma ravishda qisqartiriladi. Ingliz tilidan tarjima qilishda bo'lgani kabi, chiqish (rus) tilida ham gender nomuvofiqliklari topiladi. Garchi tizim rus tilida so'zlashuvchi mutaxassislar tomonidan yozilgan bo'lsa-da. Ayrim jumlalarning tarjimasi rus tilini yomon biladigan odam tomonidan tarjima qilingan degan fikr uyg‘otadi. Muammo chiquvchi tilning grammatik tuzilishini sintez qilishda emas, balki kirish tilining tuzilishini noto‘g‘ri tushunishda, ya’ni mohiyatan grammatik tahlildadir. Asosan, tizim oddiy jumlalarni nisbatan to'g'ri tarjima qiladi, murakkab, murakkab - tuzilgan yoki murakkab - bo'ysunuvchi jumlalar ham nisbatan oson tarjima qilinadi. Ammo agar kirish yoki tushuntirish konstruktsiyasiga duch kelsa va asosiy jumla buzilgan bo'lsa, dastur sintaksisni hisobga olmagan holda, so'zlarni oddiygina bog'lashga harakat qilib, so'zma-so'z tarjima qilishni boshlaydi. Shunday qilib, chiqish varianti juda murakkab va chalkash bo'lib chiqadi. Ammo, agar siz ushbu qoidalarning barchasi uchun algoritmlarni yozsangiz ham, kiritilgan matnni tushunmasdan, tarjima ba'zan butunlay mos kelmaydigan bo'lib qoladi.
Xulosa.
Xulosa qilishimiz mumkinki, to'liq avtomatik mashina tarjimasi nafaqat tilshunoslar, balki ushbu muammoga duch kelgan dasturchilar, kibernetika mutaxassislari va boshqa ko'plab fanlarning vakillari tomonidan hal qilinishi kerak bo'lgan juda qiyin vazifadir. Kompyuter dasturi yordamida tarjima jarayonining o'zini simulyatsiya qilish juda qiyin. Agar inson tarjima qilayotganda tasvirlarda o'ylasa va oxir-oqibat tinglovchiga qaysi fikrni etkazish kerakligidan kelib chiqadigan bo'lsa, unda bu dasturni o'rgatish mumkin emas (kompyuter texnologiyalari rivojlanishining hozirgi bosqichida).
Zamonaviy mashina tarjimasi dasturlari o'zlarining rivojlanishiga intilayotgan idealdan juda uzoqdir. Lekin ular tarjimonga muntazam ishida yaxshi yordamchi bo'lib xizmat qilishi shubhasiz. Hech bo'lmaganda, ular bir necha soniya ichida har qanday murakkablik va hajmdagi har qanday matnning qatorlararo tarjimasini hech qanday muammosiz amalga oshirishlari mumkinligi. Agar bir vaqtning o'zida ma'lum bir mavzu bo'yicha ustuvor lug'atlarni taqsimlash va tarjima yo'nalishi to'g'ri tuzilgan bo'lsa, chiqishda tahririyatni tahrirlash minimal talab qilinadi (umumiy lug'atning bog'langan lug'ati bilan tarjima bilan solishtirganda). Tabiiyki, matnni mashinaning qo'liga to'liq qoldirish mumkin emas. Yangi avlod tizimlari allaqachon tarjima qilingan konstruktsiyalarni "esda saqlashi" mumkin va keyin ularni qayta tarjima qilishni talab qilmaydi. Tizimlar foydalanuvchilarga yordam berishda ham samaralidir, chunki "foydalanuvchi" lug'atini yaratish mumkin, bu ma'lum bir mavzu bo'yicha tarjimani sezilarli darajada osonlashtiradi.
Shunga qaramay, mening fikrimcha, mashina tarjimasi tizimlari afzalliklaridan ko'ra ko'proq kamchiliklarga ega. Asosiy kamchilik, albatta, lug'atdir. Dastur so'zlarning elementar ma'nolarini hisobga olmaydi va ularni tarjima qilishda variant sifatida taklif qilmaydi. Shunday qilib, bu foydalanuvchini ushbu so'z shakllarini lug'atda izlashga majbur qiladi, bu esa ishlab chiqaruvchilarning fikriga ko'ra, tizimning asosiy afzalliklaridan biri - tezlik. Grammatik darajadagi kamchiliklar. Ushbu kamchiliklarni kirish tilida emas, balki tahlilda ham, chiqish tilida sintezda ham kuzatish mumkin. Kirish va chiqish tillarining grammatik xususiyatlari, masalan, rus tilidagi otlarning jinsi va ingliz tilida yo'qligi hisobga olinmaydi. Tizim, qoida tariqasida, kirishda sintaktik tahlilni ham amalga oshiradi, lekin agar gap dasturda ko'rsatilgan algoritmga mos kelmasa, tizim sintaktik bog'lanishlarga e'tibor bermasdan, so'zma-so'z tarjima qilishni boshlaydi.
Ushbu muammoni ko'rib chiqib, men mashina tarjimasi, qoida tariqasida, mumkin degan xulosaga keldim, lekin uni faqat tarjimaning majburiy tahrirlanishi kerak bo'lgan "qoralama" versiyasi sifatida ko'rib chiqish kerak.
Bibliografiya
Rus tilidagi adabiyot manbalari
1. Arapov M.V. Shreyder Yu.A. Semantika va mashina tarjimasi.. Moskva, 1965, №1
2. Barxudarov L.S. Til va tarjima. - M .: Int. munosabatlar, 1975 yil.
3. Belonogov G.G. Yu.G.Zelenkov Ruscha-inglizcha va inglizcha-ruscha mashina tarjimasining interaktiv tizimi, VINITI, 1993 y.
4. Moskva universiteti axborotnomasi. Ser 19 Tilshunoslik va madaniyatlararo muloqot. 2004 yil. 4-son, 51-bet.
5. Uy kompyuteri - 2004., 12-son
6. Kanichev M. Maqola. // Kompyuter dunyosi. - 1998 yil, 8-son.
7. Komissarov V.N. "Zamonaviy tarjimashunoslik", ETS, M. 2004 yil, 411-bet.
8. Kompyuter bosish. - 2004 yil. 7-son
9. Kompyuter bosish. - 2004. -№11
10. Lyudskanov A. Mashina tarjimasi uchun tanlangan strategiya. - Kitobda: Mashina tarjimasi bo'yicha xalqaro seminar. M., VTsP, 1975 yil
11. Marchuk Yu.N. Mashina tarjimasi muammolari. Moskva: Nauka, 1983 yil
12. Mashina tarjimasi bo'yicha materiallar. Nashr 1. L., 1958 yil. 5-bet.
13. Mashina tarjimasi. Ingliz tilidan tarjima qilingan maqolalar to'plami, M., 1957
14. Kompyuter dunyosi. - 2004. - 9-son
15. Internet olami. - 2001. No 2, 2-bet. 16-26.
16. Minyar - Beloruchev A.P., ingliz. Tarjima darslik. M., "Imtihon", 2004 yil.
17. Panov D.Yu., Avtomatik tarjima, M., 1958 y
18. Revzin. I., V. Yu. Rozenzveyg. Umumiy va mashina tarjimasi asoslari., 1964 yil.
19. Yoshlar uchun texnologiya. - 2005 yil. № 2.
20. Chaliapina Z.M. "Avtomatik tarjima: evolyutsiya va zamonaviy tendentsiyalar" tilshunoslik savollari, 1996 yil, № 2.
Chet tillaridagi adabiyot manbalari
2. Dezso L., Papp F. Leksikografik ishlarni mexanizatsiyalash va teskari lug'atlar. - In: “Hisoblash tilshunosligi, III”, 212-215-bet.
3. Antuan de Sent - Ekzyuperi. Le Petit Prince., M., Yupiter-Inter, 2003 yil
4. Visson L., Rus tilidan ingliz tiliga, Ardis, 1991 yil
Elektron manbalar
5. Elektron lug'at ABBY LINGVO 9.0
Agar siz yordamga qiziqsangiz ISHINGIZNI YOZISH, individual talablarga ko'ra - taqdim etilgan mavzu bo'yicha ishlab chiqishda yordam buyurtma qilish mumkin - Mashina tarjimasi. PROMT mashina tarjimasi tizimi ... yoki shunga o'xshash. Bizning xizmatlarimiz allaqachon bepul takomillashtirish va universitetda himoyadan oldin qo'llab-quvvatlash bilan qoplanadi. Va o'z-o'zidan ma'lumki, sizning ishingiz plagiat uchun tekshiriladi va erta nashr qilinmasligi kafolatlanadi. Buyurtma berish yoki individual ishning narxini baholash uchun quyidagi manzilga o'ting
Avvalo, mashina tarjimasi tarixidagi ba'zi muhim sanalarni belgilash kerak:
1947 yil - ilmiy soha sifatida mashina tarjimasining tug'ilgan kuni. Rokfeller jamg'armasining Tabiiy fanlar bo'limi direktori Uorren Uiver Norbert Vinerga maktub yozdi, unda u matnlarni bir tildan ikkinchi tilga tarjima qilish vazifasini shifrni ochish usullarini qo'llashning boshqa sohasi deb hisobladi. Ushbu maktubdan keyin ko'plab muhokamalar bo'lib o'tdi. 1947 yil - A. But va D. Britten so'zma-so'z mashina tarjimasi uchun batafsil "kod" ni ishlab chiqdilar. 1948 yil - R. Richens so'z shakllarini asos va tugalga bo'lish qoidalarini taklif qildi. 1952 yil - MITda birinchi mashina tarjimasi konferentsiyasi. 1954 yil - birinchi mashina tarjimasi tizimi taqdim etildi - IBM Mark II - ruscha-inglizcha, 250 birlikdan iborat lug'at va 6 grammatik qoidalarga ega edi. Keyingi o'n yil mashina tarjimasi uchun jadal rivojlanish davri bo'ldi. 1967 yil - AQShda maxsus tuzilgan Milliy Fanlar akademiyasining komissiyasi AQShdagi tarjimalar bilan bog'liq real vaziyat va turli tarjima usullarining narxi ko'rsatkichlariga asoslanib, mashina tarjimasi foydasiz degan xulosaga keldi. Hisobot umuman deputatning rivojlanishini sezilarli darajada sekinlashtirdi. 70-yillar - MT sohasidagi ishlarning yangi ko'tarilishi. Kompyuter texnologiyalarining rivojlanishi bilan lingvistik algoritmlarni mashinada amalga oshirishning yangi imkoniyatlari paydo bo'ldi. 80-yillar - shaxsiy kompyuterlarning ishlash muddati ancha arzonlashdi, mashina tarjimasi nihoyat iqtisodiy jihatdan foydali bo'ldi. 90-yillar - Internetning paydo bo'lishi va jadal rivojlanishi bilan bog'liq bo'lgan mashina tarjimasiga qiziqishning yana bir o'sishi mavjud. Onlayn tarjima imkoniyatlari til to'sig'ini engib o'tish va xorijiy saytlarda harakat qilish imkonini beradi.
Va endi biz ushbu faktlarni batafsil ko'rib chiqishimiz kerak:
Shunday qilib, birinchi marta mashina tarjimasi imkoniyati g'oyasini 1836-1848 yillarda ishlab chiqqan Charlz Bebbij (1791-1871) ifodalagan. raqamli analitik mashina loyihasi - 100 yildan keyin paydo bo'lgan elektron raqamli kompyuterlarning mexanik prototipi. Ch.Bebbijning g'oyasi shundan iborat ediki, lug'atlarni saqlash uchun 1000 ta 50 bitli o'nlik sonlar xotirasidan (har bir registrda 50 tishli g'ildirak) foydalanish mumkin edi. Ch.Bebbij bu g‘oyani Britaniya hukumatidan o‘zi hech qachon qura olmagan analitik mashinaning jismoniy timsoli uchun zarur bo‘lgan mablag‘larni so‘rash uchun asos sifatida keltirdi (qarang Apokin va boshqalar. Charlz Babbage. M., Nauka, 1981).
Tarjima uchun kompyuterlardan foydalanish g'oyasi 1946 yilda, birinchi kompyuterlar paydo bo'lgandan so'ng darhol ifodalangan. Tadqiqot sohasi sifatida deputatning tug'ilgan sanasi 1947 yil deb hisoblanadi: barchasi Rokfeller jamg'armasi Tabiiy fanlar bo'limi direktori Uorren Uiverning o'sha yilning mart oyida Norbert Vinerga yozgan maktubi bilan boshlangan. unda tarjima vazifasi matnlarni ochish vazifasi bilan solishtirildi. Ikkinchisi o'sha paytda elektromexanik qurilmalarda amalga oshirila boshlandi. Ushbu maktubdan so'ng ko'plab muhokamalar, maqsad to'g'risidagi memorandum va nihoyat tadqiqot uchun mablag' ajratildi. Mashina tarjimasining birinchi ommaviy namoyishi (Jorjtaun tajribasi deb ataladigan) 1954 yilda bo'lib o'tdi. Ushbu tizimning ibtidoiyligiga qaramay (150 so'zdan iborat lug'at, 6 ta qoida grammatikasi, bir nechta oddiy iboralarning tarjimasi), bu tajriba olindi. keng javob: tadqiqotlar Angliya, Bolgariya, Sharqiy Germaniya, Italiya, Xitoy, Frantsiya, Germaniya, Yaponiya va boshqa mamlakatlarda boshlandi; xuddi shu 1954 yilda SSSRda.
Mashinali tarjima tizimlarining birinchi avlodi so‘zma-so‘z va iborama-so‘z ketma-ket tarjima algoritmlariga asoslangan edi. Bunday tizimlarning imkoniyatlari to'g'ridan-to'g'ri kompyuter xotirasi hajmiga bog'liq bo'lgan lug'atlarning mavjud o'lchamlari bilan aniqlandi. Matn tarjimasi alohida jumlalarda amalga oshirilgan, ular orasidagi semantik aloqalar hech qanday tarzda hisobga olinmagan. Bunday tizimlar to'g'ridan-to'g'ri tarjima tizimlari deb ataladi. Vaqt o'tishi bilan ularning o'rnini keyingi avlodlar tizimlari egalladi, ularda tildan tilga tarjima sintaktik tuzilmalar darajasida amalga oshirildi. Tarjima algoritmlarida tarjima qilingan jumlani tahlil qilish orqali uning sintaktik tuzilishini kirish jumla tilining grammatikasi qoidalariga muvofiq qurish imkonini beradigan operatsiyalar to'plami ishlatilgan (xuddi o'rta maktabda bolalarga tilni o'rgatish kabi). , so‘ngra uni chiqish gapning sintaktik tuzilishiga aylantiring va lug‘atdan kerakli so‘zlarni o‘rniga qo‘yib chiqish gapni sintezlang. Bunday tizimlar T-tizimlar deb ataladi (inglizcha transfer - transformatsiya so'zidan).
Mashinali tarjima tizimlarini qurishga yondashuv eng mukammali, kirish gapning semantik tahlili orqali ba'zi, tildan mustaqil, semantik ifodasini olishga asoslangan. Keyin olingan semantik vakillikka muvofiq chiqish gapning sintezi amalga oshiriladi. Bunday tizimlar I-tizimlar deb ataladi (I - "interlingua" so'zidan). Mashinali tarjima tizimlarining keyingi avlodlari I-tizimlar sinfiga tegishli bo'ladi, deb ishoniladi.
Biroq matnlar bilan ishlash algoritmlarini qanday rasmiylashtirish va qurish, mashinaga qanday lug‘atlarni kiritish, mashina tarjimasida qanday lingvistik qonuniyatlardan foydalanish va umuman bu qonuniyatlar qanday bo‘lishi borasida juda ko‘p qiyinchilik va noaniqliklar mavjud edi.
Ma'lum bo'lishicha, an'anaviy tilshunoslikda na faktik materiallar, na tarjima qilingan matnning ma'nosidan foydalanadigan mashinali tarjima tizimlarini yaratish uchun zarur bo'lgan g'oyalar va tushunchalar mavjud emas.
An’anaviy tilshunoslik nafaqat semantika, balki sintaksis nuqtai nazaridan ham dastlabki fikrlarni bera olmadi. O‘sha davrda hech bir til uchun sintaktik konstruksiyalarning ro‘yxatlari yo‘q edi, ularning uyg‘unlik va o‘zaro almashinish shartlari o‘rganilmagan, kichikroqlaridan sintaktik tuzilmaning yirik birliklarini yasash qoidalari ishlab chiqilmagan. Aslini olganda, 1950-yillarda an'anaviy tilshunoslik mashinali tarjima tizimlarini qurish bilan bog'liq birgina savolga javob bera olmadi.
1960-yillarning o'rtalariga kelib, Qo'shma Shtatlarda amaliy foydalanish uchun ikkita ruscha-inglizcha tarjima tizimi taqdim etildi:
- MARK (AQSh Harbiy havo kuchlarining xorijiy texnologiyalar departamentida);
- · GAT (Jorjtaun universiteti tomonidan ishlab chiqilgan, Oak Ridjdagi Milliy atom energiyasi laboratoriyasida va Italiyaning Ispra shahridagi Evratom markazida qo'llaniladi).
Biroq, bunday tizimlarni baholash uchun yaratilgan ALPAC komissiyasi mashinada tarjima qilingan matnlarning past sifati tufayli AQShda bu faoliyat foydasiz degan xulosaga keldi. Komissiya nazariy ishlanmalarni davom ettirish va chuqurlashtirishni tavsiya qilgan bo'lsa-da, umuman olganda, uning xulosalari pessimizmning kuchayishiga, moliyalashtirishning qisqarishiga va ko'pincha ushbu mavzu bo'yicha ishlarning to'liq to'xtatilishiga olib keldi.
Shunga qaramay, bir qator mamlakatlarda tadqiqotlar davom etdi, bunga hisoblashning doimiy rivojlanishi yordam berdi. Mini- va shaxsiy kompyuterlar va ular bilan tabiiy til ma'lumotlari bilan ishlashga qaratilgan tobora murakkab lug'at, qidiruv va boshqalar tizimlarining paydo bo'lishi ayniqsa muhim omil bo'ldi. Tarjimaga ehtiyoj ham xalqaro munosabatlarning kuchayishi tufayli ortib bordi. Bularning barchasi 1970-yillarning o'rtalarida boshlangan ushbu sohada yangi yuksalishlarga olib keldi. 1980-yillarda tarjima tizimlaridan keng amaliy foydalanish vaqti keldi va bu mavzu bo'yicha tijorat ishlanmalari bozori paydo bo'ldi.
Biroq, yarim asr oldin insoniyatning mashina tarjimasi vazifasini bajargan orzulari ko'p jihatdan orzu bo'lib qolmoqda: keng doiradagi matnlarni yuqori sifatli tarjima qilish hali ham amalga oshmaydi. Biroq, mashina tarjimasi tizimlaridan foydalanganda tarjimon ishining tezlashishiga shubha yo'q: 1980-yillarning oxiridagi hisob-kitoblarga ko'ra, besh martagacha. 1990 yilda mashina tarjimasi bo'yicha mutaxassis Larri Childs mashina tarjimasi tizimlarining quyidagi tasnifini taklif qildi:
- FAMT (Fully-automated machine translation) - to'liq avtomatlashtirilgan mashina tarjimasi;
- HAMT (Human-assisted machine translation) - inson yordamida mashina tarjimasi;
- MAHT (Mashina yordamida inson tarjimasi) - kompyuter yordamida shaxs tomonidan amalga oshiriladigan tarjima.
Hozirgi vaqtda ko'plab tijorat mashina tarjimasi loyihalari mavjud. Mashina tarjimasida kashshoflardan biri Sistran edi. Rossiyada mashina tarjimasining rivojlanishiga professor Piotrovskiy (Rossiyaning Gertsen davlat pedagogika universiteti, Sankt-Peterburg) boshchiligidagi guruh katta hissa qoʻshdi.
A. A. Taraskin tomonidan tayyorlangan
Kompyuter tarjimasini bajarish qiyin, ammo qiziqarli ilmiy vazifadir. Uning asosiy qiyinligi tabiiy tillarni rasmiylashtirish qiyinligidadir. Demak, MT tizimlari yordamida olingan matnning past sifati, mazmuni va shakli hazilning o'zgarmas ob'ekti bo'lib xizmat qiladi. Biroq, mashina tarjimasi g'oyasi uzoq vaqtga borib taqaladi. Mashinada tarjima qilish imkoniyati haqidagi g'oyani birinchi marta 1836-1848 yillarda ishlab chiqqan Charlz Bebbij bildirgan. raqamli analitik dvigatel loyihasi. Ch.Bebbijning g'oyasi shundan iborat ediki, lug'atlarni saqlash uchun 1000 ta 50 bitli o'nlik sonlar xotirasidan (har bir registrda 50 tishli g'ildirak) foydalanish mumkin edi. Ch.Bebbij bu g‘oyani Britaniya hukumatidan o‘zi qura olmagan analitik dvigatelning jismoniy timsoli uchun zarur bo‘lgan mablag‘larni so‘rash uchun asos sifatida keltirdi.
Va oradan 100 yil o'tgach, 1947 yilda V. Uiver (Rokfeller jamg'armasi tabiiy fanlar bo'limi direktori) Norbert Vinerga xat yozdi. Ushbu maktubda u matnlarni tarjima qilish uchun shifrni ochish usullaridan foydalanishni taklif qildi. Bu yil mashina tarjimasining tug'ilgan yili hisoblanadi. Oʻsha yili soʻzma-soʻz tarjimani amalga oshirish algoritmi ishlab chiqildi va 1948 yilda R. Richens soʻzni oʻzak va oxirga boʻlish qoidasini taklif qildi. Mashina tarjimasi tizimlari keyingi yigirma yil ichida tez rivojlandi. 1954 yil yanvar oyida birinchi IBM Mark II mashina tarjimasi tizimi IBM 701 mashinasida namoyish etildi. Ammo 1967 yilda AQSh Milliy Fanlar akademiyasining maxsus tuzilgan komissiyasi mashina tarjimasini foydasiz deb tan oldi, bu esa ushbu sohadagi tadqiqotlarni sezilarli darajada sekinlashtirdi. Mashina tarjimasi 70-yillarda yangi yuksalishni boshdan kechirdi va 80-yillarda mashina vaqtining nisbatan arzonligi tufayli iqtisodiy jihatdan foydali bo'ldi.
Biroq, SSSRda mashina tarjimasi sohasidagi tadqiqotlar davom etdi. IBM Mark II tizimining namoyishidan so'ng, VINITI olimlari guruhi BESM mashinasi uchun mashina tarjimasi tizimini ishlab chiqishga kirishdilar. Ingliz tilidan rus tiliga tarjimaning birinchi namunasi 1955 yil oxirida olingan.
Ishning yana bir yo'nalishi SSSR Fanlar akademiyasi Matematika institutining Amaliy matematika bo'limida (hozirgi Rossiya Fanlar akademiyasining Keldish amaliy matematika instituti) A. A. Lyapunov tashabbusi bilan paydo bo'ldi. Ushbu jamoa tomonidan ishlab chiqilgan birinchi mashina tarjimasi dasturlari Strela mashinasida amalga oshirildi. MT tizimlarini yaratish bo'yicha ishlar tufayli amaliy tilshunoslik kabi yo'nalish shakllandi.
70-yillarda VINITI RAS ishlab chiquvchilari guruhi prof. G.G. Belonogov. Ularning birinchi MP tizimi 1993 yilda ishlab chiqilgan va 1996 yilda bir qator yaxshilanishlardan so'ng ROSAPOda Retrans nomi bilan ro'yxatdan o'tgan. Bu tizim mudofaa, temir yo'l, fan va texnika vazirliklari tomonidan qo'llanilgan.
Parallel tadqiqotlar Leningrad davlat pedagogika institutining muhandislik tilshunosligi laboratoriyasida olib borildi. A. I. Gertsen (hozirgi Pedagogika universiteti). Aynan ular hozirgi kunda eng mashhur "PROMT" MP tizimining asosini tashkil qilganlar. Ushbu dasturiy mahsulotning so'nggi versiyalari ilm-fanni talab qiluvchi texnologiyalardan foydalanadi va kengaytirilgan o'tish tarmoqlari texnologiyasi va neyron tarmoqlari rasmiyatchiligi asosida qurilgan.
Mashinali tarjima tizimlarining Larri Child tasnifi
CompuServe xorijiy tillar forumining yangi a'zolari tez-tez kimdir mos narxga yaxshi mashina tarjimasi dasturini tavsiya qila oladimi, deb so'rashadi.
Bu savolga javob har doim yo'q. Respondentga qarab, javob ikkita asosiy dalilni o'z ichiga olishi mumkin: yoki mashinalar tarjima qila olmaydi yoki mashina tarjimasi juda qimmat.
Bu ikkala dalil ham ma'lum darajada to'g'ri. Biroq, javob oddiylikdan uzoqdir. Mashina tarjimasi (MT) muammosini o'rganayotganda, ushbu muammoning turli bo'limlarini alohida ko'rib chiqish kerak. Quyidagi bo'lim Larri Childs tomonidan 1990 yilda Texnik aloqalar bo'yicha xalqaro konferentsiyada bergan ma'ruzalariga asoslanadi:
To'liq avtomatik tarjima;
Inson yordami bilan avtomatlashtirilgan mashina tarjimasi;
Kompyuter yordamida inson tarjimasi.
To'liq avtomatlashtirilgan mashina tarjimasi
Ushbu turdagi mashina tarjimasi ko'pchilik mashina tarjimasi haqida gapirganda nimani nazarda tutadi. Ma’nosi oddiy: bir tildagi matn kompyuterga kiritiladi, bu matn qayta ishlanadi va kompyuter bir xil matnni boshqa tilda chiqaradi. Afsuski, ushbu turdagi avtomatik tarjimani amalga oshirish hali ham engib o'tish kerak bo'lgan muayyan to'siqlarga duch keladi.
Asosiy muammo - bu tilning murakkabligi. Masalan, "mumkin" so'zining ma'nolarini olaylik. Modal ko‘makchi fe’lning asosiy ma’nosidan tashqari “can” so‘zi ot sifatida bir qancha rasmiy va jargon ma’nolarga ega: “bank”, “hojatxona”, “qamoq”. Bundan tashqari, bu so'zning arxaik ma'nosi bor - "bilish yoki tushunish". Agar maqsad tilda ushbu ma'nolarning har biri uchun alohida so'z bor deb faraz qilsak, kompyuter ularni qanday ajratishi mumkin?
Ma’lum bo‘lishicha, kontekstga qarab ma’noni farqlovchi tarjima dasturlarini ishlab chiqishda ma’lum yutuqlarga erishilgan. Keyinchalik matnlarni tahlil qilishda ko'proq ehtimollik nazariyasiga tayanadi. Biroq, keng ko'lamli mavzularga ega matnlarni to'liq avtomatlashtirilgan mashina tarjimasi hali ham imkonsiz vazifadir.
Inson yordami bilan avtomatlashtirilgan mashina tarjimasi.
Ushbu turdagi mashina tarjimasini endi amalga oshirish mumkin. Inson yordami bilan mashina tarjimasi odatda matnlarni kompyuterda qayta ishlashdan oldin ham, keyin ham tahrirlashni anglatadi. Inson tarjimonlari matnlarni mashinalar tomonidan tushunilishi uchun o'zgartiradilar. Kompyuter tarjimani amalga oshirgandan so'ng, odamlar yana qo'pol mashina tarjimasini tahrir qilib, maqsadli tilni to'g'ri qiladi. Ushbu ish tartibiga qo'shimcha ravishda, tarjima paytida kompyuterga ayniqsa murakkab yoki noaniq tuzilmalarni tarjima qilishda yordam beradigan inson tarjimonining doimiy ishtirokini talab qiladigan MT tizimlari mavjud.
Inson yordami bilan mashina tarjimasi ko'proq cheklangan lug'atga ega bo'lgan tor mavzulardagi matnlarga nisbatan qo'llaniladi.
Inson yordami bilan mashina tarjimasining iqtisodiy samaradorligi hali ham munozarali masala. Dasturlarning o'zi odatda ancha qimmat va ularning ba'zilari ishlashi uchun maxsus apparat talab qilinadi. Oldin va keyingi tahrir qilishni o'rganish kerak va bu ish yoqimli emas. So'z ma'lumotlar bazalarini yaratish va saqlash juda mashaqqatli va ko'pincha maxsus ko'nikmalarni talab qiladi. Biroq, aniq belgilangan tematik sohada katta hajmdagi matnlarni tarjima qiladigan tashkilot uchun inson yordami bilan mashina tarjimasi an'anaviy inson tarjimasiga nisbatan ancha tejamkor alternativ bo'lishi mumkin.
Kompyuter yordamida inson tarjimasi
Bunday yondashuvda inson tarjimoni tarjima jarayonining markaziga joylashtiriladi, kompyuter dasturi esa tarjima jarayonini yanada samaraliroq va tarjimani aniqroq qilish vositasi sifatida qaraladi. Bu oddiy elektron lug'atlar bo'lib, kerakli so'zning tarjimasini ta'minlaydi, kerakli variantni va tarjima qilingan matnning ma'nosini tanlash uchun shaxsni javobgar qiladi. Bunday lug'atlar tarjima jarayonini sezilarli darajada osonlashtiradi, lekin foydalanuvchidan til bo'yicha ma'lum bilimga ega bo'lishni va uni amalga oshirishga vaqt sarflashni talab qiladi. Va shunga qaramay, tarjima jarayonining o'zi juda tezlashtirilgan va osonlashtirilgan.
Tarjimonga o'z ishida yordam beradigan tizimlar orasida eng muhim o'rinni Tarjima xotirasi (TM) deb ataladigan tizimlar egallaydi. TM tizimlari asl tildagi ekvivalent matn segmentlarining juftlarini to'plash va ularni keyinchalik qidirish va tahrirlash imkoniyati bilan ma'lumotlar bazasida tarjima qilish uchun interfaol vositadir. Bu dasturiy mahsulotlar yuqori intellektli axborot texnologiyalaridan foydalanish uchun mo‘ljallanmagan, aksincha, tarjimonning ijodiy salohiyatidan foydalanishga asoslangan. Ish jarayonida tarjimonning o'zi ma'lumotlar bazasini shakllantiradi (yoki uni boshqa tarjimonlardan yoki mijozdan oladi) va u qancha ko'p birliklarni o'z ichiga olsa, undan foydalanish daromadi shunchalik yuqori bo'ladi.
Bu erda eng mashhur TM tizimlari ro'yxati:
Shveytsariyaning Star kompaniyasining tranziti,
Trados (AQSh),
IBMdan tarjima menejeri,
Frantsiyaning LANT kompaniyasining Eurolang Optimizatori,
ATRILdan DejaVu (AQSh),
WordFisher (Vengriya).
TM tizimlari bir xil matn qismlarini takroriy tarjima qilishni istisno qilish imkonini beradi. Segmentni tarjima qilish tarjimon tomonidan faqat bir marta amalga oshiriladi, so'ngra har bir keyingi segment ma'lumotlar bazasi bilan mos kelishi (to'liq yoki noaniq) uchun tekshiriladi va agar bir xil yoki o'xshash segment topilsa, u tarjima varianti sifatida taklif etiladi. .
Hozirgi vaqtda TM tizimlarini takomillashtirish bo'yicha ishlanmalar olib borilmoqda. Masalan, Transit by Star tizimining yadrosi neyron tarmoq texnologiyasi asosida amalga oshiriladi.
TM tizimlarining keng doirasiga qaramay, ular bir nechta umumiy funktsiyalarni birlashtiradi:
Hizalama funktsiyasi. TM tizimlarining afzalliklaridan biri bu mavzu bo'yicha allaqachon tarjima qilingan materiallardan foydalanish qobiliyatidir. TM ma'lumotlar bazasini asl va tarjima fayllarini segmentlar bo'yicha taqqoslash orqali olish mumkin.
Import-eksport filtrlarining mavjudligi. Bu xususiyat TM tizimlarining turli matn protsessorlari va nashriyot tizimlari bilan mosligini ta'minlaydi va tarjimonga mijozdan nisbatan mustaqillikni beradi.
Noaniq yoki to'liq mosliklarni topish mexanizmi. Aynan shu mexanizm TM tizimlarining asosiy afzalligi hisoblanadi. Agar matnni tarjima qilishda tizim avvalgi tarjima qilinganiga o'xshash yoki yaqin bo'lgan segmentga duch kelsa, u holda allaqachon tarjima qilingan segment tarjimonga joriy segment uchun tarjima varianti sifatida taklif qilinadi, uni tuzatish mumkin. Loyqa moslik darajasi foydalanuvchi tomonidan belgilanadi.
Tematik lug'atlarni qo'llab-quvvatlash. Bu funksiya tarjimonga lug'atga rioya qilishga yordam beradi. Qoidaga ko'ra, agar tarjima qilinadigan segmentda mavzuli lug'atdagi so'z yoki ibora topilsa, u rang bilan ajratib ko'rsatiladi va tarjima qilingan matnga avtomatik ravishda kiritilishi mumkin bo'lgan tarjimasi taklif etiladi.
Matn qismlarini qidirish vositalari. Ushbu vosita tarjimani tahrirlashda juda qulay. Agar ish jarayonida matnning istalgan bo'lagini tarjima qilishning yaxshiroq versiyasi topilgan bo'lsa, unda bu fragmentni barcha TM segmentlarida topish mumkin, shundan so'ng TM segmentlariga kerakli o'zgartirishlar ketma-ket kiritiladi.
Albatta, har qanday dasturiy mahsulot kabi TM tizimlarining ham o‘ziga xos afzalliklari va kamchiliklari, qo‘llanish sohasi mavjud. Biroq, TM tizimlariga kelsak, asosiy kamchilik ularning yuqori narxidir.
Ayniqsa, foydalanuvchi qo‘llanmalari, foydalanish yo‘riqnomalari, dizayn va biznes hujjatlari, mahsulot kataloglari va shunga o‘xshash ko‘p sonli tasodifiy hujjatlar kabi hujjatlarni tarjima qilishda TM tizimlaridan foydalanish qulay.
Mashina tarjimasi tizimlari (MT)
Yuqoridagi tasnifga muvofiq, ushbu ishning maqsadi ikkinchi guruh MP tizimlarini o'rganish va tahlil qilishdir, chunki birinchi guruh MP tizimlari tabiatda hali mavjud emas, uchinchi guruh tizimlari esa mohiyatiga ko'ra mavjud emas. , MP tizimlari emas, balki elektron lug'atlarga ko'proq o'xshaydi.
MT tizimlari avtomatlashtirilgan matn tarjimasini amalga oshiradi. Bunday holda, tarjima birliklari so'zlar yoki iboralar bo'lib, so'nggi ishlanmalar tarjima qilingan so'zning morfologiyasini hisobga olishga imkon beradi. Ishlab chiqilgan MT tizimlari tarjimani ishlab chiquvchi tomonidan belgilangan va/yoki foydalanuvchi tomonidan sozlangan tarjima algoritmlariga muvofiq amalga oshiradi.
Mashina tarjimasini amalga oshirish uchun kompyuterga tarjima algoritmini amalga oshiradigan maxsus dastur kiritiladi, bu L1 - L2 tillarining ma'lum bir juftligida tarjima mosligini topish uchun matnda bir ma'noli va qat'iy belgilangan harakatlar ketma-ketligi sifatida tushuniladi. berilgan tarjima yo'nalishi uchun (bir aniq tildan boshqasiga). Mashina tarjimasi tizimi ekvivalent, variant va transformatsion tarjima mosliklarini uzatishni ta'minlash uchun zarur grammatik ma'lumotlar (morfologik, sintaktik va semantik) bilan jihozlangan ikki tilli lug'atlarni, shuningdek, avtomatik ravishda qabul qilingan har qanday rasmiy grammatikani amalga oshiradigan algoritmik grammatik tahlil vositalarini o'z ichiga oladi. matnni qayta ishlash.... Uch yoki undan ortiq tillarga tarjima qilish uchun moʻljallangan alohida mashinali tarjima tizimlari ham mavjud, biroq ular hozirda eksperimental hisoblanadi.
Mashina tarjimasi tizimida tahlil va sintezni ta'minlaydigan quyidagi rasmiy operatsiyalar ketma-ketligi eng keng tarqalgan:
1. Birinchi bosqichda matn kiritiladi va kirish lug‘atida (tarjima qilingan tilning lug‘ati) kirish so‘z shakllari (aniq grammatik shakldagi so‘zlar, masalan, ko‘p sonli so‘zlar) qidiriladi. morfologik tahlil bilan birga, bunda berilgan soʻz shaklining maʼlum leksemaga (lugʻat birligi sifatidagi soʻz) tegishliligi. Tahlil jarayonida til tizimini tashkil etishning boshqa darajalariga oid ma’lumotlar so‘z shaklidan ham olinishi mumkin.
2. Keyingi bosqich ma'lum bir mavzu bo'yicha idiomatik iboralar, frazeologik birliklar yoki shtamplarni tarjima qilishni o'z ichiga oladi (masalan, inglizcha-ruscha tarjimada bitta raqamli ekvivalentni olish sharti bilan kabi iboralar va keyingi davrdan chiqarib tashlanadi. grammatik tahlil); kirish matni elementlarining asosiy grammatik (morfologik, sintaktik, semantik va leksik) xususiyatlarini (masalan, ushbu matndagi otlar soni, fe'l zamoni, so'z shakllarining sintaktik vazifalari va boshqalar) aniqlash til; homografiyaning qarori (so'z shakllarining omonimiyasini o'zgartirish - aytaylik, inglizcha davra ot, sifat, qo'shimcha, fe'l yoki predlog bo'lishi mumkin); leksemalarning leksik tahlili va tarjimasi. Odatda, bu bosqichda bir ma'noli so'zlar ko'p ma'noli so'zlardan ajratiladi (aniq tilda bir nechta tarjima ekvivalentiga ega), shundan so'ng bir ma'noli so'zlar ekvivalentlar ro'yxati bo'yicha tarjima qilinadi va polisemantik so'zlarni tarjima qilish uchun kontekstologik lug'atlardan foydalaniladi. lug'at yozuvlari qiymatning kontekstli determinantlari mavjudligi / yo'qligi bo'yicha kontekstni so'rash algoritmlari bo'lgan so'zlar.
3. Yakuniy grammatik tahlil, uning davomida maqsadli tilning ma'lumotlarini hisobga olgan holda zarur grammatik ma'lumotlar aniqlanadi (masalan, ruscha sleigh, qaychi kabi otlar bilan fe'l ko'plik shaklida bo'lishi kerak, shunga qaramay. asl nusxada birlik bo'lishi mumkin).
4. Chiqaruvchi so‘z shakllari va umuman gaplarning chiqish tilida sintezi.
Muayyan til juftligining morfologiyasi, sintaksisi va semantikasining xususiyatlariga, shuningdek tarjima yo'nalishiga qarab, umumiy tarjima algoritmi boshqa bosqichlarni, shuningdek nomdagi bosqichlarni yoki ularning tartibini o'zgartirishni o'z ichiga olishi mumkin, ammo buning o'zgarishi. zamonaviy tizimlarda odatda ahamiyatsiz. Tahlil va sintez ham iboralarda, ham kompyuter xotirasiga kiritilgan butun matn bo'yicha amalga oshirilishi mumkin; ikkinchi holda, tarjima algoritmi anaforik bog'lanishlar deb ataladigan ta'rifni ta'minlaydi (masalan, olmoshning u o'rnini bosadigan ot bilan bog'lanishi - aytaylik, olmosh so'zi bilan bu tushuntirishda qavs ichida).
Hozirgi vaqtda MT tizimlarini rivojlantirish uchun ikkita kontseptsiya mavjud:
1. Zamonaviy tarjima dasturiy ta'minotining aksariyat qismiga kiritilgan "murakkab tuzilishga ega katta lug'at" modeli;
2. "Ma'no-matn" modeli, birinchi bo'lib A.A. Lyapunov, lekin hali hech qanday tijorat mahsulotida amalga oshirilmagan.
Bugungi kunda eng mashhur mashina tarjima tizimlari kabi
PROMT tomonidan PROMT 2000 / XT;
Vista va Advantis tomonidan Retrans Vista;
Sokrat - "Arsenal" kompaniyasining dasturlari to'plami.
Hozirgi vaqtda mashina tarjimasining sifati ko'p narsani orzu qiladi va bunday tizimlarning mavjudligini ilmiy tadqiqot mavzusi sifatida qabul qilish to'g'riroqdir. Ko'pgina hollarda, loyiha ustida ishlashda MT tizimlaridan foydalanish oqlanmaydi, chunki:
MT tizimlari chiqish matnining maqbul sifatini ta'minlamaydi. Tizimni oldindan o'rnatish orqali yuqori sifatga erishish mumkin (PROMT XT seriyasidagi mahsulotlar foydalanuvchiga buning uchun ko'p imkoniyatlarni taqdim etadi), bu kichik hajmdagi tarjima qilingan matn uchun va / yoki keyingi tahrirlash uchun mutlaqo qabul qilinishi mumkin emas va bu faqat sekinlashadi. tarjimon ko'r-ko'rona chop etish usulidan foydalansa ish.
MT tizimlari, ayniqsa tarjimonlar jamoasi katta loyiha ustida ishlayotganda, terminologiyaning bir xilligiga rioya qilishni kafolatlamaydi. Aksincha, ular foydalanuvchi lug'atlariga juda ehtiyotkorlik bilan munosabatda bo'lish sharti bilan kafolat berishlari mumkin va bu har doim ham ishonishga arzimaydi.
Biroq, ba'zi hollarda, MT tizimlaridan foydalanish hali ham vaqt xarajatlarini kamaytirishga yordam beradi. Agar matn etarlicha uzun bo'lsa va monoton terminologiyani o'z ichiga olgan bo'lsa, bu sizga MT tizimini nisbatan tez sozlash imkonini beradi. Keyin matnni tahrirlash juda ko'p vaqt talab qilmaydi. Biroq, bu holda, ayniqsa, tarjima matnining uslubiga ehtiyot bo'lishingiz kerak. Mashina tarjimasi rasmiydir, shuning uchun asl tilning sintaktik tuzilmalarini kuzatish ehtimoli katta, bu umuman tarjimaga xosdir va shuning uchun tahrirlash paytida o'tkazib yuborilishi mumkin.
Umuman olganda, MT tizimlari eng standartlashtirilgan til oddiy grammatika va nisbatan kichik lug'at bilan qo'llanilganda yaxshi qo'llanilishi mumkin. Ob-havo prognozlarini frantsuz tilidan ingliz tiliga va aksincha tarjima qiladigan Germaniyaning Meteo dasturi MP tizimining juda muvaffaqiyatli loyihasi hisoblanadi. Tarjimonlar va texnik yozuvchilarning ishini engillashtirish uchun Boeing bir vaqtlar Boeing English deb nomlanuvchi texnik hujjatlarni yozish uchun til standartini ishlab chiqdi.
Retrans Vista MP tizimi
Matnlarni bir tabiiy tildan ikkinchisiga mashina tarjima qilish tizimlari inson tarjimonining ishini taqlid qiladi. Ularning ta’sirchanligi, eng avvalo, til va tafakkur faoliyatining obyektiv qonuniyatlarini qay darajada hisobga olishiga bog‘liq. Afsuski, bu qonunlar hali yetarlicha o‘rganilmagan. Mashina tarjimasi muammosini hal qilishda xalqaro muloqotning boy tajribasi va insoniyat tomonidan to‘plangan tarjima faoliyati tajribasini hisobga olish zarur. Va bu tajriba shuni ko'rsatadiki, tarjima jarayonida alohida so'zlar emas, balki integral tushunchalarni ifodalovchi frazeologik iboralar asosiy ma'no birliklari sifatida qaraladi. Aynan tushunchalar o'sha elementar aqliy tasvirlar bo'lib, ulardan foydalanib tarjima qilingan matnga mos keladigan yanada murakkab aqliy tasvirlarni yaratishingiz mumkin.
Ma'noning asosiy minimal birliklari sifatida alohida so'zlar emas, balki frazeologik iboralar ko'rib chiqiladigan mashinali tarjima tizimlarini frazeologik mashina tarjimasi tizimlari deb atashga rozi bo'laylik. Bu tizimlarda alohida so'zlar ham qo'llanilishi mumkin, ammo ular yordamchi ma'no birliklari sifatida qaraladi, agar yaxshiroq bo'lmasa, ularga murojaat qilish kerak.
Frazeologik mashina tarjimasi tizimi eng ko'p uchraydigan iboralar, frazeologik birikmalar va alohida so'zlar uchun tarjima ekvivalentlarini o'z ichiga olgan bilimlar bazasini, matnlarni morfologik va sintaktik tahlil qilish va sintez qilish va ularni shaxs tomonidan tahrirlash uchun dasturiy ta'minotni o'z ichiga olishi kerak. Matnlarni tarjima qilish jarayonida tizim oʻzining bilimlar bazasida saqlangan tarjima qilingan ekvivalentlardan quyidagi tartibda foydalanadi: birinchidan, butun iborani integral birlik sifatida tarjima qilishga harakat qilinadi; bundan tashqari, muvaffaqiyatsiz bo'lsa, uning tarkibiga kiritilgan iboralar; va nihoyat, matnning dastlabki ikki usul bilan tarjima qilib bo'lmaydigan qismlarini so'zma-so'z tarjima qilish amalga oshiriladi. Har uch usulda olingan chiqish matnining fragmentlari grammatik jihatdan bir-biriga mos kelishi kerak (morfologik va sintaktik sintez jarayonlaridan foydalangan holda).
Matnlarni frazeologik mashina tarjimasi tizimlarini qurish tamoyillari birinchi marta 1975 yilda D.Jukovning “Biz tarjimonmiz” kitobining so‘zboshida bayon etilgan. Ular 1983-yilda G.G.Belonogov va B.A.Kuznetsovning “Avtomatlashtirilgan axborot tizimlarining til vositalari” kitobida toʻliqroq shaklda taqdim etilgan. Nihoyat, 1993 yilda ikkita maqola chop etildi, ularda parallel (rus va ingliz) matnlardan ikki tilli lug'atlarni avtomatlashtirilgan tarzda tuzish uchun ushbu tamoyillar va usullarga asoslangan mashina tarjimasi tizimi tasvirlangan. Ushbu tamoyillar orasida eng muhimlari quyidagilardir:
1. Til va nutqning, eng avvalo, mashina lug‘atiga kiritilishi kerak bo‘lgan asosiy birliklari frazeologik birliklar (iboralar, iboralar) bo‘lishi kerak. Lug'atga alohida so'zlar ham kiritilishi mumkin, lekin ular faqat frazeologik birliklarga tayangan holda tarjima qilish imkoni bo'lmagan hollardagina qo'llanilishi kerak.
2. Mashina tarjimasi tizimlarida so‘zlarning uzluksiz ketma-ketliklaridan tashkil topgan frazeologik birliklar bilan bir qatorda “nutq modellari” deb ataladigan – turli so‘z va iboralar bilan to‘ldiriladigan, nutqning mazmunli bo‘laklarini hosil qiluvchi “bo‘sh joylari” bo‘lgan frazeologik birliklar ham qo‘llanilishi kerak. .
3. Haqiqiy matnlar, ma'lum bir tematik sohaga tegishli bo'lishidan qat'i nazar, agar ular etarlicha katta hajmga ega bo'lsa, odatda politematikdir. Shuning uchun, hatto bitta mavzu bo'yicha matnlarni tarjima qilish uchun mo'ljallangan mashina lug'ati politematik bo'lishi kerak va undan ham ko'proq turli mavzulardagi matnlarni tarjima qilish uchun mo'ljallangan. U, birinchi navbatda, bir-birining tarjimasi bo'lgan ikki tilli matnlarni avtomatlashtirilgan qayta ishlash asosida va tarjima tizimlarining ishlash jarayonida yaratilishi kerak.
4. Frazeologik mashina tarjimasi tizimlarida katta hajmli asosiy politematik lug‘at bilan bir qatorda kichik qo‘shimcha mavzuli lug‘atlar to‘plamidan foydalanish maqsadga muvofiqdir. Qo'shimcha lug'atlar faqat asosiy lug'atda mavjud bo'lmagan ma'lumotlarni o'z ichiga olishi kerak (masalan, turli mavzular uchun iboralar va so'zlarning ustuvor tarjima ekvivalentlari to'g'risidagi ma'lumotlar).
Ta'riflangan tamoyillar asosida VINITI RAS (yuqoriga qarang) ikkita frazeologik mashina tarjimasi tizimini yaratdi:
1) Ruscha-inglizcha tarjima tizimi (RETRANS)
2) inglizcha-ruscha tarjima tizimi (ERTRANS).
Ikkala tizim ham bir xil tuzilishga ega va mashina lug'atlarining taxminan bir xil o'lchamiga ega. Shuning uchun biz faqat birinchi tizimni ko'rib chiqamiz.
RETRANS tizimi quyidagi xususiyatlarga ega:
1. Amal qilish doirasi, maqsadi, funksionalligi. Tizim ilmiy-texnikaviy matnlarni rus tilidan ingliz tiliga avtomatlashtirilgan tarzda tarjima qilish uchun mo‘ljallangan. Tizimning ruscha-inglizcha politematik mashina lug'atida tabiiy va texnik fanlar, iqtisodiyot, biznes, siyosat, qonunchilik va harbiy ishlar uchun atamalar mavjud. Jumladan, unda quyidagi tematik sohalarda atamalar va frazeologik birliklar mavjud: Mashinasozlik, Elektrotexnika, Energetika, Transport, Aeronavtika. Astronavtika, robototexnika, avtomatlashtirish va radioelektronika, hisoblash texnikasi, aloqa, matematika, fizika, kimyo, biologiya, tibbiyot, ekologiya, qishloq xoʻjaligi, qurilish va arxitektura, astronomiya, geografiya, geologiya, geofizika, konchilik, metallurgiya va boshqalar.
Matnlarni tarjima qilish avtomatik va interaktiv rejimlarda amalga oshirilishi mumkin.
2. Politematik mashina lug'ati hajmi: 1.300.000 dan ortiq yozuvlar; Ularning 77 foizi ikki so‘zdan o‘n yetti so‘zgacha bo‘lgan iboralardir. Qo'shimcha mashina lug'atlarining hajmi (turli mavzular uchun tizimni sozlash uchun) 200 000 dan ortiq lug'at yozuvlarini tashkil etadi.
MP tizimi PROMT XT
PROMT kompaniyasining dasturiy mahsulotlari quyidagi fundamental muammolarni hal qilishga asoslangan:
Birinchidan, lug‘at qanchalik katta bo‘lsa, tarjima ham shunchalik yaxshi bo‘lishi hammaga ayon, ya’ni birinchi muammo tizimlar uchun yirik lug‘atlar yaratish muammosidir.
Ikkinchidan, tizim jumlalarni shunday tarjima qilishi kerakligi aniq: SALOM, QANDAY ishlaysiz? Bu shuni anglatadiki, yana bir muammo tizimni barqaror aylanmalarni tan olishga o'rgatishdir.
Uchinchidan, tarjima uchun jumla ma'lum qoidalarga muvofiq yozilishi aniq, u ma'lum qoidalarga muvofiq tarjima qilinadi, demak, yana bir muammo bor: bu qoidalarning barchasini dastur shaklida yozish. Bu, aslida, hammasi.
Eng qizig'i shundaki, bu muammolar haqiqatan ham mashina tarjimasi tizimlarini ishlab chiqishda asosiy muammolardir; boshqa narsa shundaki, ularni hal qilish usullari hamma uchun ma'lum emas va hech qanday holatda ko'rinadigan darajada oddiy emas.
Katta ma'lumotlar bazalarini tashkil qilish usullari juda yaxshi ishlab chiqilgan, ammo tarjima uchun asosiy elementga tegishli bo'lgan ma'lumotlarni to'g'ri tuzish, aynan shu elementni to'g'ri tanlash kam emas va ehtimol undan ham muhimroqdir. Masalan, lug'atdagi qancha yozuv oddiy ruscha "dastur" so'ziga mos kelishi kerak? Va umuman olganda, katta lug'at ko'plab lug'at yozuvlarini o'z ichiga olgan lug'atmi yoki matndan ko'p so'zlarni tanib olish imkonini beruvchi lug'atmi? Shubhasiz, ikkinchisi to'g'riroq. Shuning uchun tizimdagi kirish va chiqish tillarini tavsiflash uchun morfologiyani tavsiflashning qandaydir rasmiy usuli bo'lishi kerak, unga asoslanib lug'at birligini tanlash kerak.
Tarjima tizimlari sifatida qaraladigan barcha tizimlarda amalda morfologik modellarni ifodalash muammosi u yoki bu tarzda hal qilinadi. Ammo ba'zi tizimlar lug'at hajmi ellik ming yozuvga ega bo'lgan million so'z shakllarini taniy oladi, boshqalari esa yuz ming yozuvga ega bo'lgan lug'at hajmi ushbu yuz mingtani aniq bilishi mumkin.
PROMT oilasining tizimlari tizimlar ishlay oladigan barcha tillar uchun deyarli noyob morfologik tavsifni ishlab chiqdi. Unda rus tili uchun 800 turdagi fleksiya, ham nemis, ham frantsuz tillari uchun 300 dan ortiq tur, hatto inflektiv tillarga kirmaydigan ingliz tili uchun 250 dan ortiq fleksiya turlari aniqlangan. Har bir til uchun bir nechta tugatishlar daraxt tuzilmalari sifatida saqlanadi, bu nafaqat samarali saqlash usulini, balki samarali morfologik tahlil algoritmini ham ta'minlaydi.
Bundan tashqari, foydalanilgan morfologik model foydalanuvchi - lug'at yaratuvchisi uchun ekspert tizimini ishlab chiqish imkonini berdi. Ushbu tizim aslida yangi lug'at yozuvlarini kiritishda o'zakni ajratib ko'rsatish va fleksiya turini aniqlash tartibini avtomatlashtiradi.
Mavjud mashina tarjimasi tizimlarining hech birida, hatto Power Translator (Globalink, AQSH), Language Assistant (MicroTac, AQSH), TRANSEND (Intergaph, AQSH) kabi keng tarqalgan tizimlarda ham bunday imkoniyat yoʻq, bunda foydalanuvchilar qoʻlda konjugatsiya qilishlari kerak. morfologik modelni belgilash uchun so'zlarni o'zgartiring.
Biroq, morfologiya tavsifining ishlab chiqilishi faqat matn birligi va lug'at birligini aniqlash uchun foydalaniladigan lug'at yozuvining sarlavhasi nima degan savolni hal qilish imkonini beradi. Biroq, lug'at yozuvi bilan matndan so'zni aniqlash identifikatsiya qilish uchun amalga oshirilmaydi, chunki imlo yoki elektron lug'atlarda talab qilinganidek, dastur haqiqiy tarjima protseduralarini bajarishi kerak. Lug'at yozuvida qanday ma'lumotlar kerak va dastur tarjima qilish uchun tarjima qoidalari qanday tasvirlangan bo'lishi kerak?
O'tmishdagi ko'plab MT tizimlarida (haqiqatdan ham, hozirgi kabi) lug'at tavsifi va algoritmlarning tavsifi bitta muammoning tomonlari sifatida ko'rib chiqilgan, ammo yechim, qoida tariqasida, ko'rib chiqilayotgan dunyoni cheklashda izlangan. grammatik yoki semantik. Masalan, “nutq bo`lagiga mansub” atributi asosida quyidagi turdagi grammatika tavsiflangan:
ot so`z birikmasi ot
ot so`z turkumi sifat + ot so`z birikmasidir
fe'l guruhi - fe'l + ot so'z birikmasi
gap - ot so'z birikmasi + fe'l so'z birikmasi
Tabiiy til jumlalarining qaysidir qismi shunday grammatika bilan tasvirlanganligi aniq, lekin bu qism juda ahamiyatsiz va uning asosida hech bo'lmaganda qandaydir real matnni to'g'ri tahlil qilish va tarjima qilish mumkin emas. Ammo boshqa tomondan, siz berilgan grammatika bo'yicha transformatorni qurishning samarali usullaridan foydalanishingiz mumkin yoki, eng yomoni, takrorlash orqali cheklangan jumlalar to'plami uchun qaramlik daraxtlarini quradigan dastur yozishingiz mumkin. Bunday tizimlar xuddi shunday "eksperimental" ta'rifini oldi.
Qanday bo'lmasin, lekin aynan shunday loyihalardan tarjima tizimlari paydo bo'ldi, ular endi oxirgi foydalanuvchiga taklif etiladi. Bular Power Translator (Globalink kompaniyasi) va Language Assistant (MicroTac kompaniyasi) va TRANSEND (Intergraph kompaniyasi).
STYLUS va PROMT oilalarining tizimlari bundan mustasno emas, chunki ko'pgina PROMT mutaxassislari ushbu turdagi loyihalarda tajribaga ega edilar. Biroq, PROMT tizimlarini ishlab chiqishda birinchi marta deyarli inqilobiy yondashuv qo'llanildi, bu ta'sirchan natijalarga erishish imkonini berdi. PROMT oilasining tarjima tizimlari lingvistik usullardan ko'ra kibernetik asosda tuzilgan tizimlardir.
Ma'lum bo'lishicha, tarjima tizimini vazifasi kirish grammatikasi nuqtai nazaridan ruxsat etilgan matnni tarjima qilishdan iborat bo'lgan tarjimon sifatida emas, balki o'zboshimchalik bilan natija olish vazifasi bo'lgan murakkab tizim sifatida ko'rib chiqish juda samarali. kiritilgan ma'lumotlar, shu jumladan tizim ishlayotgan grammatikaga to'g'ri kelmaydigan matnlar uchun.
Gapni tahlil qilish va sintez qilishning ketma-ket jarayonlarini taqsimlashni nazarda tutadigan qabul qilingan lingvistik yondashuv o'rniga tizim arxitekturasi tarjima jarayonini ierarxiyaga asoslangan "ob'ektga yo'naltirilgan" tashkilot bilan jarayon sifatida ko'rsatishga asoslangan edi. gapning qayta ishlangan komponentlari. Bu PROMT tizimlarini barqaror va ochiq qildi.
Bundan tashqari, bu yondashuv turli darajadagi tarjimani tasvirlash uchun turli xil rasmiyatchiliklardan foydalanishga imkon berdi. Tizimlarda kengaytirilgan o'tish tarmoqlariga o'xshash tarmoq grammatikalari va murakkab predikatlarni tahlil qilish uchun ramka tuzilmalarini to'ldirish va o'zgartirish uchun protsessual algoritmlar ishlaydi.
Hajmi bo‘yicha deyarli cheksiz va ko‘plab turli xususiyatlarni o‘z ichiga olishi mumkin bo‘lgan lug‘at yozuvidagi leksik birlikning tavsifi tizim algoritmlari tuzilishi bilan chambarchas bog‘liq bo‘lib, abadiy antitez sintaksisi – semantika asosida tuzilgan. matn komponentlarining darajalari asosida.
Shu bilan birga, tizimlar to'liq tavsiflanmagan lug'at yozuvlari bilan ishlashi mumkin, bu foydalanuvchi uchun lug'atlarni ochishda muhim nuqta bo'lib, undan lingvistik material bilan nozik ishlov berishni talab qilish mumkin emas.
1991 yilda PROMT tomonidan chiqarilgan birinchi mashina tarjimasi tizimi ixtisoslashtirilgan dasturiy matnlarni ingliz tilidan rus tiliga tarjima qildi. U kichik lug'atdan foydalangan - 17 mingga yaqin so'z va iboralar, DOS muhitida ishlagan va foydalanuvchi uchun moslashtirish vositalariga ega emas edi. Ammo bu birinchi tizim allaqachon to'g'ri tuzilgan va PROMT tomonidan qo'llaniladigan mashina tarjimasi algoritmlarini ishlab chiqishning hozirgi texnologiyasi sezilarli o'zgarishlarga duch kelmadi. Aksincha, topilgan yondashuv turli tillar uchun juda samarali bo'lib chiqdi.
Birinchidan, ba'zi ta'riflarni tushuntirib o'tamiz: amaliy tilshunoslik sohasi sifatida mashina tarjimasining rivojlanishi bilan birga tizimlarning tasniflari paydo bo'ldi va tarjima tizimlarini TRANSFER tipidagi tizimlarga va INTERLINGUA tipidagi tizimlarga bo'lish odat tusiga kirdi. Ushbu bo'linish lingvistik algoritmlar uchun arxitektura yechimlarining o'ziga xos xususiyatlariga asoslanadi.
TRANSFER tipidagi tizimlar uchun tarjima algoritmlari uchta jarayonning tarkibi sifatida qurilgan: kirish tilining tuzilmalari nuqtai nazaridan kiritilgan jumlani tahlil qilish, ushbu tuzilmani chiqish tilining o'xshash tuzilishiga aylantirish (TRANSFER) va keyin uni sintez qilish. hosil bo'lgan tuzilishga ko'ra gapni chiqaring.
INTERLINGUA tipidagi tizimlar umumiy holatda kirish va chiqish tillarining barcha tuzilmalarini tavsiflash uchun ishlatilishi mumkin bo'lgan ma'lum bir metatil (INTERLINGUA) mavjudligini apriori nazarda tutadi; shuning uchun INTERLINGUA kabi tizimda tarjima algoritmi oddiyroq deb hisoblanadi: kirish gapni metatil nuqtai nazaridan tahlil qilish va keyin chiqish tilining tegishli jumlasining metastrukturasidan sintez qilish. Bu holatda "yagona" qiyinchilik - bu metatilning o'zini rivojlantirish va tabiiy tilni tegishli atamalar bilan tavsiflash.
Ushbu tasnif mavjud bo'lishiga va mashina tarjimasini ishlab chiquvchilar muhitida PROMT tizimining qaysi turiga tegishli ekanligini so'rash yaxshi shakl deb hisoblanganiga qaramay, INTERLINGUA printsipiga asoslangan bitta haqiqiy tizim hali ishlab chiqilmagan.
PROMT tizimi bundan mustasno emas va biz bu savolga javob beramiz: bizning tizimimiz TRANSFER tipidagi tarjimani amalga oshiradi. Ammo bu juda oddiy javob, u PROMT tizimi arxitekturasining o'ziga xos xususiyatlarini amalda aks ettirmaydi. Xususiyatlari shundaki, bu usul (TRANSFER) lingvistik standart yondashuvga mos kelmaydigan tizimda qo'llaniladi.
Gap shundaki, tarjima tizimi, qoida tariqasida, to'liq tavsiflanmagan ma'lumotlar sharoitida ishlaydi, chunki til juda tez rivojlanadigan tirik tizimdir: doimiy ravishda yangi so'zlar paydo bo'ladi, eski so'zlarning yangi funktsiyalari va yangi ob'ektlar bilan birga, yangi qadriyatlar. Bunday sharoitda tarjima algoritmlarining aniqlovchi tuzilmaviy xossasi ularning ixtiyoriy kiritilgan ma’lumotlarga nisbatan qarshiligiga aylanadi va ketma-ket TRANSFER o‘rniga PROMT tizimida tarjimani amalga oshiradigan algoritmlar asosida ierarxik yondashuv o‘rnatilib, tarjima jarayonini o‘zaro bog‘langan TRANSFERlarga ajratadi. turli tahlil birliklari uchun.
Tizimda leksik birliklar darajasi, guruhlar darajasi, sodda gaplar va murakkab gaplar darajasi ajratiladi. Bu jarayonlarning barchasi matn birliklari ierarxiyasiga muvofiq ierarxik tarzda bog'lanadi va o'zaro ta'sir qiladi, sintezlangan va meros qilib olingan xususiyatlarni almashadi. Algoritmlarning bunday tuzilishi turli darajadagi algoritmlarni tavsiflash uchun turli xil rasmiy usullardan foydalanish imkonini beradi.
Leksik birliklar darajasini ko'rib chiqing: leksik birlik - eng quyi darajadagi birlik bo'lgan so'z yoki ibora. Ham kirish, ham chiqish tillarida soʻz oʻzak va oxirning birikmasi sifatida tasvirlanadi. Bu, bir tomondan, kiritilgan so'zlarni tanib olish va kirish morfologiyasini tahlil qilish, ikkinchi tomondan, chiqish so'zlarini ularning morfologik ma'lumotlari (asosiy, fleksiya turi va yakuniy manzillar qatoridagi tugatish manzili) asosida qulay sintez qilish imkonini beradi. bu tur). Shunday qilib, agar kirish morfologik ma'lumotni chiqish morfologik ma'lumotlariga aylantirish qoidalarini kiritadigan bo'lsak, TRANSFER morfologik darajada amalga oshiriladi.
Guruh darajasida murakkabroq tuzilmalar ko'rib chiqiladi: otlar, sifatlar, qo'shimchalar va murakkab fe'l shakllari guruhlari. Tahlil qilganda, rasmiy tarmoq grammatikalariga asoslangan bu daraja guruhlarni sintaktik birliklarga birlashtira oladi, ularning har biri sintezlangan tarkibiy ma'lumotlar va guruhning asosiy elementi bilan tavsiflanadi. To'g'ridan-to'g'ri komponentlar nuqtai nazaridan olingan kirish strukturasiga ko'ra, sintezlangan xususiyatlar bilan birgalikda guruh tahlili natijalariga ko'ra meros qilib olinishi mumkin bo'lgan morfologik xususiyatlar qiymatlari bilan leksik birliklar to'plami sifatida chiqish guruhi tuziladi. Shunday qilib, TRANSFER guruh darajasida amalga oshiriladi.
Sodda gaplarni sintaktik birliklardan tashkil topgan tuzilmalar sifatida tahlil qilish samarali transformatsiyalarni amalga oshirish imkonini beruvchi ramka predikat tuzilmalari asosida amalga oshiriladi. Fe'l oddiy jumlalar uchun asosiy element hisoblanadi va uning valentliklari mos keladigan ramkani to'ldirishni belgilaydi. Har bir turdagi ramkalar uchun chiqish ramkasiga aylanishning ma'lum qonuni va aktantlarning dizayni mavjud. Shunday qilib, TRANSFER jumla darajasida amalga oshiriladi. Murakkab jumlalarni tahlil qilish vaqtlarni muvofiqlashtirishni shakllantirish va birlashmalarni to'g'ri tarjima qilishda talab qilinadi.
2016 yil 21 avgust
1954-yilda bir necha xonalarni egallagan IBM 701 kompyuteri rus tilidan ingliz tiliga 60 ta iborani toʻgʻri tarjima qilish uchun yetarlicha 250 ta soʻz va bir necha oddiy qoidalarga ega edi. Ushbu yutuq (mashhur Jorjtaun tajribasi) ommaviy axborot vositalarida keng yoritildi va AQSh hukumati yorqin kelajakka - o'n yil ichida dushman matnlarini ingliz tiliga mashina tarjimasiga ishondi.
Biroq, bu sodir bo'lmadi. Va shuning uchun ...
Avval tarixga murojaat qilaylik.
Mashina tarjimasi tarixi 17-asrga borib taqaladi, oʻshanda Leybnits va Dekart kabi faylasuflar turli tillardagi soʻzlarni bogʻlovchi kod bor, degan faraz qilganlar. Barcha taxminlar faraz edi va hech kim tarjima mashinasini yaratishda muvaffaqiyatga erisha olmadi.
"Tarjima mashinasi" uchun birinchi patent arizalari 1930-yillarning o'rtalarida berilgan. Bitta ariza frantsuz ixtirochisi J. Artsruni tomonidan taqdim etilgan bo'lib, u oddiygina zarbli lentada avtomatik ikki tilli lug'at yaratgan. Yana biri sovet olimi Pyotr Troyanskiy tomonidan yaratilgan bo'lib, uning ixtirosi batafsilroq edi. U ikki tilli lug'at va esperanto tiliga asoslangan ikki til o'rtasidagi grammatik rollar bilan ishlash usullarini o'z ichiga oladi. Bu tizim uch bosqichdan iborat edi: birinchisi quyidagilardan iborat edi - muharrir, ona tilida so'zlashuvchi, manba til (FL) so'zlarini sintaktik vazifalariga muvofiq mantiqiy shakllarga bog'lashi kerak edi; ikkinchi bosqichda mashina ushbu shakllarning barchasini maqsadli tilga (TL) "tarjima qilishi" kerak edi; uchinchi bosqichda esa maqsadli tilda so'zlashuvchi natijani tahrir qildi. Uning sxemasi 50-yillarning oxirigacha, kompyuterlar paydo bo'lgunga qadar noma'lum bo'lib qoldi.
Kompyuterga asoslangan tarjima mashinalarining birinchi rejasi Rokfeller jamg'armasi tadqiqotchisi Uorren Uiver tomonidan 1949 yil iyul oyidagi eslatmasida taklif qilingan. Ushbu takliflar Ikkinchi Jahon urushi davrida kriptografiya va tabiiy tillarning universal tamoyillari g'oyasining tarqalishi munosabati bilan muvaffaqiyatli bo'lgan axborot nazariyasiga asoslangan edi.
Bir necha yil o'tgach, Amerika Qo'shma Shtatlaridagi barcha universitetlarda mashina tarjimasi bilan bog'liq tadqiqot faoliyati boshlandi. 1954 yil 7 yanvarda IBM Jorjtaun universiteti (AQSh) bilan birgalikda Nyu-Yorkda IBM shtab-kvartirasida yangi mashina tarjimasi tizimining birinchi namoyishini muvaffaqiyatli o'tkazdi. Namoyish natijalari bosma nashrlarda yoritildi va jamoatchilikda katta qiziqish uyg‘otdi. Tizimning o'zi bugungi standartlarga ko'ra o'yinchoqdan boshqa narsa emas edi, chunki u 250 so'zdan iborat lug'atdan foydalangan va kimyoviy moddalar bilan bog'liq oldindan tanlangan 49 ta jumlani rus tilidan ingliz tiliga tarjima qilgan. Biroq, namoyish mashina tarjimasining paydo bo'lishining muqarrarligi g'oyasining tarqalishini rag'batlantirdi, xususan, nafaqat AQSh, balki butun dunyo bo'ylab tadqiqot institutlariga moliyalashtirishni jalb qildi.
Dastlabki tizimlar chiqish so'zlarini to'g'ri tartibda joylashtirish uchun katta ikki tilli lug'atlardan va qo'lda dasturlashtirilgan qoidalardan foydalangan. Oxir oqibat, bu usul cheklangan deb tan olindi va til fanlari, masalan, generativ tilshunoslik yoki transformatsion grammatikaning rivojlanishi tarjima sifatini oshirishga qaratilgan edi.
Bu vaqt ichida operatsion tizimlar o'rnatildi. AQSh Harbiy havo kuchlari IBM va Vashington universiteti tomonidan ishlab chiqilgan dasturdan foydalangan bo'lsa, AQShning Atom energiyasi bo'yicha komissiyasi va Italiyadagi Evratom Jorjtaun universiteti tomonidan ishlab chiqilgan tizimdan foydalangan. Chiqarilgan mahsulot sifati past bo'lsa-da, tarjima tezligining oshishi tufayli tizim iste'molchilar orasida mashhur edi.
Keling, Jorjtaun tajribasiga qaytaylik. Albatta, ilmiy eksperimentdan tashqari, ko‘rgazmali eksperimentning siyosiy tomoni ham bor edi. 1949 yilda Sovet atom bombasining sinovi va 1957 yilda sun'iy yo'ldoshning uchirilishi AQShga SSSR ilmiy poygada yo'l berish niyatida emasligini ko'rsatdi. Bundan tashqari, Temir parda ortida nima sodir bo'layotganini tushunish uchun ko'plab ochiq va maxfiy hujjatlarni ingliz tiliga tezda tarjima qilish zarar qilmaydi. Mashina tarjimasi loyihasi sovet ilmiy nashrlarini o'qishni istagan amerikalik olimlar, fuqarolik va harbiylar va razvedka xodimlarining manfaatlari chorrahasida paydo bo'ldi. Loyiha mualliflari “ilmiy rus tili” o‘zining sodda iboralari va tushunarli lug‘ati bilan kompyuterlarga shunday murakkab, o‘zgaruvchan oddiy rus tilini o‘zlashtirish imkonini beradi, deb umid qilishgan.
Ruslar yozadi!
1948 yilga kelib ilmiy adabiyotlarning 33 foizi rus tilida nashr etilgan. "Teutonic" fanining oltin yillarida nemis tili 40 foizni tashkil etdi. Xususan, agar 1913 yilda rus tilidagi matnlar Kimyoviy Abstraktlar xizmati tomonidan ro'yxatga olingan nashrlarning 2,5 foizini tashkil qilgan bo'lsa, 1958 yilda - 17 foiz, nemis (10 foiz) va frantsuz tilini (5 foiz) sezilarli darajada chetlab o'tgan. 1944 yilda nashr muharriri o'quvchilarni rus tilini o'rganish zarurligi haqida ogohlantirgan.
19-asr oxirida amerikalik olimlar va muhandislar nemis tilini o'qishni o'rgandilar. Ammo atigi besh yillik urushdan keyin nemis chekka hududlarga borib, sirli kirill yozuvlarini o'zlashtirishi kerak deb kim o'ylabdi! 1953-yilda so‘rovda qatnashgan 400 ming nafar olim va muhandislardan faqat 400 nafari rus tilini ravon o‘qiy olgan.
Rus tilidagi iborali perfokartalardan biri
Stalin siyosati tufayli vaziyat yanada murakkablashdi. "G'arbning xizmatkorligi" va ma'lumotlarning tarqalishiga qarshi kurashib, 1947 yilda SSSRda xorijiy tillardagi barcha ilmiy jurnallar yopildi (SSSR Fanlar Akademiyasining Comptes rendus, Acta Physicochimica va SSSR Fizika jurnali) . Bundan tashqari, ular jurnal mazmuni va maqolalarning qisqacha mazmunini xorijiy tillarda nashr etishni to'xtatdilar - endi rus tilini bilmagan G'arb olimlari yangi nashrlar nima haqida ekanligini tushuna olmadilar.
1940-yillarning oxiridan beri va ayniqsa Sovet sun'iy yo'ldoshi uchirilgandan so'ng, AQSh Kongressi rus tilini o'qitish uchun o'n millionlab dollar ajratdi. Vazifani soddalashtirish uchun tadqiqotchilarning o'zlari Pushkin va Dostoevskiyning tushunarsiz tilidan uzoqda bo'lgan "ilmiy" yoki "texnik" rus tili tushunchasini ilgari surdilar. Xalqaro lug'at, ko'plab formulalar, oddiy grammatika o'rganishni iloji boricha osonlashtirishi kerak edi. Ammo rus tilini o'zlashtirishda katta muvaffaqiyat bo'lmadi. Aynan shu erda amerikaliklar eng yangi texnologiyalar - kompyuterlarga e'tibor qaratdilar.
Mashinalar qutqarish uchun!
Mashina tarjimasining kashshofi, paradoksal ravishda, strukturaviy tilshunoslikdan ham, hisoblashdan ham uzoqda bo'lgan shaxs - general Eyzenxauerning shaxsiy tarjimoni Leon Dostert edi. U 1904 yilda Frantsiyada tug'ilgan. Birinchi jahon urushi paytida, nemis istilosi yillarida Leon tezda nemis tilini o'rgandi va tarjimon sifatida ishga qabul qilindi. Uning tug‘ilgan shahri Longvi amerikaliklar tomonidan bosib olinganida ham xuddi shunday bo‘ldi: yosh tarjimonning iste’dodini baholab, ofitserlar uning AQShda o‘qishi uchun pul to‘lashdi. 1939 yilda u allaqachon Jorjtaun universitetida frantsuz tili professori edi. 1940 yilda Frantsiya mag'lubiyatga uchragach, Doster Amerika fuqaroligini qabul qildi va Eyzenxauerning shtab-kvartirasida urushdan o'tib, polkovnik darajasiga ko'tarildi.
1945 yilda Doster Nyurnbergdagi Xalqaro Harbiy Tribunalda simxron tarjimani ixtiro qildi - chunki ketma-ket tarjima allaqachon ishlab chiqilgan jarayonni qabul qilib bo'lmaydigan darajada uzaytiradi. U “akvarium”dagi tarjimonlarni yopish va jarayon ishtirokchilarining har biriga alohida-alohida, naushniklar orqali nutqlarni efirga uzatish g‘oyasini o‘ylab topdi. Barcha jihozlarni Dosterning do‘sti, IBM kompaniyasining bo‘lajak prezidenti Tomas Uotson bepul taqdim etdi. BMTda shunga o'xshash tizimni tashkil qilgan Doster universitetga yangi Tillar va tilshunoslik institutining prezidenti sifatida qaytdi.
Ajablanarlisi shundaki, ikki jahon urushi taqdiri tubdan o'zgargan bu poliglot uchinchi urushning oldini olishni xohladi. 1951 yilda AQSh zirhli kuchlari jurnali ARMOR sahifalarida gapirgan Doster NATO blokining jangovar samaradorligiga shubha bilan qaradi - aynan ishtirokchi mamlakatlarning ko'p tilli askarlari bir-birini tushuna olmagani uchun.
Leon Doster
Najot kutilmagan tomondan keldi. Urush yillarida ham IBM perfokarta hisoblash mashinalari nafaqat qobiqlarning traektoriyalarini hisoblash va logistika muammolarini hal qilish uchun, balki kriptografiyada ham ishlatilgan. Bu Rokfeller jamg'armasidan Uorren Uiverni mashina tarjimasi g'oyasiga olib keldi. 1947 yilda u kibernetikaning otasi Norbert Vinerga maktub yozadi: “Tarjima muammosini kriptografiya muammosi sifatida hal qilish mumkin. Rus tilidagi maqolani ko'rganimda, o'zimga shunday deyman: "Aslida, u ingliz tilida yozilgan, lekin men dekodlaydigan g'alati belgilar bilan shifrlangan." Bir necha tilda so'zlashuvchi Viner loyihani mag'lub etdi va hali ham hal etilmagan muammoga ishora qildi - tabiiy tillardagi so'zlar, raqamlardan farqli o'laroq, mexanik tarzda tarjima qilish uchun juda ko'p noaniq va noaniq ma'nolarga ega.
Ammo Uiver o'z g'oyalarini ilgari surishda davom etishi uchun Jamg'armadan etarli mablag' oldi. 1952 yilda u mashina tarjimasi bo'yicha birinchi konferentsiyaga homiylik qildi, unda ushbu loyihaning asosiy texnik va falsafiy masalalari taqdim etildi. Doster ham simpoziumda ishtirok etdi - va tezda tushundiki, mashina tarjimasi muvaffaqiyati uchun fundamental muammolar haqida bahslashmaslik kerak, balki bu ishning maqsadga muvofiqligini hamma uchun isbotlaydigan qurilma qurish kerak.
Doster mashinasi oltita asosiy operatsiyaga ("qoidalar") tayangan va shuning uchun jumlalarni faqat ular qo'llanilgan joyda tarjima qilishi mumkin edi. Leksikaning 250 ta so'zining har biri ikkilik qarorlar daraxtini belgilaydigan ikkita raqam bilan kodlangan. Kompyuter to'g'ridan-to'g'ri va bilvosita so'z tartibini, shuningdek ikkita lug'at ma'nosidan birini tanladi. Barcha cheklangan mablag'lar bilan natijalar ta'sirli bo'ldi: lotin tilidagi ruscha iboralar mashinaga (perfokartalarda) urildi va taxminan o'n daqiqadan so'ng natija berildi:
KRAXMAL VIRABATIVAYETSYA MYEKHANYICHYESKYIM PUTYEM YIZ KARTOFYELYA
Kraxmal kartoshkadan mexanik usullar bilan ishlab chiqariladi
VYELYICHYINA UGLYA OPRYEDYELYAYETSYA OTNOSHYENYIYEM DLYINI DUGI K RADYIUSU
Burchakning kattaligi yoy uzunligining radiusga nisbati bilan aniqlanadi
MI PYERYEDAYEM MISLYI POSRYEDSTVOM RYECHYI
Biz fikrlarni nutq orqali uzatamiz
Nima uchun Markaziy razvedka boshqarmasi pullari xavfli
1954 yilgi namoyishning shov-shuvli muvaffaqiyati Dosterning loyihalarini dengiz floti, Markaziy razvedka boshqarmasi va shunga o'xshash boshqa idoralar e'tiboriga havola etdi. Ammo xavfsizlik kuchlari ishdan chiqishga shoshilmadi. Bu erda SSSR tomonidan kutilmagan yordam ko'rsatildi. Sovet kibernetikasining otasi Aleksey Lyapunov Jorjtaun tajribasi haqidagi maqolaga e'tibor qaratdi va tez orada matematika institutida tadqiqot guruhini tuzdi. Undan keyin Aniq matematika va kompyuter fanlari institutidan Dmitriy Panov keldi va 1958 yilga kelib 79 ta turli muassasalar allaqachon mashina tarjimasi bilan shug'ullangan.
Doster va uning hamkasblari "SSSRga yetib olish" zarurligini ta'kidlab, nihoyat saxiy mablag' oldilar - yiliga yuz ming dollar. Bu ishga Dosterning eski frontdagi do‘sti Allen Dallesning 1956 yilda Markaziy razvedka boshqarmasini egallab olgani ham yordam berdi. Bo'limda SSSR haqidagi ma'lumotlarni qayta ishlash uchun rus tilida so'zlashuvchi tahlilchilar yo'q edi va Doster Dallesni tez orada uning mashinalari yordamga kelishiga ishontirdi. 1956 yildan 1958 yilgacha Jorjtaun guruhi Markaziy razvedka boshqarmasidan taxminan bir million uch yuz ming dollar (2016 yil kursi bo'yicha 10 million) olgan. Yadro fiziklaridan tashqari o'sha davrdagi biron bir ilmiy jamoa bunday miqdorni orzu qila olmas edi. Organik kimyoning sakkiz mingga yaqin atamalari perfokartalardagi kodlarga tarjima qilingan. Doster Sovet yadroviy hujjatlarini tarjima qilish bo'yicha shartnoma ham imzoladi.
Doster va Uotson (o'ngda) Jorjtaun tajribasi paytida
Biroq, 1960-yillarning o'rtalariga kelib, bulutlar loyiha ustida to'plana boshladi. Mamlakatdagi birinchi mashina tarjimasi mutaxassisi faylasuf Yehoshua Bar-Hillel kelajakda ham buning iloji yo‘q degan xulosaga keldi. Mashhur Bar-Hillel misoliga ko'ra, kompyuter qalamdagi quti va qalam qutidagi iboralari o'rtasidagi farqni tushunmaydi - faqat odam intuitiv ravishda qalam qachon "o'yinchoq" degan ma'noni anglatadi va qachon - " tutqich".
1963 yilda Doster avtomatik tarjima masalasi bo'yicha maxsus tinglovlar o'tkazgan kongressmenlarning hujumlarini to'xtatishga muvaffaq bo'ldi. Ammo 1964 yilda Amerika Qo'shma Shtatlari Milliy Fanlar Akademiyasining Amaliy tilshunoslik qo'mitasi "hech qanday taraqqiyot yo'q" deb ta'kidladi - rus tilidan ingliz tiliga moslashtirilmagan haqiqiy maqolalarning mashina tarjimasi yo'q. Markaziy razvedka boshqarmasi ham moliyalashni qisqartirdi (tushuntirishsiz).
Mashinalar - nafaqaga chiqqan
Aslida, loyihaning qabrini qazilgan Jorjtaun tajribasining ajoyib muvaffaqiyati edi. Birinchi iboralar juda yaxshi edi va murakkabroq matnlarning tarjimalari qo'shimcha tahrirsiz noto'g'ri, qo'pol yoki umuman tushunarsiz bo'lib chiqdi.
Gordinning so'zlariga ko'ra, Dosterning halokatli xatosi mashina tarjimasi iste'molchilariga e'tibor bermaganligi edi. U faqat davlat idoralariga e'tibor qaratdi, ular istalgan vaqtda moliyalashtirishni to'xtatishi mumkin (ular buni qilishdi).
Biroq, "Sovet ilm-fan sirlari" muammosi shunga qaramay, Qo'shma Shtatlarda va juda iqtisodiy tarzda hal qilindi. Xususiy nashriyotlar bir qator jurnallarni (masalan, SSSR umumiy kimyo jurnali) yaratdilar, ularda sovet jurnallaridan maqolalar hamma joyda tarjima qilindi. Avvaliga ushbu nashrlar rus tilini o'rganishni istamagan amerikaliklar orasida minnatdor auditoriyani topdi, biroq bir necha yil o'tgach, tirajning asosiy ulushi chet ellik mutaxassislarga to'g'ri keldi. Frantsiya, Yaponiya, Hindiston yoki Braziliyadan kelgan olimlar SSSRda nima o'rganilayotgani va ixtiro qilinayotganini bilishni xohlab, rus tilini o'rganmagan, balki Amerika mavhum jurnallarini sotib olgan. Shunday qilib, sovet fan va texnikasining inqilobiy taraqqiyoti ingliz tilini olimlarning monopol xalqaro tiliga aylantirishga yordam berdi.
Hisobotning nashr etilishi Amerika Qo'shma Shtatlarida va SSSR va Buyuk Britaniyada kamroq darajada mashina tarjimasi bo'yicha tadqiqotlarga ko'proq ta'sir ko'rsatdi. Qo'shma Shtatlarda, hech bo'lmaganda, bunday tadqiqotlar o'n yil davomida to'xtatilgan. Tadqiqotlar Kanada, Fransiya va Germaniyada davom etdi. AQShda Systran kompaniyalarining asoschilari (Piter Toma) asosiy istisnolar edi.
60-yillarda alohida til juftliklari va kiritishga urgʻu berilgan boʻlsa, 70-yillardagi talab bir qator texnik va tijorat matnlarini tarjima qilishga qodir tizimlarning arzonligi edi. Talab globallashuvning kuchayishi va Kanada, Evropa va Yaponiyada tarjimaga bo'lgan talab tufayli kuchaygan.
80-yillar 90-yillarning boshi
1980-yillarga kelib, mashina tarjimasi dasturlarining xilma-xilligi va soni ortdi. Metal kabi meynfreym texnologiyasiga asoslangan tarjima tizimlari ishlatilgan.
Mikrokompyuterlar mavjudligining ortib borishi natijasida arzon mashina tarjima dasturlari bozori paydo bo'ldi. Evropa, Yaponiya va AQShning ko'plab kompaniyalari bu imkoniyatdan foydalanishdi. Tizimlar Xitoy, Sharqiy Yevropa, Koreya va SSSR bozorlariga chiqarildi.
1980-yillarda Yaponiyada mashina tarjimasi haqida juda ko'p shov-shuvlar bo'lgan. Beshinchi avlod kompyuterlarining paydo bo'lishi bilan Yaponiya texnologiya va dasturlash sohasida hamma narsadan ustun turishni rejalashtirgan edi, ingliz tilidan tarjima qilish uchun dasturlarni yaratish bilan bog'liq loyiha ko'plab kompaniyalarning (Fujitsu, Toshiba, NTT, Brother) qiziqishini uyg'otdi. , Catena, Matsushita, Mitsubishi, Sharp, Sanyo , Hitachi, NEC, Panasonic, Kodensha, Nova, Oki).
1980-yillardagi tadqiqotlar morfologik, sintaktik va semantik tahlil yordamida lingvistik birliklarni tarjima qilishga asoslangan.
Rossiyada amaliy qo'llanilgan birinchi tijorat mashina tarjimasi mahsulotlari 1980-yillarning o'rtalarida paydo bo'lgan. Ular shaxsiy kompyuterlarda amalga oshirilgan va to'g'ridan-to'g'ri tarjima tizimlari bo'lib, ularning imkoniyatlari matnlarni tahlil qilish va sintez qilish qobiliyatiga emas, balki ulkan (birinchi tizimlarga nisbatan) lug'atlarga asoslangan edi.
Zamonaviy tijorat mashina tarjimasi mahsulotlari mahalliy firmalar tomonidan taklif etiladi:
- Vista Technologies va Adventis, 1991 yilda VINITIdan ajratilgan ishlab chiquvchilar jamoasi tomonidan tashkil etilgan;
- PROMT, 1991 yilda tuzilgan;
- "Media Lingua".
Masalan, Retrans Vista lug'atlarida millionlab tushunchalar saqlanadi, ular nafaqat an'anaviy barqaror frazeologik iboralarni, balki, birinchi navbatda, kundalik nutqda ishlatiladigan iboralarni o'z ichiga oladi. Bundan tashqari, matndan avtomatik ravishda yangi iboralarni ajratib oladigan va ularni lug'atga kiritadigan kontseptual tahlil dasturi mavjud. Retrans Vista tizimining asosiy lug'atlarida tabiiy fanlar, muhandislik, iqtisod, biznes va siyosat sohasidagi atamalar va frazeologik birliklar mavjud. Politematik mashina lug'atining hajmi taxminan 3,4 million so'z (rus-ingliz qismida 1,8 million, ingliz-rus qismida 1,6 million) va ularning 20 foizi so'zlar, 80 foizi esa o'rtacha barqaror iboralardir. uzunligi" 2,2 so'zdan iborat.
1980-yillarning oxirlarida mashina tarjimasida qoʻllaniladigan usullarning koʻpayishi kuzatildi. IBM tomonidan ishlab chiqilgan tizim statistik usulga asoslangan edi. Boshqa guruhlar ko'p sonli tarjima misollariga asoslangan usullardan foydalanganlar, bu usul misolga asoslangan mashina tarjimasi deb ataladi. Ikkala yondashuvning ham belgilovchi xususiyati semantik va sintaktik qoidalarning yo'qligi va matn korpuslari bilan manipulyatsiyaga tayanishi edi.
90-yillarda nutqni aniqlash va sintez qilish dasturlari muvaffaqiyatidan so'ng va Verbmobilning rivojlanishi bilan nutq tarjimasi rivojlanishi boshlandi.
Byudjet va yanada kuchli kompyuterlarning paydo bo'lishi natijasida mashina tarjimasi dasturlariga talab ortdi. 90-yillarning boshlarida tarjima katta hajmli kompyuterlar tomonidan emas, balki shaxsiy kompyuterlar va displey terminallari tomonidan amalga oshirila boshlandi. O'sha paytda shaxsiy kompyuterlar bozorini boshqargan kompaniyalardan biri Systran edi.
So'nggi tadqiqotlar
Mashina tarjimasi so'nggi bir necha yil ichida sezilarli o'zgarishlarga duch keldi. Hozirgi vaqtda tarjima misollari asosida statistik mashina tarjimasi va mashina tarjimasi sohasida katta hajmdagi tadqiqotlar olib borilmoqda. Bugungi kunda kam sonli kompaniyalar statistik mashina tarjimasidan tijoriy maqsadlarda foydalanadi, masalan, Microsoft (bu ma'lumotlar bazasi maqolalarini tarjima qilish uchun o'zining xususiy MT statistik dasturidan foydalanadi). Gibridizatsiyaga qiziqish yangilandi, tadqiqotchilar statistik tizimlardagi sintaktik va morfologik (ya'ni lingvistik) bilimlarni oldindan mavjud qoidalar bilan birlashtiradi.
manbalar
8-ma'ruza Mavzu: Mashina tarjima tizimlarining maqsadi.
Mashina tarjimasining maqsadi
Mashina tarjimasi (MT) yoki avtomatik tarjima (AM) - bu ilmiy tadqiqotlar, eksperimental ishlanmalar va allaqachon ishlaydigan tizimlarning (SMP) jadal rivojlanayotgan sohasi bo'lib, unda kompyuterlar bitta tabiiy tildan (NL) tarjima qilish jarayonida ishtirok etadilar. ) boshqasiga. NSRlar xorijiy tildagi ma'lumotlarga tez va tizimli kirishni ochib beradi, asosan ilmiy va texnik matnlarning katta oqimlarini tarjima qilishda samaradorlik va bir xillikni ta'minlaydi. Sanoat miqyosidagi KO'B yirik terminologik ma'lumotlar banklariga tayanadi va qoida tariqasida, shaxsni oldindan, inter- yoki post-muharrir sifatida jalb qilishni talab qiladi. Zamonaviy SMPlar, ayniqsa tarjima qilishda ma'lum bir mavzu sohasidagi bilim bazalariga tayanadiganlar sun'iy intellekt (AI) tizimlari sifatida tasniflanadi.
MC dan foydalanishning asosiy yo'nalishlari
1. Chet tilidagi manbalarning katta massivi yoki doimiy oqimi mavjudligida sanoat axborot xizmatlarida. Agar MPS signalizatsiya ma'lumotlarini berish uchun ishlatilsa, keyingi tahrirlash talab qilinmaydi.
2. Ko'p tilli politematik hujjatlar to'plami bilan shug'ullanadigan yirik xalqaro tashkilotlarda. Bular Bryusseldagi Evropa hamjamiyatlari komissiyasida ishlash shartlari bo'lib, u erda barcha hujjatlar bir vaqtning o'zida to'qqiz ishchi tilda paydo bo'lishi kerak. Bu yerda tarjima talablari yuqori bo‘lgani uchun MT post-tahrirga muhtoj.
3. Eksport qilinadigan mahsulotlarga hamrohlik qiluvchi texnik hujjatlarni tarjima qilish xizmatlarida. Tarjimonlar talab qilinadigan vaqt oralig'ida keng qamrovli hujjatlarni bajara olmaydilar (masalan, samolyotlar va boshqa murakkab ob'ektlar uchun spetsifikatsiyalar 10 000 va undan ortiq sahifani olishi mumkin). Texnik hujjatlarning tuzilishi va tili juda standartdir, bu MTni osonlashtiradi va hatto uni qo'lda tarjima qilishni afzal ko'radi, chunki u yagona uslubni kafolatlaydi.
butun massiv. Spetsifikatsiyalarning tarjimasi to'liq va aniq bo'lishi kerakligi sababli, MT ishlab chiqarish keyingi tahrirga muhtoj.
4. Bir xil turdagi xabarlarning doimiy oqimini sinxron yoki deyarli bir vaqtda tarjima qilish uchun. Bu Kanadadagi ob-havo hisobotlari oqimi bo'lib, ular bir vaqtning o'zida ingliz va frantsuz tillarida paydo bo'lishi kerak.
Biznes olamining kichik va o'rta biznesga bo'lgan amaliy ehtiyojidan tashqari, MTni rivojlantirish uchun sof ilmiy rag'batlar ham mavjud: barqaror ishlaydigan eksperimental MT tizimlari umumiy tushunish nazariyasi, og'zaki muloqot, ma'lumotni o'zgartirishning turli jihatlarini sinab ko'rish uchun eksperimental maydondir. , shuningdek, MTning yangi, yanada samarali modellarini yaratish uchun. ...
Rivojlanish miqyosi va darajasi nuqtai nazaridan NSRni uchta asosiy sinfga bo'lish mumkin: sanoat, rivojlanayotgan va eksperimental.
Mashina tarjimasi tizimlari uchun lingvistik yordam
MT jarayoni - bu kirish matniga qo'llaniladigan va uni chiqish tilidagi matnga aylantiruvchi o'zgartirishlar ketma-ketligi bo'lib, u ma'noni va, qoida tariqasida, dastlabki matnning tuzilishini maksimal darajada qayta yaratishi kerak, lekin chiqish orqali allaqachon. til. NSRning lingvistik ta'minoti bunday transformatsiyada qo'llaniladigan lingvistik, metallingvistik va "ekstralingvistik" bilimlarning butun majmuasini o'z ichiga oladi.
Alohida jumlalar uchun bilvosita tarjimani amalga oshiradigan klassik SMPlarda (iborama-iborali tarjima) har bir jumla uch qismdan (bosqichdan) iborat transformatsiyalar ketma-ketligidan o'tadi: tahlil -> o'tkazish (tillararo operatsiyalar) -> sintez. O'z navbatida, ushbu bosqichlarning har biri oraliq transformatsiyalarning ancha murakkab tizimidir.
Tahlil bosqichining maqsadi - kirish gapning tarkibiy tavsifini (oraliq ifodalash, ichki ifodalash), | O'tkazish bosqichining vazifasi (tarjimaning o'zi) kirish gapning tuzilishini chiqish gapning ichki tuzilishiga aylantirishdir. Bu bosqich kirish tilidagi leksemalarni ularning tarjima qilingan ekvivalentlari bilan almashtirishni ham oʻz ichiga oladi (leksik tillararo transformatsiyalar). Sintez bosqichining maqsadi tahlil natijasida olingan struktura asosida chiqish tilining to'g'ri gapini qurishdir.
Standart zamonaviy EMSning lingvistik yordami quyidagilarni o'z ichiga oladi:
1) lug'atlar;
2) grammatika;
3) transformatsiyaning turli bosqichlarida tahlil birliklarining rasmiylashtirilgan oraliq tasvirlari.
Standartlarga qo'shimcha ravishda, ba'zi NSRlar ba'zi nostandart komponentlarni o'z ichiga olishi mumkin. Masalan, dasturiy ta'minot ekspertizasi lug'atlar va grammatikalardan ko'ra maxsus kontseptual tarmoqlar yordamida aniqlanishi mumkin.
Mavjud lug'atlar, grammatika va tizimli ko'rinishlar bilan ishlash mexanizmlari (algoritmlar, protseduralar) SMPning matematik va algoritmik ta'minoti deb ataladi.
Zamonaviy SMP uchun zarur talablardan biri yuqori modullikdir. Lingvistik jihatdan mazmunli nuqtai nazardan, bu tahlil va undan keyingi jarayonlar lingvistik darajalar nazariyasini hisobga olgan holda qurilganligini anglatadi. MPS yaratish amaliyotida quyidagi tahlil darajalari ajratiladi:
Pre-sintaktik tahlil (u morfologik tahlilni o'z ichiga oladi - MorphAn, burilishlar tahlili, noma'lum matn elementlari va boshqalar);
SinAnning sintaktik tahlili (gapning sintaktik ifodasini yoki SynPni yaratadi); uning ichida har xil turdagi sintaktik birliklarni tahlil qilishni ta'minlovchi bir qator pastki darajalarni ajratish mumkin;
Semantik tahlil SemAn yoki mantiqiy-semantik tahlil (bayonotlarning argument-predikat tuzilishini yoki boshqa turdagi semantikani yaratadi.
taklif va matnni taqdim etish);
Kontseptual tahlil (dasturiy ta'minot semantikasini aks ettiruvchi kontseptual tuzilmalar nuqtai nazaridan tahlil qilish). Ushbu tahlil darajasi juda cheklangan dasturiy ta'minotga qaratilgan KO'Blarda qo'llaniladi. Aslida, kontseptual tuzilma dasturiy ta'minot sxemalarining lingvistik tuzilmalarga proektsiyasidir, ko'pincha hatto semantik emas, balki sintaktikdir. Faqat juda tor dasturiy ta'minot va matnlarning cheklangan sinflari uchun kontseptual tuzilma semantik bilan mos keladi; umumiy holatda, to'liq mos kelmasligi kerak, chunki matn har qandayidan ko'ra batafsilroq
kontseptual diagrammalar.
Sintez nazariy jihatdan tahlil bilan bir xil darajalardan o'tadi, lekin teskari yo'nalishda. Ishchi tizimlarda odatda faqat SINP dan chiqish jumlasining so'z zanjirigacha bo'lgan yo'l amalga oshiriladi.
Turli darajalarning lingvistik tabaqalanishi tegishli tavsiflarda qo‘llaniladigan rasmiy vositalarni farqlashda ham namoyon bo‘lishi mumkin (bu vositalar to‘plami har bir daraja uchun alohida ko‘rsatilgan). Amalda MorphAn lingvistik vositalari ko'pincha alohida belgilanadi va SinAn va SeMan vositalari birlashtiriladi. Ammo darajalarni chegaralash faqat ularning tavsiflarida barcha ajratilgan darajadagi ma'lumotlarni taqdim etish uchun mos keladigan yagona rasmiyatchilikdan foydalanganda mazmunli bo'lib qolishi mumkin.
Texnik nuqtai nazardan, lingvistik ta'minotning modulligi deganda iboralar va matnlarning (matn haqidagi joriy, vaqtinchalik bilim sifatida) tizimli ko'rinishini tilning "doimiy" bilimidan, shuningdek, til bilimini dasturiy ta'minot bilimidan ajratish tushuniladi; lug'atlarni grammatikadan, grammatikadan - ularni qayta ishlash algoritmlaridan, algoritmlarni "dasturlardan ajratish. Tizimning turli modullarining (lug'atlar-grammatikalar, grammatika-algoritmlar, algoritmlar-dasturlar, deklarativ-protsessual bilimlar va boshqalar) o'ziga xos nisbatlari, shu jumladan lingvistik ma'lumotlarni darajalar bo'yicha taqsimlash, SMPning o'ziga xos xususiyatlarini belgilaydigan asosiy narsadir. .
Lug'atlar. Tahlil lug'atlari odatda bir tilli bo'ladi. Ularda berilgan leksik birlikni (LU) tuzilmaviy tasvirga kiritish uchun zarur bo'lgan barcha ma'lumotlar bo'lishi kerak. Asosiy lug'atlar (morfologik va sintaktik ma'lumotlarga ega: nutqning bir qismi, fleksiya turi, LU ning sintaktik xatti-harakatini tavsiflovchi pastki sinf va boshqalar) va semantik va kontseptual ma'lumotlarni o'z ichiga olgan lug'at lug'atlari ko'pincha ajratiladi: semantik LU, semantik umidlar (valentliklar) , ularni iborada amalga oshirish shartlari va boshqalar.
Ko'pgina tizimlar umumiy va terminologik lug'atlarni ajratib turadi. Bunday bo'linish boshqa mavzu bo'yicha matnlarga o'tishda faqat terminologik lug'atlarni o'zgartirish bilan cheklanish imkonini beradi. Murakkab LU lug'atlari (burilishlar, konstruktsiyalar) odatda alohida massivni tashkil qiladi, ulardagi lug'at ma'lumotlari tahlilda bunday birlikni "yig'ish" usulini ko'rsatadi. Lug'at ma'lumotlarining bir qismi protsessual shaklda ko'rsatilishi mumkin, masalan, tegishli turdagi noaniqlikni hal qilish algoritmlarini polisemantik so'zlar bilan solishtirish mumkin. MT maqsadlari uchun lug'at ma'lumotlarini tashkil etishning yangi turlari "leksik bilimlar bazasi" deb ataladigan narsalarni taklif qiladi. So‘z haqida turli xil ma’lumotlarning mavjudligi (so‘zning leksik olami deb ataladi) bunday lug‘atni an’anaviy lingvistik lug‘atlarga emas, balki ensiklopediyaga yaqinlashtiradi.
Grammatikalar va algoritmlar. Grammatika va lug'at lingvistik ma'lumotlarning asosiy qismini tashkil etuvchi lingvistik modelni belgilaydi. Ularni qayta ishlash algoritmlari, ya'ni matn birliklari bilan o'zaro bog'liqlik tizimning matematik va algoritmik ta'minotiga kiradi.
Grammatika va algoritmlarni ajratish amaliy ma'noda muhim ahamiyatga ega, chunki u grammatika bilan ishlaydigan algoritmlarni (va shunga mos ravishda dasturlarni) o'zgartirmasdan grammatika qoidalarini o'zgartirishga imkon beradi. Ammo bunday bo'linish har doim ham mumkin emas. Shunday qilib, grammatikaning protsessual topshirig'iga ega bo'lgan tizim uchun va undan ham ko'proq lug'at ma'lumotlarining protsessual ifodasi bilan bunday bo'linish ahamiyatsiz. Qaror qabul qilish algoritmlari etarli bo'lmagan (to'liq bo'lmagan kiritilgan ma'lumotlar) yoki ortiqcha (tahlilning xilma-xilligi) ma'lumotlari ko'proq empirikdir, ularni shakllantirish lingvistik sezgini talab qiladi. Turli grammatikalarni chaqirish tartibini nazorat qiluvchi umumiy boshqaruv algoritmining spetsifikatsiyasi (agar ular bir tizimda bir nechta bo'lsa) ham lingvistik asoslashni talab qiladi. Shunga qaramay, hozirgi tendentsiya grammatikani algoritmlardan ajratishdan iborat bo'lib, barcha lingvistik ma'noli ma'lumotlar grammatikalarning statik ko'rinishida beriladi va algoritmlar shu qadar mavhumki, ular turli lingvistik modellarni chaqirishlari va qayta ishlashlari mumkin.
Grammatikalar va algoritmlarni ajratish eng aniq kontekstsiz grammatikalar (CGG) bilan ishlaydigan tizimlarda kuzatiladi, bu erda til modeli cheklangan sonli holatlarga ega grammatika bo'lib, algoritm ixtiyoriy jumla uchun xulosa daraxtini ta'minlashi kerak. grammatika qoidalariga muvofiq va agar bir nechta shunday xulosalar bo'lsa, ularni sanab o'ting. Formal (matematik ma'noda) tizim bo'lgan bunday algoritm analizator deb ataladi. Grammatikaning tavsifi tahlil qilinayotgan kirish bilan bir xil ko'p qirrali xususiyatga ega bo'lgan analizator uchun xizmat qiladi. Parserlar grammatika darslari uchun qurilgan, ammo grammatikaning o'ziga xos xususiyatlarini hisobga olgan holda tahlil qilish samaradorligini oshirish mumkin.
Sintaktik grammatika tilshunoslik nuqtai nazaridan ham, formalizm bilan ta'minlanishi nuqtai nazaridan ham eng rivojlangan qismdir.
Grammatikaning asosiy turlari va ularni amalga oshiradigan algoritmlar:
Zanjirli grammatika elementlarning tartibini, ya'ni gapning chiziqli tuzilmalarini sozlarning grammatik sinflari (maqola + ot + bosh gap) yoki vazifaviy elementlar (predmet + predlog) bo'yicha aniqlab beradi;
Tarkibiy qismlar grammatikasi (yoki bevosita tarkibiy qismlarning grammatikasi - NSG) grammatik elementlarning guruhlanishi haqida lingvistik ma'lumotlarni, masalan, ot so'z birikmasini (ot, artikl,
sifatdosh va boshqa to‘ldiruvchilar), bosh gap (bosh gap va ot so‘z birikmasidan iborat) va boshqalar gap darajasiga. Grammatika almashtirish qoidalari to'plami yoki A- »B ... C shaklidagi ishlab chiqarishlar hisobi sifatida tuzilgan. NSG
generativ grammatika bo‘lib, tahlil va sintezda ham qo‘llanishi mumkin: til gaplari shunday qoidalarni qayta-qayta qo‘llash orqali hosil bo‘ladi;
Bog'lanish grammatikasi (DG) gap elementlari o'rtasidagi munosabatlar ierarxiyasini belgilaydi (asosiy so'z tobening shaklini belgilaydi). GZdagi analizator egalari va ularning qaramog'idagi (xizmatkorlari) identifikatsiyasiga asoslangan. Gapdagi asosiy narsa shaxs shaklidagi fe'ldir, chunki u qaram otlarning soni va tabiatini belgilaydi. GZda tahlil strategiyasi yuqoridan pastgacha: avval xo‘jayinlar aniqlanadi, keyin xizmatkorlar yoki pastdan yuqoriga: ustalar almashtirish jarayoni bilan aniqlanadi;
Kategorik Bar-Hillel grammatikasi - bu tarkibiy qismlar grammatikasi versiyasi bo'lib, unda faqat ikkita toifa - S jumlalari va n nomi mavjud. Qolganlari esa tuzilishdagi ushbu asosiy bo'lganlar tomonidan e ni birlashtira olish qobiliyati nuqtai nazaridan aniqlanadi. NN dan. Demak, o'timli fe'l n \ S sifatida aniqlanadi, chunki u ism bilan va uning chap tomonida birlashtirilib, S jumlasini hosil qiladi.
Kontekstual sharoitlarni ko'rib chiqishning ko'plab usullari mavjud: metamorfoz grammatikalari va ularning variantlari. Ularning barchasi KS qoidalarining kengaytmalari. Umumiy ma'noda, bu ishlab chiqarish qoidalari quyidagicha qayta yozilganligini anglatadi: A [a] -> B [b], ..., C [c], bu erda shartlar, testlar, ko'rsatmalar va boshqalar, dastlabki qattiq qoidalarni kengaytiradi. va grammatika moslashuvchanligi va samaradorligini beradi.
Umumlashtirilgan komponentlar grammatikasi-TCCda meta-qoidalar kiritiladi, ular KS1 qoidalarining qonuniyatlarini umumlashtirishdir.
Kengaytirilgan o'tish tarmoqlari-CPN grammatikasi yoylar uchun sinovlar va shartlarni, shuningdek, agar tahlil ushbu yoy bo'ylab davom etsa, bajarilishi kerak bo'lgan ko'rsatmalarni beradi. RSP ning turli xil modifikatsiyalarida og'irliklar yoylarga berilishi mumkin, keyin analizator eng katta og'irlikdagi yo'lni tanlashi mumkin. Shartlarni ikki qismga bo'lish mumkin: kontekstsiz va kontekstga sezgir.
Turli xil RPGlar kaskadli RPGlardir. Kaskad - bu 1shshsh1 harakati bilan jihozlangan RSP. Ushbu harakat jarayonni ushbu kaskadda to'xtatishga, stekdagi joriy konfiguratsiya haqidagi ma'lumotlarni eslab qolishga va keyinchalik asl holatiga qaytish bilan chuqurroq kaskadga o'tishga olib keladi. CPG bir qator transformatsion grammatikaga ega. U ishlab chiqaruvchi tizim sifatida ham foydalanish mumkin.
Grafik diagramma yordamida tahlil qilish usuli sizga qisman natijalarni saqlash va tahlil variantlarini taqdim etish imkonini beradi.
Grammatik tavsifning yangi va darhol mashhur usuli bu leksik-funksional grammatika (LFG). Bu transformatsion qoidalarga bo'lgan ehtiyojni yo'q qiladi. LPG RGC ga asoslangan bo'lsa-da, undagi sinov shartlari almashtirish qoidalaridan ajratilgan va avtonom tenglamalar sifatida "echiladi".
Birlashtirish grammatikalari (UG) sxema grafiklaridan keyin tahlil modeli umumlashtirishning navbatdagi bosqichini ifodalaydi: ular har xil turdagi grammatikalarni o'zida mujassamlashtirishga qodir. UG to'rtta komponentni o'z ichiga oladi: unifikatsiya paketi, qoidalar va leksik tavsiflar uchun tarjimon, yo'naltirilgan grafiklarni qayta ishlash dasturlari, grafik-sxema yordamida analizator. UG grammatik qoidalarni lug'at tavsiflari bilan, sintaktik valentliklarni semantik bilan birlashtiradi.
Har qanday NL tahlil tizimining markaziy muammosi variantlarni tanlash muammosidir. Uni yechish uchun sintaktik darajadagi grammatikalar yordamchi grammatikalar va murakkab vaziyatlarni tahlil qilish usullari bilan to‘ldiriladi. NS grammatikalarida filtr va evristik usullar qo'llaniladi. Filtrlash usuli. birinchi navbatda taklif tahlilining barcha variantlari olinadi, so'ngra filtrlash shartlarining ma'lum bir tizimini qanoatlantirmaydiganlari rad etiladi. Eng boshidan evristik usul berilgan mezonlar nuqtai nazaridan ko'proq ishonarli bo'lgan variantlarning faqat bir qismini quradi. Variantlarni tanlash uchun og'irliklardan foydalanish tahlilda evristik usullardan foydalanishga misoldir.
Semantik daraja nazariy va amaliy ishlanmalar bilan kamroq ta'minlangan. Semantikaning an'anaviy vazifasi sintaktik tahlilning noaniqligini - strukturaviy va leksikni olib tashlashdir. Buning uchun jumlalar doirasiga bog'langan, ya'ni sintaktik modelga mos keladigan tanlab cheklash apparati qo'llaniladi. SemAnning eng keng tarqalgan turi hol grammatikasi deb ataladigan narsalarga asoslanadi. Grammatikaning zamirida chuqur yoki semantik hol tushunchasi yotadi. Fe'l hol ramkasi valentlik tushunchasining kengaytmasidir: u (majburiy yoki ixtiyoriy) fe'l va uning matndagi o'zgarishlariga hamroh bo'lishi mumkin bo'lgan semantik munosabatlar to'plamidir. Bir tilda bir xil chuqur hol turli sirt predlogi - hol shakllari orqali amalga oshiriladi. Chuqur holatlar, qoida tariqasida, jumladan tashqariga chiqishga imkon beradi va matnga kirish tahlilning semantik darajasiga o'tishni anglatadi.
Semantik ma'lumotlar, birinchi navbatda, grammatikaga asoslangan sintaktik ma'lumotlardan farqli o'laroq, asosan lug'atlarda jamlanganligi sababli, 80-yillarda CGSni "leksiklashtirish" imkonini beradigan grammatika jadal rivojlandi. Nutqning xususiyatlarini o'rganishga asoslangan grammatikalarning rivojlanishi davom etmoqda.
![Xatcho‘p va ulashish](https://s7.addthis.com/static/btn/v2/lg-share-en.gif)