REFERATUA.ORG.UA — База українських рефератів



Головна Інформатика, комп'ютери, програмування → Лексикографічна структура семантичного словника в моделях класу Смисл  текст

заміняти С0 у тих чи інших контекстах та при тих чи інших умовах, та 2) його "синтагматичні партнери", чи "параметри" – засоби, за допомогою яких ідіоматично, тобто невільно, висловлюються при даному слові деякі смисли.

Для позначення парадигматичних варіантів та синтагматичних партнерів слова ще використовується термін "лексичні кореляти".

Залежності, які зв'язують слова з їх лексичними корелятами описується за допомогою лексичних функцій. Лексичні функції, як правило, позначаються абревіатурами, що утворюються від латинських слів.

Наприклад, функція, що відповідає смислу "дуже", позначається Magn – від латинського magnus – "великий", функція Syn – синонім слова.

Magn (брюнетка) = жагуча. Syn (арештовувати) = затримувати.

Magn (знати) = напам'ять.

Тлумачно-комбінаторний словник.

Тлумачно-комбінаторний словник (ТКС), який буде розглядатися, є складовою частиною системи автоматизованого перекладу. Будемо розглядати спрощений варіант моделі "Смисл Текст". В цьому варіанті буде всього три рівня формального представлення речень: морфологічний, поверхово-синтаксичний та глибинно-синтаксичний.

Морфологічний компонент системи забезпечує перехід (встановлення відповідності) "Речення  МС". Під МС розуміємо послідовність імен лексем, що входять в речення, при цьому імені кожної лексеми приписана певна граматична характеристика.

Поверхнево-синтаксичний компонент забезпечує перехід "МС  ПСС". Під ПСС розуміємо дерево залежностей, вузли котрого відмічені іменами лексем, які забезпечені наборами семантично змістовних граматичних характеристик, стрілки котрих відповідають одному з специфічних для даної природної мови поверхнево-синтаксичних відносин.

Глибинно-синтаксичний компонент забезпечує перехід "ПСС  ГСС". Під ГСС розуміємо дерево залежностей, вузли котрих можуть бути відмічені іменами конкретних лексем чи фразем та двох типів фіктивних лексем: іменами потенційних (фіктивних) слів, які у данній мові неможливі, та іменами глибинно-синтаксичних слів, які репрезентують на глибинному рівні смисл семантично змістовних поверхнево-синтаксичних відносин.

ВЛексикографічна структура семантичного словника в моделях класу   Смисл  текстесь процес перекладу складається з таких основних етапів:

Речення => МС

МС => ПСС аналіз

ПСС => ГСС

ГССвхід => ГССвихід власне переклад

ГССвихід => ГССпохід перефразування

ГСС Лексикографічна структура семантичного словника в моделях класу   Смисл  текст=> ПСС

ПСС => МС синтез

МС => Речення

На всіх етапах, за винятком першого та останнього, необхідно звертатися до ТКС, який, таким чином, виявляється вельмисуттєво зв'язаним з граматичним компонетом системи, являючи з нею один (інтегральний) опис мови. Тому для успішної роботи системи необхідно мати максимально узгоджені один з одним граматику і словник. Це дуже складно зробити, бо цей словник має вміщувати, як можна більше інформації про мову, але без такого словника автоматизований переклад (саме ПЕРЕКЛАД) буде неможливий.

Словарна стаття ТКС являє собою підмножину деякої множини зон, у котрих записується інформація про відповідні властивості лексичних одиниць. Кожна зона, за винятком першої, вводиться своєю поміткою – абревіатурою з прописних латинських букв, з двокрапкою. Ось ці зони:

  • Вхід – порядковий номер та ім'я лексичної одиниці, з номером омоніма та номером значення;

  • TRANS – переклад:

  • DEF – тлумачення лексичної одиниці в термінах лексичних функцій;

  • POR – частина мови;

  • LIM – морфологічні, синтаксичні та обмеження, що поєднуються, на дане значення слова, на безумовний зворот чи на слово у складі фраземи;

  • SYNT – синтаксичні ознаки;

  • DES – дескриптори (семантичні ознаки);

  • GOV – синтаксичні ознаки та дескриптори типового синтаксичного власника;

  • MG – модель чи моделі керування;

  • PREL – потенційні синтаксичні зв'язки для слова у складі фраземи;

  • LF – лексичні функції;

  • TRSFS – поверхнево-синтаксичні перетворення для фразем – "мікросинтагми";

  • TRSFD – глибинно-синтаксичні перетворення для фразем;

  •  - неформальна зона ілюстрацій та приміток.

    Зони (1) та (4) обов'язкові в будь-якій словниковій статті. В словникових статтях фразем обов'язкові зони (12) та (13). Решта зон факультативні.

    Однією з двох центральних проблем будь-якої системи АП (автоматизованого перекладу) є вирішення проблеми неоднозначності при аналізі – морфологічної, синтаксичної і лексичної омонімії та лексичної полісемії. (Друга центральна проблема – можливість породити достатню синонімію при синтезі, щоб подолати лексико-синтаксичні розходження між вхідною і вихідною моваим).

    З усіх перерахованих типів неоднозначності доречно розглянути тільки лексичну полісемію та засоби її вирішення.

    Для цього використовується інформація, що знаходиться в таких зонах: LIM, SYNT, GOV, MG, LF. LIM виступає як розрізник значень у тих випадках, коли на значення і слова Х накладаються певні морфологічні чи синтаксичні обмеження, а в реченні, яке ми оброблюємо ці обмеження не спостерігаються.

    Наприклад, лексема ЗУСТРІЧАТИ І (Я випадково зустрів її – RECONTRER (fr.)), ЗУСТРІЧАТИ ІІ (Хто поїхав зустрічати делегацію? – ACCUEILLIR (fr.)). Ця різниця формально і цілком природньо проявляється в тому, що ЗУСТРІЧАТИ ІІ може бути залежним членом обставинного відношення при лексемі, здатної підпорядковувати собі цільовий інфінітив. до числа таких лексем відносяться більшість дієслів переміщення типу ЙТИ, ПІТИ, ЇХАТИ, ВЕСТИ та ін. Всім їм у словнику приписується спеціальна синтаксична ознака (обс-інф), яка описує їх здатність бути головним членом згаданої вище конструкції. Щоб використати цю інформацію при виборі потрібного значення дієслова ЗУСТРІЧАТИ в реченнях типу

    Хто поїхав зустрічати делегацію?

    Вона повела дітей зустрічати батьків.

    достатньо записати таке обмеження у словниковій статті ЗУСТРІЧАТИ І:

    LIM: якщо kw = інф., то не х(v, обст-інф) –> kw. В ПСС таких речень будуть піддерева як раз такого вигляду, і, отже, словоформа ЗУСТРІЧАТИ буде однозначно обізнаний як така, що репрезентує лексему ЗУСТРІЧАТИ ІІ.

    Тепер розглянемо окремо кожну зону словникової статті.

    Типи лексикографічної інформації у тлумачно-комбінаторному словнику

    Ми розглянемо зони словникової статті.

    Вхід словникової статті

    Вхід словникової статті має вигляд NWI.J

    N – восьмизначний номер лексичної одиниці

    W – сама лексична одиниця

    I – номер її омоніма

    J – номер її значення

    Приклади: (рос.)

    02682100 РАЗРЯД 1.(=DECHARGE); 02682200 РАЗРЯД 2.(=CLASSE).

    Зона перекладів

    Процес перекладу речення з однієї природної мови на іншу здійснюється на глибинно-синтаксичному рівні, являючи собою перетворення глибинно-синтаксичної


  •  
    Загрузка...