REFERATUA.ORG.UA — База українських рефератів



Головна Інформатика, комп'ютери, програмування → Лексикографічна структура семантичного словника в моделях класу Смисл  текст

структури (ГСС) вхідної мови у ГСС вихідної мови, тобто

ГССa => ГССb,

де a і b – назви робочих мов системи.

Переклад здійснюється поетапно, перехід ГССa => ГССb забезпечується рядом загальних правил, зоною LF та TRANS. У спрощеній системі загальним правилом може бути, наприклад, опущення артиклів.

Через зону LF (лексичних функцій), переклад здійснюється, коли

  • зона TRANS є пустою, а у зоні DEF знаходиться визначення у термінах стандартних лексичних функцій

  • зона TRANS слова Х не пуста, проте в ГСС, що оброблюється, є піддерево вигляду ХiF(V) –> Y, чи Y –> XjF(Y), де iF, jF – нестандартні лексичні функції з аргументом Y та значення X.

    В першому випадку щоб перевести піддерево у ГСС вищезгаданого вигляду вихідною мовою, достатньо знайти словникову статтю TRANS(Y), а в цій статті значення функції iF чи jF.

    Так само здійснюється і переклад і у другому випадку. Єдина суттєва різниця в тому, що є сигналом до описаної процедури – відсутність еквівалентів в зоні TRANS чи присутність у ГСС піддерева описаного типу.

    В інших випадках, коли в словниковій статті є зона TRANS. переклад здійснюється зверненням безпосередньо до цієї зони. Характер заповнення зони TRANS залежить від таких факторів:

    • чи є об'єкт, що перекладається окремим вузлом чи невиродженим піддеревом ГСС?

    • чи об'єкт, що перекладає окремим вузлом чи невиродженим піддеревом ГСС?

    • чи потрібен вибір перекладу перевірки якихось умов?

    Наприклад, якщо об'єкт, що перекладається, є ім'ям одного вузла ГСС, у зоні TRANS записується тільки еквівалентом, який перекладається. Якщо при цьому еквівалент, на який перекладається (Y) також є окремим словом, і якщо можливість вибору Y не залежить ні від умов використання X та Y, то в зоні TRANS знаходиться тільки один переклад. Наприклад:

    СИСТЕМА

    ...

    TRANS : SYSTEM

    Якщо є декілька рівноправних однослівних перекладів, в зону TRANS записується найбільш загальний з них, а всі інші фігурують у якості синонімів у зоні лексичних функцій Y = TRANS(X).

    Якщо серед перекладів даної лексичної одиниці є ще і переклади-піддерева, всі вони заносяться у зону TRANS. (В рядку syn зони LF містяться тільки однослівні синоніми!).

    Всі переклади даної лексичної одиниці одиниці заносяться в зону TRANS, і втому випадку, коли вибір перекладу залежить від якихось властивостей речення, що перекладається чи на яке перекладається, чи їх формальних представлень. Як легко зрозуміти в цьому випадку виникаються проблеми розпізнання варіантів перекладу, цілком аналогічна проблемам розпізнання значень багатозначного слова. єдиною суттєвою різницею є те, що у даному випадку розпізнання відбувається всередині одного й того ж значення лексичної одиниці, яка перекладається. Наприклад:

    НЕСКІНЧЕНА

    ... attr

    TRANS 1) INFINI | якщо X(S) –> kw, то не

    X = РЯД чи ДРІБ чи ДОБУТОК

    attr

    2) CONTINU | X(S) –> kw,

    та Х = РЯД або ДРІБ або ДОБУТОК

    Зона частин мови

    Зона POR вказує на належність kw(key word) на до однієї з наступних частин мови:

    S- Іменник (+ займенники Я, ТИ, ХТО ...) (+ чисельники тисяча ...)

    A - Прикметник (+ числівники перший, другий) (+ займ. мій ніякий...)

    Adv - Прислівник

    Num - Чисельник

    Prep - Прийменник

    Art - Артикль

    Part - Частка

    Conj - Сполучник

    V - Дієслово

    Com - Композит (весняно-, українсько-)

    Frm - Формула-є хоча б одна літера, що не відноситься до алфавіту (цифра)

    Зона визначень

    У данній зоні записується визначення kw у термінах лексичних функцій. У якості аргументів лексичних функцій у зоні DEF можуть виступати як конкретні лексичні одиниці, так і змінні (у випадку, коли ключове слово несе смисл даної лексичної функції і виступає в якості значення при невизначеному околі слів.

    ПАЦІЄНТ

    DEF: //S2 (лікувати)

    Зона обмежень

    В цій зоні вказуються морфологічні, синтаксичні та поєднувані обмеження на дане значення слова чи на слово у складі фраземи.

    НАСТУПАТИ 2.2

    ...

    LIM : не док.

    Армія наступала - не може бути "армія наступила"

    Зона синтаксичних ознак

    Синтаксичні одиниці описують здатність лексичних одиниць брати участь у якості головного чи залежного члена у тих чи інших конструкціях. Синтаксичні ознаки присутні у синтагмах, операторах та правилах порядку слів. Всього в моделі поверхневого синтезу української мова нараховується приблизно 150 – 200 синтаксичних ознак.

    Наприклад:

    (одн!) – іменник молоко, адєктивні іменники "ціле" і т.п.

    ВАГА

    ...

    SYNT: чолов, неперерах, парам, парам-тіл.

    Зона дескрипторів

    У зоні DES ключовому слову приписуються дескриптори – ознаки, які відносять слово до деякого семантичного класу (чи класів). На різницю від інших відомостей, дескриптори є прагматичним, скоріше за все алгоритмічним, засобом семантичного контролю та, по суті справи, не має визначеного наукового статусу.

    В першу чергу звертатися до семантики при перекладі доводиться на етапі власне перекладу: в описі зони TTRANS можуть бути випадки, коли вибір того чи іншого перекладу ключового слова обумовлен семантичними властивостями слів, з яким вони пов'язані. Крім є плідним використовувати семантичні обмеження на поєднання слів у процесі поверхово-синтакчисного аналізу (синтезу) у якості фільтра при перевірці гіпотез про присутність/відсутність деякого синтаксичного відношення між якимось двома словами.

    Дескриптори приписуються всім повнозначним словам, в основному іменникам та дієсловам, рідко прикметникам та прислівникам.

    БІГАТИ

    ...

    DES : дія

    Дескрипторів може нараховуватися приблизно 100 (рослина, властивість, твір, система, фізика, і т.і.) Частина дескрипторів організована у ієрархічні структури.

    Зона синтаксичних ознак та дескрипторів типового власника

    Зона GOV передбачується у словникових статтях прикметників, прислівників, прийменників та сполучників. В цій зоні записуються дескриптори та синтаксичні ознаки типового синтаксичного власника ключового слова.

    Типовим власником прикметника є іменник, зв'язаний з ним визначниковим відношенням.

    У прислівника – це дієслово чи прикметник. У прийменника та сполучника – дієслово, прикметник та іменник.

    СКЛЯНИЙ І:

    ...

    POR : A

    GOV : DES (G) = артефакт.

    Зона GOV містить інформацію про пасивні валентності слова.

    Зона моделей керування

    Зона моделей керування містить таку інформацію

    • число глибинно-синтаксичних октантів ключового слова;

    • засоби їх вираження

    • семантичні, лексичні та синтаксичні властивості слів, які можуть виражати дане октантне місце;

    • умови сумісної реалізації різних актантів у реченні.

    Модель керування має вигляд таблиці, кількість стовпчиків


  •  
    Загрузка...