Щодо укладання електронного словника моделей багатокомпонентних складних речень української мови

Автор(и)

  • Наталія Дарчук КНУ імені Тараса Шевченка

DOI:

https://doi.org/10.17721/um/49(2019).117-129

Ключові слова:

дерево залежностей, автоматичний синтаксичний аналіз, модель багатокомпонентного складного речення, словосполучення, частотний словник

Анотація

Метою дослідження є побудова автоматичного синтаксичного аналізу (АСА) і як наслідок – укладання словника моделей багатокомпонентних складних речень для вивчення властивостей лінійної структури українськомовного тексту. Процес укладання двоетапний: на першому етапі працює автоматичний синтаксичний аналіз ієрархічного типу, який завершується побудовою дерева залежностей (ДЗ), а на другому – з одержаного графа автоматичного здобувається інформація про модель речення. АСА – це сукупність операцій, які виконуються над послідовностями інформації морфологічного характеру (результатом роботи АМА), що представляють вхідний текст, для встановлення синтаксичних зв’язків між текстовими одиницями. Вихідним текстом для АСА є редукована після АМА послідовність інформації до словоформ. Досліджувалися властивості лінійної структури 2000 українськомовних речень публіцистичного стилю (вибірка у 52000 слововживань). На підставі цих результатів будувалися реальні моделі синтаксичної структури речень, у яких відображені відношення між простими реченнями. Усі граматичні ситуації лінійного контексту були можливими маніфестаціями моделей у тексті. На підставі цих даних будувався алгоритм автоматичного творення моделі складного речення. Отримані моделі є граматикою лінійного синтаксису. Усі види синтаксичного зв’язку між головним і підрядними реченнями фіксуються алгоритмічно. Таким чином можна будувати інтерпретації лінійної структури українського речення, майже не використовуючи лексико- семантичну інформацію. Теоретичне значення роботи полягає в поглибленні наших уявлень про будову синтаксичного рівня мови і різноманітності механізмів, які діють на синтаксичному рівні. Прикладне значення вбачаємо у створенні словника сполучуваності складносурядних і складнопідрядних речень, у можливості побудови запитів до Корпусу української мови з метою здобувати з тексту речення певних моделей, створюючи свої власні словники авторів, стилів.

 

Інформація про автора:

Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри української мови та прикладної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: nataliadarchuk@gmail.com

__________

Література

  1. Дарчук Н. П. Комп’ютерне анотування українського тексту: результати і перспективи. Київ : Освіта України, 2013. 543 с.
  2. Загнітко А. П. Основи українського теоретичного синтаксису. В 3 частинах. Ч. 1. Горлівка : ГДПІІМ, 2004. 246 с.
  3. Кулагина О. С. Об одном подходе к установлению отношений между простыми
    предложениями в составе сложного при автоматическом анализе текстов // Математические вопросы кибернетики. 2001. № 10. С. 15–34.
  4. Русская граматика : [в 2 т. / редкол.: Н. Ю. Шведова (гл. ред.) и др.]. Москва : Наука, 1980. Т. 2 : Синтаксис. 709 с.
  5. Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев : Наук. думка, 1981. 192 с.
  6. Циммерлинг А. В. Порядок слов и синтаксические позиции // Труды международного семинара “Диалог’98” по компьютерной лингвистике и её приложениям / А. С. Нариньяни (ред.). Казань, 1999. URL : https://antonzimmerling.files.wordpress.com/2013/06/turus.pdf (дата звернення: 10.10.2018).
 

Завантаження

Опубліковано

2019-07-08

Номер

Розділ

КОМП’ЮТЕРНА ЛІНГВІСТИКА

Як цитувати

Щодо укладання електронного словника моделей багатокомпонентних складних речень української мови. (2019). Українське мовознавство, 1(49), 117-129. https://doi.org/10.17721/um/49(2019).117-129

Схожі статті

1-10 з 37

Ви також можете розпочати розширений пошук схожих статей для цієї статті.