Щодо укладання електронного словника моделей багатокомпонентних складних речень української мови

Наталія Дарчук

doi:10.17721/um/49(2019).117-129

Автор(и)

Наталія Дарчук КНУ імені Тараса Шевченка

DOI:

https://doi.org/10.17721/um/49(2019).117-129

Ключові слова:

дерево залежностей, автоматичний синтаксичний аналіз, модель багатокомпонентного складного речення, словосполучення, частотний словник

Анотація

Метою дослідження є побудова автоматичного синтаксичного аналізу (АСА) і як наслідок – укладання словника моделей багатокомпонентних складних речень для вивчення властивостей лінійної структури українськомовного тексту. Процес укладання двоетапний: на першому етапі працює автоматичний синтаксичний аналіз ієрархічного типу, який завершується побудовою дерева залежностей (ДЗ), а на другому – з одержаного графа автоматичного здобувається інформація про модель речення. АСА – це сукупність операцій, які виконуються над послідовностями інформації морфологічного характеру (результатом роботи АМА), що представляють вхідний текст, для встановлення синтаксичних зв’язків між текстовими одиницями. Вихідним текстом для АСА є редукована після АМА послідовність інформації до словоформ. Досліджувалися властивості лінійної структури 2000 українськомовних речень публіцистичного стилю (вибірка у 52000 слововживань). На підставі цих результатів будувалися реальні моделі синтаксичної структури речень, у яких відображені відношення між простими реченнями. Усі граматичні ситуації лінійного контексту були можливими маніфестаціями моделей у тексті. На підставі цих даних будувався алгоритм автоматичного творення моделі складного речення. Отримані моделі є граматикою лінійного синтаксису. Усі види синтаксичного зв’язку між головним і підрядними реченнями фіксуються алгоритмічно. Таким чином можна будувати інтерпретації лінійної структури українського речення, майже не використовуючи лексико- семантичну інформацію. Теоретичне значення роботи полягає в поглибленні наших уявлень про будову синтаксичного рівня мови і різноманітності механізмів, які діють на синтаксичному рівні. Прикладне значення вбачаємо у створенні словника сполучуваності складносурядних і складнопідрядних речень, у можливості побудови запитів до Корпусу української мови з метою здобувати з тексту речення певних моделей, створюючи свої власні словники авторів, стилів.

Інформація про автора:

Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри української мови та прикладної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: nataliadarchuk@gmail.com

__________

Література

Дарчук Н. П. Комп’ютерне анотування українського тексту: результати і перспективи. Київ : Освіта України, 2013. 543 с.
Загнітко А. П. Основи українського теоретичного синтаксису. В 3 частинах. Ч. 1. Горлівка : ГДПІІМ, 2004. 246 с.
Кулагина О. С. Об одном подходе к установлению отношений между простыми
предложениями в составе сложного при автоматическом анализе текстов // Математические вопросы кибернетики. 2001. № 10. С. 15–34.
Русская граматика : [в 2 т. / редкол.: Н. Ю. Шведова (гл. ред.) и др.]. Москва : Наука, 1980. Т. 2 : Синтаксис. 709 с.
Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев : Наук. думка, 1981. 192 с.
Циммерлинг А. В. Порядок слов и синтаксические позиции // Труды международного семинара “Диалог’98” по компьютерной лингвистике и её приложениям / А. С. Нариньяни (ред.). Казань, 1999. URL : https://antonzimmerling.files.wordpress.com/2013/06/turus.pdf (дата звернення: 10.10.2018).