Щодо укладання електронного словника моделей багатокомпонентних складних речень української мови
DOI:
https://doi.org/10.17721/um/49(2019).117-129Ключові слова:
дерево залежностей, автоматичний синтаксичний аналіз, модель багатокомпонентного складного речення, словосполучення, частотний словникАнотація
Метою дослідження є побудова автоматичного синтаксичного аналізу (АСА) і як наслідок – укладання словника моделей багатокомпонентних складних речень для вивчення властивостей лінійної структури українськомовного тексту. Процес укладання двоетапний: на першому етапі працює автоматичний синтаксичний аналіз ієрархічного типу, який завершується побудовою дерева залежностей (ДЗ), а на другому – з одержаного графа автоматичного здобувається інформація про модель речення. АСА – це сукупність операцій, які виконуються над послідовностями інформації морфологічного характеру (результатом роботи АМА), що представляють вхідний текст, для встановлення синтаксичних зв’язків між текстовими одиницями. Вихідним текстом для АСА є редукована після АМА послідовність інформації до словоформ. Досліджувалися властивості лінійної структури 2000 українськомовних речень публіцистичного стилю (вибірка у 52000 слововживань). На підставі цих результатів будувалися реальні моделі синтаксичної структури речень, у яких відображені відношення між простими реченнями. Усі граматичні ситуації лінійного контексту були можливими маніфестаціями моделей у тексті. На підставі цих даних будувався алгоритм автоматичного творення моделі складного речення. Отримані моделі є граматикою лінійного синтаксису. Усі види синтаксичного зв’язку між головним і підрядними реченнями фіксуються алгоритмічно. Таким чином можна будувати інтерпретації лінійної структури українського речення, майже не використовуючи лексико- семантичну інформацію. Теоретичне значення роботи полягає в поглибленні наших уявлень про будову синтаксичного рівня мови і різноманітності механізмів, які діють на синтаксичному рівні. Прикладне значення вбачаємо у створенні словника сполучуваності складносурядних і складнопідрядних речень, у можливості побудови запитів до Корпусу української мови з метою здобувати з тексту речення певних моделей, створюючи свої власні словники авторів, стилів.
Інформація про автора:
Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри української мови та прикладної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: nataliadarchuk@gmail.com
__________
Література
- Дарчук Н. П. Комп’ютерне анотування українського тексту: результати і перспективи. Київ : Освіта України, 2013. 543 с.
- Загнітко А. П. Основи українського теоретичного синтаксису. В 3 частинах. Ч. 1. Горлівка : ГДПІІМ, 2004. 246 с.
- Кулагина О. С. Об одном подходе к установлению отношений между простыми
предложениями в составе сложного при автоматическом анализе текстов // Математические вопросы кибернетики. 2001. № 10. С. 15–34. - Русская граматика : [в 2 т. / редкол.: Н. Ю. Шведова (гл. ред.) и др.]. Москва : Наука, 1980. Т. 2 : Синтаксис. 709 с.
- Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев : Наук. думка, 1981. 192 с.
- Циммерлинг А. В. Порядок слов и синтаксические позиции // Труды международного семинара “Диалог’98” по компьютерной лингвистике и её приложениям / А. С. Нариньяни (ред.). Казань, 1999. URL : https://antonzimmerling.files.wordpress.com/2013/06/turus.pdf (дата звернення: 10.10.2018).
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Наталія Дарчук
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.