ИТиС

«Информационные технологии и системы - 2011»
34-я конференция молодых ученых и специалистов ИППИ РАН
2 – 7 октября 2011г.

Русский | English

 

 

Просмотров:

 









 

Четверг, 6 октября
14:30 - 16:30
Зал C
Сессия: Компьютерная лингвистика
Председатель: к. фил. н. Иомдин Л.Л.

Леонид Лейбович Иомдин,
к. фил. н., ведущий научный сотрудник ИППИ РАН

Лекция: Микросинтаксис русского языка (рус)
Аннотация:

В лекции рассматривается класс разнообразных явлений русского языка, занимающих промежуточное положение между грамматикой и словарём. Большинство таких явлений имеют резко выраженный индивидуальный характер и требуют особо тонкого инструментария для исследования (подобно тому, как некоторые нуждающиеся в хирургическом лечении патологии требуют микрохирургических инструментов и приёмов).

К таким явлениям относятся, в частности, синтаксические фраземы (такие фразеологические единицы, которые обладают синтаксической спецификой по сравнению с обычными выражениями), а также нестандартные синтаксические конструкции. Примерами первых являются выражения типа
(1) съесть собаку на X ≈ ‘иметь большой опыт в X’
или (2) руки чешутся Х-овать ≈ ‘имеется сильное желание Х-овать’.

Если сравнить их с аналогичными выражениями, которые не образуют фразеологических единиц (Заяц не может съесть собаку или После этого крема у меня руки чешутся), то мы легко обнаружим, что указанные фраземы приобретают, кроме смысловой идиоматичности, особые свойства управления (предлог на в (1), вводящий сферу действия опыта или инфинитив в (2), характеризующий объект сильного желания) Примерами вторых являются конструкции типа (3) Z-у X-овать (ср. Вам выходить, Кому работать?), где значение определенной модальности выражается не конкретными словами типа нужно, следует, а особенностями самой конструкции, а также конструкции с повторяющимися словами типа (4) X-овать не X-овал (ср. читать не читал (но листал), храпеть не храпит (а какие-то звуки во сне производит), где идея неполноты действия выражается не конкретными словами (не совсем, не впрямую), а именно повторением слов.

Особое внимание в лекции будет уделено методам строгого описания таких единиц для решения теоретических и прикладных задач.


Казенников А.О.
Построение морфологического анализатора неизвестных слов на основе словарей системы ЭТАП-3 Открыть работу
Аннотация: В настоящей работе представлен способ построения морфологического анализатора для неизвестных слов на основе словарей системы ЭТАП-3. Анализатор строится на базе конечного автомата. В качестве исходного материала для построения анализатора используются словари системы ЭТАП-3. При построении анализатора в автомат вносится изменяемая часть слова с приписанными морфологическими характеристиками. Представленный в работе алгоритм был экспериментально опробован на корпусе СинТагРус, где показал свою эффективность. Таким образом, алгоритм может использоваться как для непосредственной задачи анализа неизвестных слов, так и для задачи стемминга (лемматизации).

Крейдлин Л.Г.
Учет дескрипторных весов в синтаксическом анализаторе системы ЭТАП-3 Открыть работу
Аннотация: В ходе работы по совершенствованию синтаксического анализатора системы ЭТАП-3 был проведен эксперимент по вычислению уровня семантической связанности слов - потенциальных участников сочинительных конструкций - и по использованию полученных данных в процессе фильтрации синтаксических гипотез.

Петроченков В.В.
Статистическое разрешение лексической неоднозначности в системе ЭТАП-3 Открыть работу
Аннотация: В статье описывается эксперимент по разрешению лексической неоднозначности при построении синтаксической структуры в системе ЭТАП-3. Для разрешения этой неоднозначности были использованы данные о совместном употреблении слов, собранные с корпуса размеченных текстов СинТагРус, а так же аналогичные данные из словаря CrossLexica. Использование этих данных вместе с вероятностной моделью позволило увеличить долю правильно разрешённых лексических неоднозначностей.