چکیده:
В статье заострена проблема фразематического статуса вербономинальных словосочетаний, рассматриваемых как "потенциальные фраземы" (ПФ), – таких как давить на психику, ходить на работу, забежать на минутку, забраться на крышу, зайти на страницу. В анализируемом списке свыше 1 тысячи таких конструкций. Предлагается особый подход к их валентной автономности в контексте, при этом учитывается сам контекст как супрафразематическая особенность ПФ. Особую роль имеет индивидуальный подход к каждой ПФ в конкретном контексте. Это позволяет создать особый опыт, который можно конвертировать для компьютеризации лингвистического анализа. К рассмотрению предлагается возможность автоматизации определения фразематического статуса ПФ с помощью искусственного интеллекта (методы machine learning). Описываемые методы позволяют автоматически эксцерпировать ПФ с параллельным определением их фразематического статуса как в отдельных текстах русского языка, так и в корпусных массивах.
The article focuses on the problem of the phrasematic status of verb-nominal phrases considered as "potential phrasemes", such as: давить на психику, ходить на работу, забежать на минутку, забраться на крышу, заити на страницу. The analyzed list includes more than one thousand of such structures. A special approach to their valency autonomy in the context is proposed. We take into account the context as supraphrasematic feature of potential phrasemes. An individual approach to each potential phrasemes in a particular context has a special role to play. This allows creating a special experience that can be converted to computerized linguistic analysis. We propose to consider the possibility of automatization the detection of the phrasematic status of potential phrasemes by using machine learning methods (the artificial intelligence). The described methods allow to automatic retrieval of the potential phrasemes with synchronous recognition of their phrasematic status in particular text and big text corpora of Russian language.
خلاصه ماشینی:
) Аннотация В статье заострена проблема фразематического статуса вербономинальных словосочетаний, рассматриваемых как ” потенциальные фраземы” (ПФ), — таких как Давить на психику, ходить на работу, забежать на минутку, забраться на крышу, зайти на страницу.
Целью статьи является презентация фразематического ключа, который использует в итоге САФК в процессе итерации языкового опыта, то есть своего рода самообучения, а также при принятии решения относительно конкретной конструкции.
Стоит отметить, что в эксперименте были использованы данные трех корпусов: из архива газеты Новая газета за 2013 год (3421285 слов-вхождений, понимаемых как повторяющиеся сегменты знаков алфавита от пробела до пробела) были автоматически эксцерпированы 3-граммные вербономинальные конструкции; массив CommonCrawl компрессированный архив текстов российского домена .
белый билет (пример v) это идиома, зарегистрированная в Большом словаре русском поговорок (Мокиенко, Никитина 2007), основана уже на модели метафоры, то есть данное выражение вербализирует не просто материально существующий десигнат названия (документ или удостоверение белого цвета), а метафора-формула, связанная с самим фактом, свидетельствующим об освобождении от воинской службы: ср.
вышел на улицу (пример vi) в зависимости от контекста это вербономинальное выражение (ВИВ) иметь зачастую околоколлокационные (саму коллокацию мы понимаем согласно дефиниции: ” слабоидиоматичные фразеологизмы преимущественно со структурой словосочетания, в которых семантически главный компонент (база) употреблен в своем прямом значении, а сочетаемость со вспомогательным компонентом (коллокатором) может быть задана в терминах семантического класса, но выбор конкретного слова предопределен узусом' Баранов, Добровольский 2014.
Принимая во внимание приемы фразематического анализа и классификации МЕ во фразематическом ключе, необходимо сказать, что для нас все же важна поляризация статуса исследуемых ВИВ: это фраземы либо не-фраземы.