Ляшевская Ольга Николаевна
Факультет гуманитарных наук
Профессиональные интересы
Должности
- Профессор — Факультет гуманитарных наук, Школа лингвистики
Био
- · Начала работать в НИУ ВШЭ в 2011 году.
- · Научно-педагогический стаж: 28 лет.
Образование
- 1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
- 1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
- 1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»
Опыт работы
- · 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
- · 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
- · 2010–2011: : førsteamanuensis (Associate Professor)
- · 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
- · 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
- · 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
- · 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
- · 1997–2001: : преподаватель русского языка как иностранного
- · 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
- · 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ
Награды и поощрения
- · Благодарность проректора НИУ ВШЭ (июль 2025)
- · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
- · Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
- · Благодарность проректора НИУ ВШЭ (ноябрь 2021)
- · Благодарность Высшей школы экономики (январь 2017)
- · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
- · Надбавка за академическую работу (2016–2017)
- · Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
- · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
- · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
- · Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
- · Лучший преподаватель — 2019, 2017, 2013
Гранты и проекты
- — · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
- 2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
- — · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
- 2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
- 2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
- 2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
- 2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
- 2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
- 2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
- 2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- — · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- 2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
- 2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
- 2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)
Конференции (30)
Показать все
- · 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
- · 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
- · 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
- · 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
- · 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
- · 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
- · 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
- · 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
- · 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
- · 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
- · 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
- · 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
- · 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
- · 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
- · 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
- · 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
- · 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
- · 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
- · 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
- · 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
- · 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios
Идентификаторы исследователя
- ORCID:
0000-0001-8374-423X - ResearcherID:
E-8855-2014 - SPIN РИНЦ:
6340-5599 - Google Scholar: https://scholar.google.ru/citations?user=5XzprO8AAAAJ&hl=ru
- Scopus AuthorID:
37090988800
Публикации (116)
К вопросу о частотностях глагольных конструкций в некоторых жанрах массовой литературы
2022 · ARTICLE · ru
Использование корпусов для изучения специфических областей языка – широко распространенная практика в современной лингвистике. В нашем исследовании мы обращаемся к такому лингвокультурологическому яв- лению, как массовая литература (бульварный роман). Клишированность такой литературы позволяет описывать ее при помощи так называемых литературных формул, в универсальной форме воплощающих культурные темы и стереотипы социума. В основном исследуемые культурологами и литературоведами, с лингвистической точки зрения литературные формулы изучены недостаточно. В работе мы рассматриваем четыре микрожанра1 (любов- ный роман, детектив, научно-фантастический роман и фэнтези), которые примерно соответствуют литературным формулам «романтическая история», «тайна», «чуждые сущности и состояния» и «приключения». Поскольку низкоуровневые признаки (длина текста, длина слова, частеречные характеристики) не дают однозначного отве- та относительно принадлежности текста к той или иной литературной формуле, в работе на материале корпуса текстов массовой литературы анализируются глагольные конструкции (комплексы вида «глагол + зависимые»), характерные для одного или нескольких микрожанров. Для выделения подобных комплексов используются ме- тоды машинного обучения. Конструкции, внесшие наибольший вклад в кластеризацию по жанрам, мы называем маркерными, т. е. характерными для определенного микрожанра. Конструкции рассматриваются с точки зрения заполненности валентностей глагола. В исследовании выделяются полные (словарные), неполные (с опущением субъекта, прямого или косвенного объекта) и расширенные (сирконстантные) глагольные конструкции. Проана- лизированы и описаны конкретные примеры реализации конструкций в каждом из микрожанров. На основе схо- жести конструкционного профиля сделаны выводы о преобладании в любовных романах и детективах глаголов и конструкций, сопутствующих прямой речи, и о превалировании полных конструкций в научно-фантастиче- ских романах и фэнтези. Предложены также внетекстовые объяснения подобного предпочтения. Предложенный в исследовании метод может быть использован для изучения синтаксических особенностей различного генеза: обусловленных авторской, временной или жанровой спецификой.
Automated assessment of learner text complexity
2021 · ARTICLE · en
EFL methodology has always recognized the importance of giving student learners of foreign languages regular and quick feedback on student speech production, both written and oral, and over the past two decades there appeared various tools for the provision of automated instant feedback. The presented paper offers an application that focuses on measuring text complexity, and the results are translated into feedback related to the author’s language proficiency. Along with some standard text complexity features, this tool takes into account those that are significant for Russian learners of English. The application provides students with advice on how to improve the weaker aspects of the evaluated essay by giving the statistics of the relevant linguistic features of the text in two different colours for the better and worse levels. We point out what text features are more relevant for the assessment of the essays written in English by Russian students. We analyzed 3440 texts from Russian Error-Annotated English Learner Corpus, and for each of them we calculated the text criteria values. Then we used the methods of machine learning and statistical analysis to predict the grade that could be received for the essay.
Лексико-синтаксические маркеры малых литературных жанров
2021 · ARTICLE · ru
Статья представляет корпусное исследование конструкций поверхностного синтаксиса глаголов русского языка сквозь призму их употребления в различных жанрах массовой литературы. В центре внимания - глагольное управление и конструкции с сирконстантами, лексические ограничения на заполнение слотов конструкций. Было проанализировано пять типов связей - подлежащее, прямое и косвенное дополнение, инфинитивная клауза, а также обстоятельственная клауза. Рассмотрены расширения и усечения конструкций относительно прототипической конструкции глагольного управления, изменения конструкции в результате эллипсиса в подчиненной группе, актантные деривации, мотивированные специализацией значения глагола в том или ином жанре. Для выделения конструкций-маркеров для каждого жанра была использована метрика важности лексико-синтаксических признаков классификации текстов, рассчитанная на основе модели Случайный Лес (random forest). Составлены конструкционные портреты четырех микрожанров: детективов, любовных романов, фентези и научной фантастики. Показано, что тематика произведений, структура повествования, следование массовым штампам влияет не только на выбор лексики, но и на конструкционный потенциал глагола. В целом исследование представляет отправную точку для изучения взаимодействия лексики, семантики и синтаксиса на уровне микрожанра массовой литературы, а полученные данные могут быть использованы в моделях автоматической классификации текстов для электронных библиотек.
Do topics make a metaphor? Topic modeling for metaphor identification and analysis in Russian.
2021 · CHAPTER · en
The paper examines the efficiency of topic models as features for computational identification and conceptual analysis of linguistic metaphor on Russian data. We train topic models using three algorithms (LDA and ARTM – sparse and dense) and evaluate their quality. We compute topic vectors for sentences of a metaphor-annotated Russian corpus and train several classifiers to identify metaphor with these vectors. We compare the performance of the topic modeling classifiers with other state-of-the-art features (lexical, morphosyntactic, semantic coherence, and concreteness-abstractness) and their different combinations to see how topics contribute to metaphor identification. We show that some of the topics are more frequent in metaphoric contexts while others are more characteristic of non-metaphoric sentences, thus constituting topic predictors of metaphoricity, and discuss whether these predictors align with the conceptual mappings attested in literature. We also compare the topical heterogeneity of metaphoric and non-metaphoric contexts in order to test the hypothesis that metaphoric discourse should display greater topical variability due to the presence of Source and Target domains.The paper examines the efficiency of topic models as features for computational identification and conceptual analysis of linguistic metaphor on Russian data. We train topic models using three algorithms (LDA and ARTM – sparse and dense) and evaluate their quality. We compute topic vectors for sentences of a metaphor-annotated Russian corpus and train several classifiers to identify metaphor with these vectors. We compare the performance of the topic modeling classifiers with other state-of-the-art features (lexical, morphosyntactic, semantic coherence, and concreteness-abstractness) and their different combinations to see how topics contribute to metaphor identification. We show that some of the topics are more frequent in metaphoric contexts while others are more characteristic of non-metaphoric sentences, thus constituting topic predictors of metaphoricity, and discuss whether these predictors align with the conceptual mappings attested in literature. We also compare the topical heterogeneity of metaphoric and non-metaphoric contexts in order to test the hypothesis that metaphoric discourse should display greater topical variability due to the presence of Source and Target domains.
Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
2021 · CHAPTER · en
The Dictionary of Russian Language of the 11th 17th centuries (DRL1117), which covers both Old and Middle Russian periods, is an ongoing project of the Russian Academy of Sciences, with volumes 131 published in hardcopy in 19752019). Up to now, only volumes 28-30 were converted into the database and published free online (http://web-corpora.net/wsgi/oldrus.wsgi/). The online edition allows one to search for entries that contain particular grammatical properties, phraseological units, sources of etymology, texts and sources attested in the entry, historical periods they represent, etc. (Aksyonov et al. 2015, Vechkaeva 2016). This paper presents a new initiative aimed at the digitization of earlier volumes, which includes OCR, encoding the dictionary according to a TEI- compatible XML scheme, improving the integrity of entries, and additional data mining and enrichment using external resources. We focus on the issue of how to represent the revised entries, namely, those that were added, deleted, and corrected in subsequent volumes and in a supplementary volume. The changes in the entries are usually powered by new sources taken into consideration, by new interpretations of the source documents, or by changes in editorial policy. The typology of revisions made by the authors and editors of later volumes includes: adding or deleting entries; adding or deleting certain parts of the entry (senses, examples, etymology, etc.); correcting one or several fields of the entry (definition, example, grammatical properties, bibliographic description of citations, etc.). More complex changes are decomposed into the components listed above. The TEI-based scheme of the dictionary addresses two ways of presenting the content: (i) an online searchable version and (ii) a retro- digitized version that preserves the layout of the published volumes. In the first case, the revised entry is represented as one merged entry (Target) that incorporates data from Source (entry published in an earlier volume) and Revision (entry published as addendum in later or supplementary volumes). As neither Source no Revision presents the correct content of the entry in full, the TEI-based representation of the Target should be generated. Besides that, advanced users may have access to the history of changes made by editors and to deleted entries. We use the critical apparatus module of TEI to track the history of changes, in which the lemma contains a “preferred”, corrected reading and another reading corresponds to the content provided in earlier volumes. Taking the perspective of the retro-digitized version, Source and Revision are two separate entries with different metadata. Nevertheless, these two entries are linked to each other using the reference tags. Taken as a whole, the proposed schema outlines the principles for documenting the genetic relationships between different versions of edited lexicographic material.
Adjunct role labeling for Russian
2021 · CHAPTER · en
Задача разметки семантических ролей (semantic role labeling, SRL), как правило, строится вокруг иденти фикации и классификации ядерных, обязательных аргументов предиката. Сирконстанты времени, места и т. п. (неядерные, модифицирующие аргументы предиката) вытеснены на периферию [30] и даже признаются составляющими самую простую часть задачи [44]. Вместе с тем, они глубоко интегрированы в структуру клаузы и могут нетривиально взаимодействовать со значением глагола [4, 32]. В этой статье мы представля ем эксперименты по определению роли сирконстантов МЕСТА, ВРЕМЕНИ, ОБРАЗА ДЕЙСТВИЯ, СТЕПЕ НИ, ПРИЧИНЫ и ЦЕЛИ, на основе аннотированного вручную набора данных AdjunctsFrameBank. Модель на основе признаков word2vec репрезентаций сирконстантов и предикатов и морфосинтаксического оформ ления сирконстантов показывает среднюю F1меру 0,94 на данных, в которых вручную размечены границы предикатов, актантов и сирконстантов. Наши результаты в целом подтверждают теоретические предполо жения о структурной и семантической автономии и лексикоморфосинтаксической специализации адъюнк тов. Тем не менее, обнаруживается более сложная организация их структуры, что указывает на разнообразие адъюнктов с точки зрения их распределения и поведения.
An HMM-based PoS tagger for Old Church Slavonic
2021 · ARTICLE · en
We present a hybrid HMM-based PoS tagger for Old Church Slavonic. The training corpus is a portion of one text, Codex Marianus (40k) annotated with the Universal Dependencies UPOS tags in the UD-PROIEL treebank. We perform a number of experiments in within-domain and out-of-domain settings, in which the remaining part of Codex Marianus serves as a within-domain test set, and Kiev Folia is used as an out-of- domain test set. Analysing by-PoS-class precision and sensitivity in each run, we combine a simple context-free n-gram-based approach and Hidden Markov method (HMM), and added linguistic rules for specific cases such as punctuation and digits. While the model achieves a rather non-impressive accuracy of 81% in in-domain settings, we observe an accuracy of 51% in out-of-domain evaluation, which is comparable to the results of large neural architectures based on pre-trained contextual embeddings.
Verb rhyme in Russian Poetry: a quantitative analysis
2020 · ARTICLE · en
Статья представляет корпусное исследование русской глагольной рифмы и связанных с ней диахронических тенденций в русской поэтической традиции с 1800-х до 1960-х гг. До сих пор рифма исследовалась преимущественно с позиции фонетики, тогда как грамматические факторы учитывались недостаточно. Между тем морфология языка также влияет на эвфонию рифмы из-за регулярности аффиксов. Наше исследование проведено на материале Поэтического корпуса Национального корпуса русского языка. Для количественного анализа была создана база данных, содержащая дополненную разметку стиховедческих и лингвистических признаков, в том числе разметку рифмованных пар и цепочек, уточненные леммы и грамматические признаки. Результаты показывают, что авторы по-разному экспериментировали с глагольной рифмой в разные периоды. Несмотря на представление о неэстетичности глагольной рифмы, бытующее еще со времен А. Кантемира, ее употребительность в исторической перспективе носит волнообразный характер, выделяются периоды подъема и спада. Мы выделяем два класса рифмованных пар: сочетания двух глагольных форм и морфологически гетерогенные сочетания глагольной словоформы со словом другой части речи. Мы приходим к выводу, что внутри глагольной рифмы обнаруживаются ограничения в основном на сочетания форм прошедшего времени и инфинитива. Вместе с тем, рифмование индикативных форм и морфологически гетерогенные рифмы используются более свободно.
Русский Конструктикон: новый лингвистический ресурс, его устройство и специфика
2020 · CHAPTER · ru
Русский Конструктикон представляет собой новый электронный лингвистический ресурс по конструкциям современного русского языка — базу данных, которая на сегодняшний день содержит более 2200 единиц. Примерами таких конструкций являются NP-Nom так и не VP (Он так и не женился), NP-Nom возьми и VP-Imper (A oн возьми и купи новую машину!), NP-Gen бы (Чаю бы!) и др. Каждая конструкция сопровождается толкованием, семантическими, синтаксическими и стилистическими пометами, а также примерами из Национального корпуса русского языка (НКРЯ; подробнее о структуре словарной статьи см. [Janda et al. 2018]). Ресурс является бесплатным и находится в открытом доступе.
Русский Конструктикон: новый лингвистический ресурс, его устройство и специфика
2020 · CHAPTER · ru
Русский Конструктикон представляет собой новый электронный лингвистический ресурс по конструкциям современного русского языка — базу данных, которая на сегодняшний день содержит более 2200 единиц. Примерами таких конструкций являются NP-Nom так и не VP (Он так и не женился), NP-Nom возьми и VP-Imper (A oн возьми и купи новую машину!), NP-Gen бы (Чаю бы!) и др. Каждая конструкция сопровождается толкованием, семантическими, синтаксическими и стилистическими пометами, а также примерами из Национального корпуса русского языка (НКРЯ; подробнее о структуре словарной статьи см. [Janda et al. 2018]). Ресурс является бесплатным и находится в открытом доступе.
Курсы (12)
-
Computer Tools for Linguistic Research · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Нижний Новгород · Анг
-
Научно-исследовательский семинар "Анализ и визуализация текстовых данных" · 3 раза
2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
-
Научно-исследовательский семинар «Интерпретация лингвистических явлений в больших языковых моделях»
2025/2026 · Бакалавриат · рус
-
Fundamentals of Corpus Research
2025/2026 · Магистратура / Маго-лего · Анг
-
Программирование и лингвистические данные · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Теоретическая и прикладная лексикография · 4 раза
2025/2026, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Корпусная лингвистика · 3 раза
2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
-
Мастер-классы
2024/2025 · Магистратура · рус
-
Научно-исследовательский семинар "Нейросетевое моделирование длинных языковых единиц"
2024/2025 · Бакалавриат · рус
-
Дополнительные главы корпусной лингвистики
2023/2024 · Магистратура / Маго-лего · рус
-
Анализ и визуализация текстовых данных
2022/2023 · Магистратура · рус
-
Научно-исследовательский семинар "Корпусная лингвистика и изучение иностранных языков"
2022/2023 · Нижний Новгород · рус