Ляшевская Ольга Николаевна
Факультет гуманитарных наук
Профессиональные интересы
Должности
- Профессор — Факультет гуманитарных наук, Школа лингвистики
Био
- · Начала работать в НИУ ВШЭ в 2011 году.
- · Научно-педагогический стаж: 28 лет.
Образование
- 1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
- 1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
- 1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»
Опыт работы
- · 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
- · 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
- · 2010–2011: : førsteamanuensis (Associate Professor)
- · 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
- · 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
- · 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
- · 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
- · 1997–2001: : преподаватель русского языка как иностранного
- · 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
- · 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ
Награды и поощрения
- · Благодарность проректора НИУ ВШЭ (июль 2025)
- · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
- · Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
- · Благодарность проректора НИУ ВШЭ (ноябрь 2021)
- · Благодарность Высшей школы экономики (январь 2017)
- · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
- · Надбавка за академическую работу (2016–2017)
- · Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
- · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
- · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
- · Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
- · Лучший преподаватель — 2019, 2017, 2013
Гранты и проекты
- — · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
- 2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
- — · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
- 2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
- 2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
- 2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
- 2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
- 2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
- 2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
- 2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- — · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- 2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
- 2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
- 2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)
Конференции (30)
Показать все
- · 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
- · 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
- · 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
- · 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
- · 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
- · 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
- · 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
- · 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
- · 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
- · 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
- · 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
- · 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
- · 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
- · 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
- · 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
- · 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
- · 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
- · 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
- · 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
- · 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
- · 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios
Идентификаторы исследователя
- ORCID:
0000-0001-8374-423X - ResearcherID:
E-8855-2014 - SPIN РИНЦ:
6340-5599 - Google Scholar: https://scholar.google.ru/citations?user=5XzprO8AAAAJ&hl=ru
- Scopus AuthorID:
37090988800
Публикации (116)
Семантические фильтры для разрешения многозначности в национальном корпусе русского языка: глаголы
2008 · CHAPTER · ru
В статье обсуждаются результаты эксперимента по разработке системы семантических фильтров глаголов, используемых для разрешения неоднозначности лексико-семантической разметки в Национальном корпусе русского языка. Основные задачи эксперимента: проверить, в какой степени можно использовать специализированные лексикографические источники для создания таких фильтров (в качестве основного источника использовался словарь глагольного управления [Апресян-Палл 1982]); какие ограничения на актанты (семантические, лексические, грамматические) наиболее значимы для фильтров.
Statistical Word Sense Disambiguation in Contexts for Russian Nouns Denoting Physical Objects
2008 · ARTICLE · en
The paper presents experimental results on automatic word sense disambiguation (WSD). Contexts for polysemous and/or homonymic Russian nouns denoting physical objects serve as an empirical basis of the study. Sets of contexts were extracted from the Russian National Corpus (RNC). Machine learning software for WSD was developed within the framework of the project. WSD tool used in experiments is aimed at statistical processing and classification of noun contexts. WSD procedure was performed taking into account lexical markers of word meanings in contexts and semantic annotation of contexts. Sets of experi- ments allowed to define optimal conditions for WSD in Russian texts.
К проблеме лемматизации несловарных слов
2007 · CHAPTER · ru
В работе дается оценка алгоритма лемматизации несловарных словоформ (единиц текста, которые словарно-ориентированный морфологический анализатор не может вывести из данных исходного словаря). Представленный алгоритм устанавливает парадигматические отношения внутри массива словоформ, подбирая оптимальное членение словоформы на псевдооснову и псевдоокончание. Показано, что соединение методов простой и сложной кластеризации эффективно для морфологического пост–процессинга больших объемов текста.
О частотном словаре Национального корпуса русского языка
2007 · CHAPTER · ru
Обосновывается необходимость создания частотного словаря современного русского языка; дается проспект словаря.
Автоматизация построения словаря на материале массива несловарных словоформ
2007 · CHAPTER · ru
Несловарные формы - единицы текста, отсутствующие в словаре программы морфологического анализа - представляют проблему как для морфологического парсинга текста, так и для создания словарей, основанных на текстовых корпусах. Оценка эффективности алгоритма построения кластеров несловарных слов проводилась на материале словника Национального корпуса русского языка и набора данных "База словоформ Яндекса".
Семантика русского числа
2004 · BOOK · ru
В монографии исследуются закономерности употребления форм единственного и множественного числа имен существительных в тексте (на материале современного русского языка) и на этой основе демонстрируется широкая картина семантических противопоставлений внутри субстантивной категории числа. Анализируется предсказуемость числового поведения существительных и предлагаются правила, опирающиеся, прежде всего, на информацию о семантических свойствах слова (таксономический класс, способ концептуализации обозначаемых объектов). Книга предназначена для лингвистов-русистов, специалистов в области морфологии, семантики и автоматического анализа текста, для студентов и преподавателей русского языка как иностранного.
Курсы (12)
-
Computer Tools for Linguistic Research · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Нижний Новгород · Анг
-
Научно-исследовательский семинар "Анализ и визуализация текстовых данных" · 3 раза
2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
-
Научно-исследовательский семинар «Интерпретация лингвистических явлений в больших языковых моделях»
2025/2026 · Бакалавриат · рус
-
Fundamentals of Corpus Research
2025/2026 · Магистратура / Маго-лего · Анг
-
Программирование и лингвистические данные · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Теоретическая и прикладная лексикография · 4 раза
2025/2026, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Корпусная лингвистика · 3 раза
2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
-
Мастер-классы
2024/2025 · Магистратура · рус
-
Научно-исследовательский семинар "Нейросетевое моделирование длинных языковых единиц"
2024/2025 · Бакалавриат · рус
-
Дополнительные главы корпусной лингвистики
2023/2024 · Магистратура / Маго-лего · рус
-
Анализ и визуализация текстовых данных
2022/2023 · Магистратура · рус
-
Научно-исследовательский семинар "Корпусная лингвистика и изучение иностранных языков"
2022/2023 · Нижний Новгород · рус