Ляшевская Ольга Николаевна
Факультет гуманитарных наук
Профессиональные интересы
Должности
- Профессор — Факультет гуманитарных наук, Школа лингвистики
Био
- · Начала работать в НИУ ВШЭ в 2011 году.
- · Научно-педагогический стаж: 28 лет.
Образование
- 1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
- 1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
- 1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»
Опыт работы
- · 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
- · 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
- · 2010–2011: : førsteamanuensis (Associate Professor)
- · 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
- · 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
- · 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
- · 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
- · 1997–2001: : преподаватель русского языка как иностранного
- · 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
- · 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ
Награды и поощрения
- · Благодарность проректора НИУ ВШЭ (июль 2025)
- · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
- · Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
- · Благодарность проректора НИУ ВШЭ (ноябрь 2021)
- · Благодарность Высшей школы экономики (январь 2017)
- · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
- · Надбавка за академическую работу (2016–2017)
- · Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
- · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
- · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
- · Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
- · Лучший преподаватель — 2019, 2017, 2013
Гранты и проекты
- — · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
- 2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
- — · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
- 2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
- 2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
- 2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
- 2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
- 2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
- 2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
- 2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
- 2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- — · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
- 2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
- 2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
- 2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)
Конференции (30)
Показать все
- · 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
- · 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
- · 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
- · 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
- · 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
- · 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
- · 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
- · 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
- · 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
- · 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
- · 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
- · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
- · 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
- · 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
- · 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
- · 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
- · 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
- · 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
- · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
- · 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
- · 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
- · 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
- · 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
- · 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios
Идентификаторы исследователя
- ORCID:
0000-0001-8374-423X - ResearcherID:
E-8855-2014 - SPIN РИНЦ:
6340-5599 - Google Scholar: https://scholar.google.ru/citations?user=5XzprO8AAAAJ&hl=ru
- Scopus AuthorID:
37090988800
Публикации (116)
О задачах и методах словообразовательной разметки в корпусе текстов (Word-formation annotation of the Russian National Corpus – aims and methods)
2009 · ARTICLE · ru
Русский Фреймнет: к задаче создания корпусного словаря конструкций
2009 · CHAPTER · ru
В российской компьютерной лингвистике до сих пор нет ресурсов, аналогичных FrameNet, VerbNet и PropBank, в которых можно было бы получить иллюстрации глагольного и именного управления, а также периферийных лексически ориентированных конструкций. В работе описываются задачи создания и структура FrameNet-ориентированной системы, предназначенной для исследования морфологических, синтаксических, семантических и лексических ограничений в русских конструкциях.
Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)
2009 · BOOK · ru
Частотный словарь содержит сведения о наиболее употребительных словах современного русского языка. Он создан на основе Национального корпуса русского языка, авторитетного и представительного электронного ресурса. Подкорпус 1950-2007 гг. объемом 92 млн. словоупотреблений включает тексты художественной литературы, средств массовой информации, технические, деловые документы и т.д., а также записи разговорной речи. Словарь представляет разнообразную статистическую информацию для 50 тыс. слов общей лексики и 3 тыс. имен собственных и аббревиатур. Приводятся частотные списки лексики, характерной для публицистики, устной речи и других функциональных жанров, а также списки наиболее употребительных существительных, прилагательных, глаголов и слов других частей речи. Частотный словарь может быть использован в различных приложениях, таких как обучение русскому языку как родному и иностранному, лингвистические исследования, создание русских одноязычных и двуязычных словарей, информационный поиск, обнаружение спама, проверка орфографии и т.д.
Инкорпорация и экскорпорация в глагольном управлении: имена частей тела
2008 · CHAPTER · ru
Рассматриваются конструкции с инкорпорированным актантом и условия его проявления в тексте.
Топологические классы имен в семантической разметке Национального корпуса русского языка
2008 · CHAPTER · ru
Предлагается предварительная классификация лексики по топологическим типам (в модели Л.Талми и Е.В.Рахилиной).
Конструкция с творительным формы «X Y-ом»
2008 · CHAPTER · ru
В работе проводится исследование семантики русской конструкции с творительным формы типа хвост кольцом, сложить губки бантиком. Пространственная семантика конструкции описывается в терминах топологических классов (Talmy 2000, Рахилина 2000): анализируются явления совпадения топологических классов и их взаимной аккомодации.
Эксперименты по статистическому разрешению лексико-семантической неоднозначности русских имен существительных в корпусе
2008 · CHAPTER · ru
С помощью компьютерного инструмента автоматического разрешения лексико-семантической неоднозначности слов в контекстах НКРЯ проведены эксперименты а) с использованием не только лексической и семантической, но также и грамматической информации, извлекаемой из контекстов, определение наличия или отсутствия зависимости между данными критериями; б) с изменением ширины контекстного окна и с учётом границ синтагм; в) с установлением объёмов эталонных выборок пропорционально долям контекстов для разных значений в экспериментальной выборке. Обсуждаемые эксперименты направлены на оценку эффективности разрешения неоднозначности с более гибкими параметрами и в условиях недостаточности исходных обучающих данных.
Статистическое разрешение лексико-семантической неоднозначности в контекстах для предметных имён существительных
2008 · CHAPTER · ru
В докладе обсуждаются результаты экспериментов по автоматизации процесса разрешения лексико-семантической неоднозначности слов. Эмпирическим материалом исследования являются примеры употребления предметных имён, извлечённые из Национального корпуса русского языка. Оцениваются оптимальные условия разрешения неоднозначности с учётом двух факторов: лексического наполнения контекстов и лексико-семантической разметки контекстов.
Частотный словарь Национального корпуса русского языка: концепция и технология создания
2008 · CHAPTER · ru
Словарь содержит представительный базовый словник современного русского языка (2-я половина XX – начало XXI вв.), снабженный информацией о частотности употребления, статистическом распределении по текстам и жанрам, по времени создания текстов. Словарь основан на текстах Национального корпуса русского языка объемом 100 млн. словоупотреблении.
Semantic Annotation Layer in Russian National Corpus: Lexical Classes of Nouns and Adjectives
2008 · CHAPTER · en
Описаны правила разрешения лексико-семантической омонимии для имен существительных и прилагательных.
Курсы (12)
-
Computer Tools for Linguistic Research · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Нижний Новгород · Анг
-
Научно-исследовательский семинар "Анализ и визуализация текстовых данных" · 3 раза
2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
-
Научно-исследовательский семинар «Интерпретация лингвистических явлений в больших языковых моделях»
2025/2026 · Бакалавриат · рус
-
Fundamentals of Corpus Research
2025/2026 · Магистратура / Маго-лего · Анг
-
Программирование и лингвистические данные · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Теоретическая и прикладная лексикография · 4 раза
2025/2026, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
-
Корпусная лингвистика · 3 раза
2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
-
Мастер-классы
2024/2025 · Магистратура · рус
-
Научно-исследовательский семинар "Нейросетевое моделирование длинных языковых единиц"
2024/2025 · Бакалавриат · рус
-
Дополнительные главы корпусной лингвистики
2023/2024 · Магистратура / Маго-лего · рус
-
Анализ и визуализация текстовых данных
2022/2023 · Магистратура · рус
-
Научно-исследовательский семинар "Корпусная лингвистика и изучение иностранных языков"
2022/2023 · Нижний Новгород · рус