Клышинский Эдуард Станиславович

Московский институт электроники и математики им. А.Н. Тихонова

Профиль на hse.ru ↗ тел.: +7 (495) 772-95-90 | 15163

Публикаций

Языков

Наград

Конференций

Профиль Публикации (57) Курсы (16)

Профессиональные интересы

искусственный интеллекткомпьютерная лингвистикаметоды инженерии знанийинтеллектуальные базы знанийязыки программированиятеория формальных языков

Должности

Доцент — Московский институт электроники и математики им. А.Н. Тихонова, Департамент компьютерной инженерии
Заведующий лабораторией — Факультет гуманитарных наук, Научно-учебная лаборатория учебных корпусов
Профессор — Факультет гуманитарных наук, Школа лингвистики
Академический руководитель образовательной программы — Компьютерная лингвистика

Био

· Начал работать в НИУ ВШЭ в 2012 году.
· Научно-педагогический стаж: 28 лет.

Образование

2025 · Доктор филологических наук: Национальный исследовательский университет "Высшая школа экономики"
2003 · Ученое звание: Доцент
2000 · Кандидат наук: Московский государственный институт электроники и математики, специальность 05.13.12 «Системы автоматизации проектирования», тема диссертации: Проектирование элементов принятия решений в имитационных моделях бизнес-систем
1997 · Специалитет: Московский государственный институт электроники и математики, факультет: ФИТ, специальность «Системы автоматизированного проектирования», квалификация «Инженер-системотехник»

Опыт работы

· 1997-2000: обучение в аспирантуре
· 2000-2001: старший преподаватель кафедры ИТАС МГИЭМ
· 2001-2018: доцент МГИЭМ / МИЭМ НИУ ВШЭ
· 2018-н/в - доцент школы лингвистики ФГН НИУ ВШЭ

Награды и поощрения

· Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
· Благодарность проректора НИУ ВШЭ (ноябрь 2023)
· Благодарность факультета гуманитарных наук НИУ ВШЭ (май 2022)
· Благодарственное письмо проректора НИУ ВШЭ (ноябрь 2021)
· Персональная надбавка ректора (2017–2018)
· Надбавка за академическую работу (2016–2017, 2015–2016, 2014–2015, 2013–2014, 2012–2013)
· Лучший преподаватель — 2024–2025, 2021–2022, 2016–2019, 2014
· Лучший академический руководитель в номинации «Межфакультетское взаимодействие» — 2023

Гранты и проекты

— · на соискание учёной степени кандидата наук

Конференции (1)

Показать все

· 2021: Корпусная лингвистика 2021 (Санкт-Петербург). Доклад: Автоматическое выделение конструкций для поверхностного синтаксического анализа

Идентификаторы исследователя

ORCID: 0000-0002-4020-488X
ResearcherID: K-6534-2015
SPIN РИНЦ: 2185-5292
Google Scholar: https://scholar.google.ru/citations?user=LCFX17gAAAAJ&hl=ru&oi=ao
Scopus AuthorID: 56397131900

Публикации (57)

In Search of Lost Collocations: Combining Measures to Reach the Top Range

2017 · CHAPTER · en

The paper discusses statistical methods for collocation extraction. We test the following hypothesis: combining several methods gives a better result than applying just one. At the first stage we suggest two methods to combine MI and t-score rankings and evaluate the results on attributive and verbal collocations against the data attested in the dictionary. At the second stage, we use regression analysis to tune up coefficients that further improve the best method discovered at the first stage. These results are evaluated against native speakers’ intuition and prove our main hypothesis for most cases.

DOI ↗ PDF ↗

Параметрическая оптимизация точности морфологической разметки текстов

2016 · ARTICLE · ru

Статья знакомит читателя с базовыми понятиями параметрической оптимизации. Описывается разработанная модель аппроксимация вероятности, функции-счётчики и коэффициенты корреляции. Небольшое внимание уделено методу полного перебора, в результате работы которого достигнуты новые показатели точности. В конце приведена модификация метода снятия омонимии, разработанная авторами.

ВИЗУАЛЬНЫЙ АНАЛИЗ КЛАСТЕРНЫХ СТРУКТУР В МНОГОМЕРНЫХ ОБЪЕМАХ ТЕКСТОВОЙ ИНФОРМАЦИИ

2016 · ARTICLE · ru

Работа рассматривает вопросы визуального анализа кластерных структур в многомерных объемах текстовой информации. Для анализа кластерных структур в многомерном объеме текстовых данных используются технологии построения упругих карт, представляющие собой методы отображения точек исходного многомерного пространства на вложенные в это пространство многообразия меньшей размерности. Варьируя поверхность упругой карты за счет последовательного уменьшения коэффициентов упругости, можно добиться лучшей аппроксимации картой многомерного облака данных. Применение технологий построения упругих карт для решения задач кластерного анализа не предполагает никакой априорной информации об изучаемых данных и не зависит от их природы, происхождения и т.п. Схожими свойствами обладает близкий по идеологии вероятностный подход к снижению размерности t-SNE. Данная работа содержит описание результатов построения упругих карт и применения подхода t-SNE для визуального анализа кластерных структур в многомерных объемах текстовой информации. Для упругих карт подробно описан и проиллюстрирован прием «квази-зум», позволяющий существенно улучшить результаты в области сгущения точек изучаемого многомерного пространства. Для обоих подходов (построение упругих карт и t-SNE) показана их работоспособность и применимость для решения задач кластеризации терминов естественного языка.

PDF ↗

A tool for morphologically ambiguous text processing

2016 · CHAPTER · en

The main course of preliminary natural texts processing is tagging and disambiguating texts. Hence, most of modern language tools are specified for such purposes. In our projects, we carry out a shallow syntax of untagged texts. For this purpose we developed a new query language based on regular expressions. This language allows write queries according to words' ambiguity.

DOI ↗ PDF ↗

Подчиняются ли составные конструкции закону Ципфа?

2016 · ARTICLE · ru

Словари составных конструкций играют существенную роль при анализе текстов на естественном языке. Автоматизированное составление таких словарей позволяет сократить время на их разработку и повысить охват обрабатываемых конструкций. Наше исследование показало, что n-граммы в тексте подчиняются распределению Ципфа, однако степенной показатель распределения варьируется в широких пределах. Именно это свойство и было использовано для извлечения составных конструкций, которые, с одной стороны, позволяют получить стилистические маркеры текста, а с другой стороны, сочетания, отражающие особенности предметной области.

PDF ↗

Исследование неоднозначности употребления слов в европейских языках

2015 · PREPRINT · ru

В работе рассматривается морфологическая и синтаксическая неоднозначности употребления слов в различных европейских языках. Для этого введены типы неоднозначности, разделенные в зависимости от того, по каким параметрам может быть неоднозначно данное слово. Также в работе приведен анализ неоднозначностей, возникающих при синтаксическом анализе текста. Для такого анализа используется информация о том, где может располагаться зависимое слово относительно главного в заданной паре с фиксированными частями речи: слева, справа или в любой из позиций. Анализ показал, что распределение слов по типам неоднозначности обладает уникальной формой для каждого из языков. Полученная информация позволяет перейти к анализу проблем языковой сложности.

PDF ↗

Статистические методы снятия омонимии

2015 · ARTICLE · ru

Статья знакомит читателя со статистическими методами устранения морфологической неоднозначности. Описывается процесс насыщения, параметры методов и n-грамм. Большое внимание уделено методам снятия омонимии, в обзоре которых описания сопровождены практическими оценками и даны алгоритмы их работы. В конце приведено сравнение качества методов дизамбигуации, осуществлённое авторами.

РАСПРЕДЕЛЕНИЕ НЕОДНОЗНАЧНЫХ СЛОВ В НЕКОТОРЫХ ЕВРОПЕЙСКИХ ЯЗЫКАХ

2015 в печати · CHAPTER · ru

Результаты морфологического анализа часто неоднозначны - одно словоупотребление может быть формой нескольких разных слов с разными грамматическими параметрами. В статье рассматривается классификация типов такой неоднозначности и вероятностное распределение словоупотреблений по типам для ряда языков. Эксперименты показывают, что форма распределения различается от языка к языку, но сохраняется для корпусов разных типов, а также устойчива к изменению параметров грамматического словаря.

PDF ↗

Обзор методов визуализации многомерных данных

2014 · ARTICLE · ru

Статья знакомит читателя с базовыми понятиями научной визуализации. Описываются разработанные классификации объектных признаков, визуальных измерений и диаграмм. Большое внимание уделено методам визуализации, в обзоре которых теоретические данные сопровождены практическими примерами и даны советы по их модернизации. В конце приведён реальный пример многомерной визуализации данных, разработанный авторами.

PDF ↗

К вопросу об автоматизации проверки полноты отчетной документации

2014 · ARTICLE · ru

В статье рассматривается новый метод автоматизации определения соответствия технического задания и итогового отчета в ходе его приемки. Предложенный метод предлагает экспертам предварительную оценку степени соответствия отчета техническому заданию. Для этого используется выделение значимых фрагментов технического задания, поиск соответствующих им элементов отчета и проверка степени покрытия последнего. Разработанный метод, в отличие, например, от косинусной меры сходства, дает лучшее разделение отчетов по критерию хорошего и плохого изложением материала.

PDF ↗

Курсы (16)

SQL и noSQL базы данных · 4 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего / Пермь · рус
Интеллектуальная обработка данных · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
Математика для лингвистов · 3 раза

2025/2026, 2024/2025, 2023/2024 · Бакалавриат / Дисциплина общефакультетского пула · рус
Объектно-ориентированное программирование · 3 раза

2025/2026, 2024/2025, 2023/2024 · Бакалавриат · рус
Объектно-ориентированное программирование на языке Python · 4 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
Семинар наставника · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
Информационный поиск · 3 раза

2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
Теория формальных языков для текста и коммуникации · 3 раза

2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
Цифровая гуманитаристика

2024/2025 · Бакалавриат · рус
45.04.03. Фундаментальная и прикладная лингвистика · 2 раза

2023/2024, 2022/2023 · Магистратура · рус
Информационный поиск и базы данных · 2 раза

2022/2023, 2021/2022 · Бакалавриат · рус
Научно-исследовательский семинар "Digital Humanities"

2022/2023 · Магистратура / Пермь · рус
Нереляционные базы данных · 2 раза

2022/2023, 2021/2022 · Бакалавриат · рус
Introduction to Scientific Computing

2021/2022 · Магистратура · Анг
Основы баз данных

2021/2022 · Магистратура · рус
Программирование (язык Python)

2021/2022 · язык Python · рус