DSA Faculty
API
← к списку преподавателей

Сабидаева Елизавета Алексеевна

Институт статистических исследований и экономики знаний

Публикаций
7
Языков
3
Наград
2
Конференций
0
Профиль Публикации (7) Курсы (0)

Профессиональные интересы

анализ данных

Должности

  • Ведущий экспертИнститут статистических исследований и экономики знаний, Отдел информационно-аналитических систем
  • Стажер-исследовательИнститут статистических исследований и экономики знаний, Отдел информационно-аналитических систем

Био

  • · Начала работать в НИУ ВШЭ в 2021 году.

Образование

  • 2021 · Магистратура: Национальный исследовательский университет "Высшая школа экономики", специальность «Международные отношения», квалификация «Магистр»
  • 2019 · Бакалавриат: Иркутский государственный университет, специальность «Лингвистика», квалификация «Бакалавр»

Опыт работы

  • · -

Награды и поощрения

  • · Благодарность Института статистических исследований и экономики знаний НИУ ВШЭ (апрель 2025)
  • · Группа высокого профессионального потенциала (кадровый резерв НИУ ВШЭ)Категория "Новые исследователи" (2025–2026)

Идентификаторы исследователя

  • ORCID: 0000-0001-9115-2285

Публикации (7)

Картирование медицинской науки: результаты интеллектуального анализа больших данных

2026 · ARTICLE · ru

Цель исследования. Анализ актуальной глобальной повестки в медицинской науке. Материал и методы. В статье предлагается подход к построению медицинского исследовательского ландшафта на основе семантического анализа и картирования медицинских тематик с помощью системы интеллектуального анализа больших данных iFORA. Для этого была проведена векторизация 2252 тематик из англоязычных статей, опубликованных в 2024 г., относящихся к сфере медицины, эмбеддинги были получены с помощью модели Jina (jina-embeddings-v3). Результаты. В рамках проведенного исследования была картирована научно-технологическая повестка мировой медицинской науки, которая охватывает 25 тематических кластеров. Были выделены самостоятельные кластеры, посвященные технологиям диагностики, лечения и профилактики заболеваний, кластеры, связанные с отдельными нозологиями, системами и комплексами в организме, платформенными направлениями в сфере наук о жизни, а также кластеры в области организации и политики здравоохранения, цифровизации, фармацевтики и смежных с медициной областей. В статье также приведены наиболее значимые тематики в каждом кластере с учетом их упоминаемости в научной литературе за 2024 г. Заключение. Понимание глобальной повестки в медицинской науке и наиболее актуальных технологических трендов является ключом к развитию инновационных технологий в этой сфере. Результаты исследования могут стать информационной основой для выбора приоритетов и фокусировки мер поддержки развития науки и технологий в области медицины.

Comparative Study of LoRA and Full Fine-Tuning in Large Language Models

2025 · CHAPTER · en

Substantive Criteria for Referring Statements from Texts to Events and Factors

2025 · ARTICLE · en

The purpose of this paper is to advance and automate language models for extracting statements related to events and factors from text documents using the designed linguistic marker system. The paper presents the outcomes of text-mining models of events and factors extraction approbation on the example of analytical research in human potential, social sciences and humanities. The testing and evaluation of the used linguistic models are performed on the basis of the results comparison obtained in automatic mode, in manual mode (with the participation of expert-analytical validation) and semi-automatic mode (using the implemented system of linguistic markers). The introduced approaches resulted in higher performance in extracting statements containing events and factors.

Содержательные критерии отнесения утверждений из текстов к категориям «события» и «факторы»

2024 · ARTICLE · ru

Цель настоящей работы - совершенствование и автоматизация языковых моделей извлечения из текстовых документов утверждений, связанных с событиями и факторами, с использованием разработанной системы лингвистических маркеров. В статье приведены результаты апробации тексг-майнинговых моделей извлечения событий и факторов на примере аналитического исследования в сфере человеческого потенциала, социальных и гуманитарных наук. Тестирования и оценка качества моделей реализованы на основе сопоставления результатов, получаемых в автоматическом режиме, в ручном режиме (при экспертно-аналитической валидации) и полуавтоматическом режиме (с использованием системы лингвистических маркеров). В результате внедренных подходов повысилось качество извлечения утверждений, содержащих события и факторы.

Сентимент-анализ как метод исследования информационной повестки и общественного мнения (на примере СМИ и социальных сетей КНР)

2023 · ARTICLE · ru

Информационная повестка, транслируемая китайскими медиаресурсами, является источником актуальных данных о мнении общества в отношении ключевых вопросов социального благосостояния. Вследствие технических особенностей организации китайских веб-сайтов и необходимости привлечения дополнительных ресурсов для автоматической обработки (парсинга) текстов на китайском языке, данная тематика не представлена достаточно широко в отечественных и зарубежных исследованиях. Целью настоящей работы является демонстрация методологии и результатов оценки общественного мнения на примере данных, собранных из китайских СМИ и социальных сетей, на основе обученной модели сентимент-анализа текстовых данных на китайском языке. При помощи ML-модели был проведен сравнительный анализ контента на китайском языке по проблематике развития городской инфраструктуры за период 2020–2022 гг. Результаты представлены в формате диаграмм распределения сентимента на основе данных СМИ и социальных сетей по месяцам за 2-летний период. Выявлено, что уровень сентимента значительно отличается в зависимости от типа источника данных. Определено устойчивое преобладание позитивного сентимента в СМИ и негативного – в социальных сетях, что может объясняться различиями в составе авторов текстов, ограничениями, накладываемыми на публикуемый в источниках контент, а также разными целями использования ресурсов пользователями.

Trend Detection Using NLP as a Mechanism of Decision Support

2023 · ARTICLE · en

The purpose of this article is to present the principles of a developed algorithm for identifying trends based on the analysis of big text data and presenting the result in formats that are convenient for decision makers to be implemented in the iFORA Big Data Mining System. The paper provides an overview of existing text analytics algorithms; outlines the mathematical basis for identifying terms that mean trends, which is proposed and tested for dozens of implemented projects; describes approaches to clustering terms based on their vectors in the Word2vec space; and provides examples of two key visualizations (semantic, trend maps) that outline the range of topics and trends that characterize a particular area of study, as a way to adapt the results of the analysis to the tasks of decision makers. The limitations and advantages of using the proposed approach for decision support are discussed, and directions for future research are suggested.

Выявление трендов с помощью NLP как механизм поддержки принятия решений

2022 · ARTICLE · ru

В статье изложены принципы разработанного алгоритма выявления трендов на основе анализа больших текстовых данных и представления результата в удобных для лиц принимающих решения (ЛПР) форматах, реализованных в системе интеллектуального анализа больших данных iFORA. Дается обзор существующих алгоритмов текстовой аналитики. Излагается предлагаемая и апробированная на десятках реализованных проектов математическая основа для выявления терминов, означающих тренды. Описываются подходы к кластеризации терминов на основе их векторов в пространстве Word2vec. Приводятся примеры двух ключевых визуализаций (семантические, тренд-карты), дающих представление о круге тем и трендах, характеризующих конкретную исследуемую область, как способ адаптации результатов анализа к задачам ЛПР. Обсуждаются ограничения и преимущества использования предложенного подхода для поддержки принятия решений, предлагаются направления для будущих исследований.

Курсы (0)

Нет курсов.