DSA Faculty
API
← к списку преподавателей

Лобанова Полина Александровна

Институт статистических исследований и экономики знаний

Публикаций
22
Языков
2
Наград
4
Конференций
0
Профиль Публикации (22) Курсы (0)

Профессиональные интересы

стратегическая аналитикатренд-споттингтренд-анализтекст-майнингавтоматическая обработка текстаконтент-анализсемантический анализмашинное обучениеанализ больших данныхметодология анализа данныхкластерный анализцифровая экономикаметоды анализа социологической информациивизуализация данных

Должности

  • Заведующий отделомИнститут статистических исследований и экономики знаний, Отдел информационно-аналитических систем

Био

  • · Начала работать в НИУ ВШЭ в 2017 году.

Образование

  • 2017 · Магистратура: Национальный исследовательский университет "Высшая школа экономики", факультет: Факультет социальных наук, специальность «Социология», квалификация «Магистр»
  • 2015 · Бакалавриат: Национальный исследовательский университет "Высшая школа экономики", факультет: Факультет социальных наук, специальность «Социология», квалификация «Бакалавр»

Награды и поощрения

  • · Благодарность первого проректора НИУ ВШЭ (апрель 2025)
  • · Благодарность Института статистических исследований и экономики знаний НИУ ВШЭ (март 2022)
  • · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2025–2026)
  • · Группа высокого профессионального потенциала (кадровый резерв НИУ ВШЭ)Категория "Новые исследователи" (2022–2023)

Гранты и проекты

  • 2022 · Осенью 2022 года Центр стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ в рамках деятельности НЦМУ «Центр междисциплинарных исследований человеческого потенциала» провел серию из трех вебинаров, под разным углом представляющих исследование человеческого капитала на основе интеллектуального анализа больших данных. Спикеры поделились опытом работы с большими данными на разных языках, в том числе китайском, а также продемонстрировали широкий функциональный спектр системы iFORA через призму исследования человеческого капитала и его составляющих.

Идентификаторы исследователя

  • ORCID: 0000-0002-9878-9390
  • ResearcherID: W-4562-2017
  • Scopus AuthorID: 57383912600

Публикации (22)

Картирование медицинской науки: результаты интеллектуального анализа больших данных

2026 · ARTICLE · ru

Цель исследования. Анализ актуальной глобальной повестки в медицинской науке. Материал и методы. В статье предлагается подход к построению медицинского исследовательского ландшафта на основе семантического анализа и картирования медицинских тематик с помощью системы интеллектуального анализа больших данных iFORA. Для этого была проведена векторизация 2252 тематик из англоязычных статей, опубликованных в 2024 г., относящихся к сфере медицины, эмбеддинги были получены с помощью модели Jina (jina-embeddings-v3). Результаты. В рамках проведенного исследования была картирована научно-технологическая повестка мировой медицинской науки, которая охватывает 25 тематических кластеров. Были выделены самостоятельные кластеры, посвященные технологиям диагностики, лечения и профилактики заболеваний, кластеры, связанные с отдельными нозологиями, системами и комплексами в организме, платформенными направлениями в сфере наук о жизни, а также кластеры в области организации и политики здравоохранения, цифровизации, фармацевтики и смежных с медициной областей. В статье также приведены наиболее значимые тематики в каждом кластере с учетом их упоминаемости в научной литературе за 2024 г. Заключение. Понимание глобальной повестки в медицинской науке и наиболее актуальных технологических трендов является ключом к развитию инновационных технологий в этой сфере. Результаты исследования могут стать информационной основой для выбора приоритетов и фокусировки мер поддержки развития науки и технологий в области медицины.

Identifying and Visualizing Trends in Science, Technology, and Innovation Using SciBERT

2024 · ARTICLE · en

Identification of science, technology, and innovation trends is a critical topic both for the scientific community and for companies that develop technologies, work on science and technology policy or invest in high tech. In this research authors demonstrate a novel approach implemented in iFORA system (developed by National Research University Higher School of Economics) using the SciBERT. The aim of this article is to determine the capabilities of modern text mining with a focus on the possibility of using them to construct understandable and easy to grasp visualizations. The article determines that the current level of modern language models development can be used for trendspotting. In the result, authors show the ways to present the conclusions of trendspotting in the form of a simple visualization: The trend-matrix with the distribution of the key 100 trends of the analyzed areas in four corners formed by the intersection of the axes “total amount of research papers” and “mean publication year of research papers”. The approach is critical for policy makers, high tech companies, researchers, and consultants and helps to improve both the objectivity of the trendspotting and its practical applicability for management of science and technology.

Identifying emerging trends and hot topics through intelligent data mining: the case of clinical psychology and psychotherapy

2024 · ARTICLE · en

Purpose The purpose of the paper is to present an integrated methodology for identifying trends in a particular subject area based on a combination of advanced text mining and expert methods. The authors aim to test it in an area of clinical psychology and psychotherapy in 2010–2019. Design/methodology/approach The authors demonstrate the way of applying text-mining and the Word2Vec model to identify hot topics (HT) and emerging trends (ET) in clinical psychology and psychotherapy. The analysis of 11.3 million scientific publications in the Microsoft Academic Graph database revealed the most rapidly growing clinical psychology and psychotherapy terms – those with the largest increase in the number of publications reflecting real or potential trends. Findings The proposed approach allows one to identify HT and ET for the six thematic clusters related to mental disorders, symptoms, pharmacology, psychotherapy, treatment techniques and important psychological skills. Practical implications The developed methodology allows one to see the broad picture of the most dynamic research areas in the field of clinical psychology and psychotherapy in 2010–2019. For clinicians, who are often overwhelmed by practical work, this map of the current research can help identify the areas worthy of further attention to improve the effectiveness of their clinical work. This methodology might be applied for the identification of trends in any other subject area by taking into account its specificity. Originality/value The paper demonstrates the value of the advanced text-mining approach for understanding trends in a subject area. To the best of the authors’ knowledge, for the first time, text-mining and the Word2Vec model have been applied to identifying trends in the field of clinical psychology and psychotherapy.

Научно-техническая политика: семантический атлас

2023 · BOOK · ru

Издание подготовлено с использованием системы интеллектуального анализа больших данных iFORA, разработанной Институтом статистических исследований и экономики знаний Национального исследовательского университета «Высшая школа экономики». Рассмотрены ключевые направления научно-технической политики в России и в мире, включая: стратегическое управление, регулирование науки, финансирование, развитие кадрового потенциала и инфраструктуры, кооперации с бизнесом и взаимодействия с обществом. Источниками информации послужили российские и международные документы научно-технической политики за период 2016–2022 гг.

Форсайт: методы и практики

2023 · BOOK · ru

В издании представлен обзор методов, наиболее активно используемых в российских и зарубежных форсайт-проектах в последние годы. Обзор подготовлен с учетом материалов международных организаций и опыта ведущих мировых форсайт-центров, результатов библиометрического анализа публикаций по данной тематике за последние десять лет, а также с опорой на собственный исследовательский и практический опыт Института статистических исследований и экономики знаний Национального исследовательского университета «Высшая школа экономики» (кейсы применения методов в российских проектах представлены в основном работами Института).

Тренды трансформации образования и рынка труда: семантический атлас

2023 · BOOK · ru

Издание посвящено трендам развития образования, рынка труда, науки и технологий в России и мире. Материалы подготовлены с использованием Системы интеллектуального анализа больших данных iFORA, разработанной в Институте статистических исследований и экономики знаний Национального исследовательского университета «Высшая школа экономики». Источниками данных послужили более 350 млн документов, опубликованных в 2010–2022 гг., включая научные статьи, информацию о научных грантах, стратегические и аналитические материалы, обзоры рынков, отраслевую периодику социально-экономической и научно-технологической направленности. Публикация представляет интерес для специалистов в области экономики образования и науки, сотрудников образовательных организаций и органов управления, HR-менеджеров, студентов и аспирантов.

Сентимент-анализ как метод исследования информационной повестки и общественного мнения (на примере СМИ и социальных сетей КНР)

2023 · ARTICLE · ru

Информационная повестка, транслируемая китайскими медиаресурсами, является источником актуальных данных о мнении общества в отношении ключевых вопросов социального благосостояния. Вследствие технических особенностей организации китайских веб-сайтов и необходимости привлечения дополнительных ресурсов для автоматической обработки (парсинга) текстов на китайском языке, данная тематика не представлена достаточно широко в отечественных и зарубежных исследованиях. Целью настоящей работы является демонстрация методологии и результатов оценки общественного мнения на примере данных, собранных из китайских СМИ и социальных сетей, на основе обученной модели сентимент-анализа текстовых данных на китайском языке. При помощи ML-модели был проведен сравнительный анализ контента на китайском языке по проблематике развития городской инфраструктуры за период 2020–2022 гг. Результаты представлены в формате диаграмм распределения сентимента на основе данных СМИ и социальных сетей по месяцам за 2-летний период. Выявлено, что уровень сентимента значительно отличается в зависимости от типа источника данных. Определено устойчивое преобладание позитивного сентимента в СМИ и негативного – в социальных сетях, что может объясняться различиями в составе авторов текстов, ограничениями, накладываемыми на публикуемый в источниках контент, а также разными целями использования ресурсов пользователями.

Trend Detection Using NLP as a Mechanism of Decision Support

2023 · ARTICLE · en

The purpose of this article is to present the principles of a developed algorithm for identifying trends based on the analysis of big text data and presenting the result in formats that are convenient for decision makers to be implemented in the iFORA Big Data Mining System. The paper provides an overview of existing text analytics algorithms; outlines the mathematical basis for identifying terms that mean trends, which is proposed and tested for dozens of implemented projects; describes approaches to clustering terms based on their vectors in the Word2vec space; and provides examples of two key visualizations (semantic, trend maps) that outline the range of topics and trends that characterize a particular area of study, as a way to adapt the results of the analysis to the tasks of decision makers. The limitations and advantages of using the proposed approach for decision support are discussed, and directions for future research are suggested.

The Russian forest industry: declining wood production and emerging opportunities in bioenergy

2022 · ARTICLE · en

The aim of the study is to describe the main trends and possibilities in Russian forestry. Based on statistical data, the authors analyze general trends in the Russian forest industry like woodworking, roundwood and wood pellets production. Russia’s output of roundwood, sawnwood, wood pellets, wood-based panels and veneer sheets has been growing steadily over the past 5 years. The production of only two wood-based panel types – hardboard and other fibreboard – is either absent or in decline. The results include decline in roundwood export and the growth rates in wood pellets, sawnwood, wood-based panels, and veneer sheets exports. The Russian forest industry has room to grow its export of forest products. This requires technology upgrading, which could be facilitated by proactive government policies.

Выявление трендов с помощью NLP как механизм поддержки принятия решений

2022 · ARTICLE · ru

В статье изложены принципы разработанного алгоритма выявления трендов на основе анализа больших текстовых данных и представления результата в удобных для лиц принимающих решения (ЛПР) форматах, реализованных в системе интеллектуального анализа больших данных iFORA. Дается обзор существующих алгоритмов текстовой аналитики. Излагается предлагаемая и апробированная на десятках реализованных проектов математическая основа для выявления терминов, означающих тренды. Описываются подходы к кластеризации терминов на основе их векторов в пространстве Word2vec. Приводятся примеры двух ключевых визуализаций (семантические, тренд-карты), дающих представление о круге тем и трендах, характеризующих конкретную исследуемую область, как способ адаптации результатов анализа к задачам ЛПР. Обсуждаются ограничения и преимущества использования предложенного подхода для поддержки принятия решений, предлагаются направления для будущих исследований.

Курсы (0)

Нет курсов.