DSA Faculty
API
← к списку преподавателей

Соколов Евгений Андреевич

Факультет компьютерных наук

Профиль на hse.ru ↗ тел.: +7 (495) 772-95-90 | 27342
Публикаций
3
Языков
1
Наград
17
Конференций
0
Профиль Публикации (3) Курсы (7)

Профессиональные интересы

анализ данныхмашинное обучениеанализ и автоматическая обработка текстов

Должности

  • Руководитель департаментаФакультет компьютерных наук, Департамент больших данных и информационного поиска
  • ДоцентФакультет компьютерных наук, Департамент больших данных и информационного поиска
  • Научный руководительФакультет компьютерных наук, Центр непрерывного образования
  • ПреподавательЦентр организации обучения студентов для топ-специалистов в сфере искусственного интеллекта
  • Академический руководитель образовательной программыПрикладная математика и информатика

Био

  • · Начал работать в НИУ ВШЭ в 2016 году.
  • · Научно-педагогический стаж: 12 лет.

Образование

  • 2013 · Специалитет: Московский государственный университет им. М.В. Ломоносова, специальность «Прикладная математика и информатика», квалификация «Математик. Системный программист»

Опыт работы

  • · 2017-2019: Яндекс.Дзен, руководитель группы качества рекомендаций
  • · 2015-2017: Яндекс, Yandex Data Factory, руководитель группы анализа неструктурированных данных
  • · 2014-2015: Яндекс, Yandex Data Factory, data scientist
  • · 2013-2014: Ozon.ru, data scientist
  • · 2012-2013: Forecsys, аналитик-исследователь
  • · 2011-2012: Биоклиникум, младший исследователь

Награды и поощрения

  • · Благодарность проректора НИУ ВШЭ (ноябрь 2025)
  • · Благодарность старшего директора НИУ ВШЭ (декабрь 2024)
  • · Почетный знак II степени Высшей школы экономики (ноябрь 2024)
  • · Благодарность проректора НИУ ВШЭ (октябрь 2024)
  • · Благодарность первого проректора НИУ ВШЭ (декабрь 2023)
  • · Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
  • · Почетная грамота НИУ ВШЭ (август 2022)
  • · Благодарственное письмо проректора НИУ ВШЭ (ноябрь 2021)
  • · Благодарственное письмо проректора НИУ ВШЭ (ноябрь 2021)
  • · Благодарственное письмо ректора НИУ ВШЭ (ноябрь 2020)
  • · Благодарность Факультета компьютерных наук НИУ ВШЭ (август 2017)
  • · Лучший преподаватель — 2023–2025, 2017–2023
  • · Лучший академический руководитель в номинации «Удовлетворенность студентов качеством образовательной программы» — 2023–2025
  • · Лучший академический руководитель в номинации «Цифровые навыки студентов» — 2025, 2023
  • · Лучший академический руководитель в номинации «Методическое качество программы» — 2025
  • · Лучший академический руководитель в номинации «Прием иностранных студентов» — 2024
  • · Лучший академический руководитель в номинации «Межфакультетское взаимодействие» — 2023

Идентификаторы исследователя

Публикации (3)

Consolidating Russia and Eurasia antibiotic resistance data for 1992–2014 using search engine

2016 · ARTICLE · en

Background: The World Health Organization recognizes the antibiotic resistance problem as a major health threat in the 21st century. The paper describes an effort to fight it undertaken at the verge of two industries - healthcare and Data Science. One of the major difficulties in monitoring antibiotic resistance is low availability of comprehensive research data. Our aim is to develop a nation-wide antibiotic resistance database using Internet search and data processing algorithms using Russian language publications. Materials and methods: An interdisciplinary team built an intelligent Internet search filter to locate all publicly available research data on antibiotic resistance in Russia and Eurasia countries, extracted it, and collated it for analysis. A database was constructed using data from 850 original studies conducted at 153 locations in 12 countries between 1992 and 2014. The studies contained susceptibility and resistance rates of 156 microorganisms to 157 antibiotic drugs. Results: The applied search methodology was highly robust in that it yielded search precision of 58% versus 20% in a typical Internet search. It allowed finding and collating within the database the following data items (among many others): publication details including title, source, date, authors, etc.; study details: time period, locations, research organization, therapy area, etc.; microorganisms and antibiotic drugs included in the study along with prevalence values of resistant and susceptible strains, and numbers of isolates. The next stage in project development will try to validate the data by matching it to major benchmark studies; in addition, a panel of experts will be convened to evaluate the outcomes. Conclusions: The work provides a supplementary tool to national surveillance systems in antibiotic resistance, and consolidates fragmented research data available for 12 countries for a period of more than 20 years.

Topic Models Regularization and Initialization for Regression Problems

2015 · CHAPTER · en

We propose a new method of feature extraction for regression problems with text data that transforms the sparse texts to dense features using regularized topic models. We also discuss the problem of topic model initialization, and propose a new approach based on Naive Bayes. This approach is compared to many others, and it achieves a quality comparable to vector space models using as little as ten topics. It also outperforms other methods for feature generation based on topic modeling, such as PLSA and Supervised LDA.

RecSys Challenge 2015: ensemble learning with categorical features

2015 · CHAPTER · en

In this paper, we describe the winning approach for the RecSys Challenge 2015. Our key points are (1) two-stage classification, (2) massive usage of categorical features, (3) strong classifiers built by gradient boosting and (4) threshold optimization based directly on the competition score. We describe our approach and discuss how it can be used to build scalable personalization systems.

Курсы (7)