Козырев Вячеслав Иванович

Отдел суперкомпьютерного моделирования

Профиль на hse.ru ↗ тел.: +7 (495) 531-00-00 | 28160

Публикаций

Языков

Наград

Конференций

Профиль Публикации (15) Курсы (0)

Профессиональные интересы

Высоконагруженные системыРаспределенные и параллельные вычисленияУправление, администрирование, мониторинг и тестирование многопроцессорных системpythonLinux/UnixWindows Server

Должности

Ведущий инженер — Отдел суперкомпьютерного моделирования

Био

· Начал работать в НИУ ВШЭ в 2020 году.

Образование

2019 · Бакалавриат: Челябинский государственный университет, специальность «Информатика и вычислительная техника», квалификация «Бакалавр»
· доп. Администрирование Office 365 – SharePoint Online от простого к сложному.
· доп. Администрирование Office 365. Развертывание Exchange online через веб-интерфейс и PowerShell. Настройка современных средств защиты корпоративной почты.
· доп. Администрирование Microsoft 365. Развертывание Microsoft 365 и современные средства защиты.
· доп. Planning and Implementing Windows Server.
· доп. Configuring and Troubleshooting a Windows Server Network Infrastructure.
· доп. Configuring and Troubleshooting a Windows Server Active Directory Domain Service.
· доп. Configuring and Troubleshooting Identity and Access Solutions with Windows Server Active Directory.
· доп. Designing a Windows Server Active Directory Infrastructure and Services.

Опыт работы

· Отдел суперкомпьютерного моделирования НИУ ВШЭ
· Должность: Ведущий инженер
· Лаборатория Суперкомпьютерного моделирования ЮУрГУ
· Должность: Директор суперкомпьютерного центра
· Лаборатория Суперкомпьютерного моделирования ЮУрГУ
· Должность: Программист суперкомпьютерного центра
· Лаборатория Суперкомпьютерного моделирования ЮУрГУ
· Должность: Старший лаборант суперкомпьютерного центра
· Кафедра Системного программирования ЮУрГУ
· Должность: Старший лаборант

Награды и поощрения

· Благодарность старшего директора НИУ ВШЭ (ноябрь 2025)
· Благодарность старшего директора по цифровой трансформации НИУ ВШЭ (ноябрь 2020)

Конференции (12)

Показать все

· 2024: Параллельные вычислительные технологии (ПаВТ) 2024 (Челябинск). Доклад: Enhancement of the data analysis subsystem for the task efficiency monitoring system HPC TaskMaster for the cHARISMa supercomputer complex of the HSE University
· 2024: Суперкомпьютерные дни в России 2024 (Москва). Доклад: Разработка новых индикаторов для системы HPC TaskMaster
· 2023: Суперкомпьютерные дни в России 2023 (Москва). Доклад: Экспериментальная оценка результатов внедрения технологии NVIDIA GPUDirect на суперкомпьютере НИУ ВШЭ
· 2023: Параллельные вычислительные технологии (ПаВТ) 2023 (Санкт-Петербург). Доклад: Разработка подсистемы анализа эффективности использования вычислительных ресурсов для системы HPC TaskMaster
· 2022: Параллельные вычислительные технологии (ПаВТ 2022) (Дубна). Доклад: HPC TaskMaster - система мониторинга эффективности задач для суперкомпьютерного центра
· 2022: Суперкомпьютерные дни в России 2022 (Москва). Доклад: Сравнение производительности параллельной СХД суперкомпьютера с разными версиями файловой системы Lustre
· 2021: Суперкомпьютерные дни в России 2021 (Москва). Доклад: HPC TaskMaster – система мониторинга эффективности задач суперкомпьютера
· 2020: Компьютерное моделирование в физике и не только. Доклад: HPC Resources of the Higher School of Economics
· 2017: Суперкомпьютерные дни в России 2017 (Москва). Доклад: Развитие платформы Персональный виртуальный компьютер в Южно-Уральском Государственном Университете
· 2017: Параллельные вычислительные технологии (ПаВТ-2017) (Казань). Доклад: Использование системы «Персональный виртуальный компьютер» в качестве инженерного облака
· 2015: Параллельные вычислительные технологии (ПаВТ) 2015 (Екатеринбург). Доклад: Виртуализация приложений суперкомпьютерного моделирования в ЮУрГУ
· 2012: Научный сервис в сети Интернет: поиск новых решений (Новороссийск). Доклад: Опыт использования VDI-системы «Персональный виртуальный компьютер» в ЮУрГУ

Идентификаторы исследователя

ORCID: 0000-0002-0310-0758
SPIN РИНЦ: 9679-5314
Google Scholar: https://scholar.google.ru/citations?user=T-oI7lcAAAAJ&hl=ru
Scopus AuthorID: 57222172374

Публикации (15)

High-Performance Computing at HSE University

2026 · CHAPTER · en

High-performance computing (HPC) has emerged as a critical tool for accelerating research across diverse scientific domains, enabling the efficient processing of large datasets and complex simulations. This article offers a comprehensive overview of the HPC resources available at HSE University in Moscow. We outline the university’s current HPC infrastructure, detailing its computational capabilities, software environments, and key recent upgrades implemented to address the evolving needs of researchers. Furthermore, we showcase how these resources are being leveraged to support cutting-edge research projects across multiple disciplines. By highlighting available opportunities, this review seeks to inform the academic community and inspire innovative applications of HPC in both research and education.

DOI ↗ PDF ↗

Выполнение распределенных вычислительных экспериментов на MLOps платформе НИУ ВШЭ

2025 · ARTICLE · ru

Несмотря на распространение и успешные применения средств интеллектуального анализа и обработки данных для решения отдельных прикладных задач, все еще не решена проблема разработки технологии создания таких программных средств. В работе в контексте единого процесса MLOps создания технологий машинного обучения рассматриваются возникающие задачи автоматизации и выполнения распределенных вычислительных экспериментов на базе единой вычислительной платформы. Разрабатываемая в НИУ ВШЭ платформа MLOps предназначена для развертывания интеллектуальных веб-сервисов и программных средств анализа данных. Платформа должна управлять доступными локально и в облачной среде разнородными ресурсами и объединять их с ресурсами вычислительного кластера cHARISMa НИУ ВШЭ под управлением Slurm. Таким образом актуальна задача интеграции указанных ресурсов для проведения вычислительных экспериментов, реализации конвейеров настройки моделей машинного обучения, решения задач обработки и анализа данных. Особенностями решаемой задачи являются рассмотрение процесса вычислений, как составной части технологии создания интеллектуальных веб-сервисов, обусловленная этой технологией необходимость использования разнородных ресурсов и использование единой гибридной платформы для выполнения вычислений. В работе предложено решение указанной задачи интеграции вычислений и приведены результаты апробации решения для интеллектуальных веб-сервисов. Показана принципиальная возможность такой интеграции разнородных ресурсов в одном вычислительном эксперименте на базе расширяемой пользователем объектной модели эксперимента и предметно-ориентированного языка его спецификации, решены вопросы динамического управления развертыванием интеллектуальных приложений, интеграции конвейеров обработки данных, веб-сервисов и наборов данных для выполнения распределенных вычислительных экспериментов.

DOI ↗ PDF ↗

Enhancement of the Data Analysis Subsystem in the Task-Efficiency Monitoring System HPC TaskMaster for the cHARISMa Supercomputer Complex at HSE University

2024 · CHAPTER · en

The detection of computational tasks that inefficiently utilize high-performance computing (HPC) resources is one of the major problems facing supercomputer centers. Such tasks can block valuable computational resources and slow down other supercomputer users’ computations. HPC TaskMaster, a task-performance monitoring system developed at the Higher School of Economics, addresses this issue by analyzing task metrics, aggregating them, calculating indicator values, assigning tags, and automatically generating inferences about task performance. In this paper, we describe the enhancement of the HPC TaskMaster subsystem for analyzing the efficiency of tasks by introducing a new entity into it: parameters. This extension enables the detection of new types of problems, such as the incorrect selection of the type and number of computational resources. Additionally, it allows one to consider the variability of parameters in the inferences generated by the system.

DOI ↗ PDF ↗

Разработка подсистемы анализа эффективности использования вычислительных ресурсов для системы HPC TaskMaster

2023 · CHAPTER · ru

Обнаружение неэффективных задач на суперкомпьютере является одной из наиболее актуальных проблем в суперкомпьютерной отрасли, так как такие задачи могут блокировать ценные вычислительные ресурсы и приводить к общему замедлению работы всех пользователей. Существует множество критериев, по которым можно определить, что задача работает неэффективно – самым простым из них является сравнение средних показателей использования выделенных ресурсов с эталонным значением, которое считается границей определения эффективности задачи. Однако, такие критерии помогают отследить только самые простые примеры неэффективных задач. В данной статье предлагаются новые способы определения неэффективных задач, имплементированные в систему мониторинга эффективности задач HPC TaskMaster НИУ ВШЭ. Данные способы позволяют отслеживать запуск непараллельных программ, обнаруживать разбалансировку вычислительных ресурсов, а также определять задачи, создающие простои части выделенных им вычислительных ресурсов.

PDF ↗

Экспериментальная оценка результатов внедрения технологии NVIDIA GPUDirect на суперкомпьютере НИУ ВШЭ

2023 · CHAPTER · ru

Оптимизация использования вычислительных ресурсов на высокопроизводительных кластерах является важной задачей в условиях высокой загрузки. Одним из способов такой оптимизации является применение современных технологий. В то же время, на разных серверных архитектурах поведение технологий может отличаться. В частности, влияние оказывает то, как именно осуществляется взаимодействие компонентов аппаратной архитектуры (например, между GPU и InfiniBand адаптером). В данной статье анализируется применение технологий NVIDIA GPUDirect RDMA и NVIDIA GPUDirect Copy на различных архитектурах вычислительных узлов суперкомпьютерного комплекса cHARISMa. Рассматривается изменение задержки и скорости передачи данных между GPU на разных вычислительных узлах при различных комбинациях задействованных технологий. В лучших случаях задержка при передаче данных уменьшилась в 7.8 раза, а увеличение пропускной способности составило до 286%. Полученные результаты показывают, что применение технологий GPUDirect Copy и GPUDirect RDMA с учетом аппаратной архитектуры может значительно ускорять выполнение задач, как использующих частые обмены с памятью GPU в рамках одного узла, так и выполняющих обмены между GPU на нескольких вычислительных узлах.

PDF ↗

HPC TaskMaster - Task Efficiency Monitoring System for the Supercomputer Center

2022 · ARTICLE · en

This paper is devoted to the monitoring system HPC TaskMaster developed at the HSE University for the cHARISMa cluster. This system automatically evaluates the efficiency of performing tasks of HPC cluster users and identifies inefficient tasks, thereby significantly saving expensive machine time. In addition, users can view reports on completing their tasks, along with inferences about their work and interactive graphs. Particular attention in this paper is paid to determining the effectiveness of the task - the system allows the administrator to personally configure the criteria for evaluating the effectiveness of the task without the need for changes in the source code. The system is developed using open-source software and is publicly available for use on other clusters.

DOI ↗ PDF ↗

Сравнение производительности параллельной СХД суперкомпьютера с разными версиями файловой системы Lustre

2022 · CHAPTER · ru

Суперкомпьютер "cHARISMa" [1] активно используется 64 подразделениями НИУ ВШЭ для проведения научных исследований и учебной работы. Суперкомпьютер представляет собой высокопроизводительный вычислительный кластер с 46 вычислительными узлами, и параллельной СХД. Шесть вычислительных узлов кластера оснащены восьмью GPU NVIDIA A100 80 ГБ SXM в каждом, 29 узлов с большим объемом оперативной памяти 768-1536 ГБ оснащены четырьмя графическими ускорителями NVIDIA Tesla V100 32 ГБ SXM в каждом, а для задач, не требующих GPU, в составе кластера есть 11 вычислительных узлов без GPU с более мощными центральными процессорами. Система хранения данных (СХД) суперкомпьютера построена на базе параллельной сетевой файловой системы Lustre [3]. СХД построена на базе эталонной архитектуры, рекомендуемой Dell и состоит из двух Object Storage Server (OSS), двух Lustre Metadata Service (MDS), Lustre Metadata Target (MDT), Integrated Manager for Lustre (IML).

PDF ↗

HPC Resources of the Higher School of Economics

2021 · ARTICLE · en

The National Research University Higher School of Economics launched its HPC cluster and created a new division named the Supercomputer Simulation Unit. Now the university HPC cluster occupies seventh place in rating the most powerful computers of the CIS TOP50. The HPC cluster uses to solve machine learning problems, population genomics, hydrodynamics, atomistic and continuous modeling in physics, generative probabilistic models, financial row forecasting algorithms, and other actual problems. Paper describes the HSE HPC resources and experience of their use for scientific and educational tasks.

DOI ↗ PDF ↗

HPC TaskMaster – система мониторинга эффективности задач суперкомпьютера

2021 · CHAPTER · ru

HPC TaskMaster– система мониторинга суперкомпьютера "cHARISMa" НИУ ВШЭ,которая автоматически распознает неэффективные задачи пользователей, позво-ляя существенно экономить дорогостоящее машинное время. Пользователи мо-гут просматривать отчеты о выполнении своей задачи вместе с интерактивнымиграфиками. Данная система построена на базе открытого программного обеспе-чения, что позволяет установить ее на других вычислительных кластерах.

PDF ↗

Administration, Monitoring and Analysis of Supercomputers in Russia: a Survey of 10 HPC Centers

2021 · ARTICLE · en

Supercomputer technologies are in demand for solving many important and computationallyintensive tasks in various fields of science and technology. Therefore, it is not surprising that there are several dozen supercomputer centers only in Russia. However, the goals of creating such centers, as well as the range of tasks solved in them, can vary greatly, therefore the structure of supercomputers and the policies for their usage can significantly differ. This leads to the fact that many supercomputer centers live an isolated life – the administrators of such centers tend to solve administration-related tasks on their own, despite the fact that solutions for many similar tasks have already been developed and applied in other centers. This can happen due to different reasons, but in any case, this situation could and should be improved. To do this, it is worth establishing a closer connection between supercomputer centers, which will allow more actively exchanging experience or jointly developing desired system software. In order to understand the current situation in this area, a survey was conducted of representatives among 10 large supercomputer centers in Russia, and its results are presented in this paper. Two relevant topics about using monitoring data in practice and real-life examples of supercomputer functioning improvement are also discussed here in more detail. Their vision on these topics is provided by the system administrators of HSE University, Skoltech and Moscow State University.

DOI ↗ PDF ↗

Курсы (0)

Нет курсов.