DSA Faculty
API
← к списку преподавателей

Чулкевич Роман Андреевич

Отдел суперкомпьютерного моделирования

Профиль на hse.ru ↗ тел.: +7 (495) 531-00-00 | 27968
Публикаций
13
Языков
1
Наград
1
Конференций
4
Профиль Публикации (13) Курсы (0)

Профессиональные интересы

Высоконагруженные системыРаспределенные и параллельные вычисленияРаспознавание дефектов металлопрокатаискусственный интеллектLinux/Unixpython

Должности

  • Ведущий инженерОтдел суперкомпьютерного моделирования

Био

  • · Начал работать в НИУ ВШЭ в 2019 году.

Образование

  • 2019 · Магистратура: Южно-Уральский государственный университет (национальный исследовательский университет), факультет: ВШЭКН, специальность «Фундаментальная информатика и информационные технологии», квалификация «Магистр»

Опыт работы

  • · Отдел суперкомпьютерного моделирования
  • · Должность: ведущий инженер
  • · Лаборатория Суперкомпьютерного моделирования ЮУрГУ
  • · Должность: Директор суперкомпьютерного центра
  • · Лаборатория Суперкомпьютерного моделирования ЮУрГУ
  • · Должность: Программист суперкомпьютерного центра
  • · Кафедра Системного программирования ВШЭКН ЮУрГУ Должность: Преподаватель

Награды и поощрения

  • · Благодарность старшего директора по цифровой трансформации НИУ ВШЭ (ноябрь 2020)

Гранты и проекты

  • 2020 · 2018-2020 Фонд содействия инновациям "УМНИК" - Разработка программной системы автоматического обнаружения и классификации дефектов холодного металлопроката с покрытием на принципах машинного зрения.

Конференции (4)

Показать все
  • · 2024: Параллельные вычислительные технологии (ПаВТ) 2024 (Челябинск). Доклад: Enhancement of the data analysis subsystem for the task efficiency monitoring system HPC TaskMaster for the cHARISMa supercomputer complex of the HSE University
  • · 2024: Суперкомпьютерные дни в России 2024 (Москва). Доклад: Разработка новых индикаторов для системы HPC TaskMaster
  • · 2022: Параллельные вычислительные технологии (ПаВТ 2022) (Дубна). Доклад: HPC TaskMaster - система мониторинга эффективности задач для суперкомпьютерного центра
  • · 2016: Russian Supercomputing Days (Москва). Доклад: Моделирование аппаратной архитектуры многоядерного ускорителя Xeon Phi KNL в контексте параллельной обработки баз данных

Идентификаторы исследователя

Публикации (13)

High-Performance Computing at HSE University

2026 · CHAPTER · en

High-performance computing (HPC) has emerged as a critical tool for accelerating research across diverse scientific domains, enabling the efficient processing of large datasets and complex simulations. This article offers a comprehensive overview of the HPC resources available at HSE University in Moscow. We outline the university’s current HPC infrastructure, detailing its computational capabilities, software environments, and key recent upgrades implemented to address the evolving needs of researchers. Furthermore, we showcase how these resources are being leveraged to support cutting-edge research projects across multiple disciplines. By highlighting available opportunities, this review seeks to inform the academic community and inspire innovative applications of HPC in both research and education.

Scaling Up Molecular Hydrodynamics of Non-Laminar Flows with GPU-Aware MPI

2026 · CHAPTER · en

This work presents atomic-scale modeling of the perturbed flow of a Lennard-Jones fluid in a quasi-two-dimensional system containing one billion atoms. A statistically stationary flow regime corresponding to a Reynolds number of Re ≈ 1000 has been achieved, the flow structure has been analyzed, and the energy spectrum of velocities has been calculated. The results show a spectrum shape characteristic of quasi-two-dimensional turbulence. The analysis confirms the feasibility of using molecular dynamics to investigate turbulence at scales close to the Kolmogorov scale. The results of using GPU-aware MPI technology for these calculations on the Desmos and cHARISma supercomputers are discussed.

Enhancement of the Data Analysis Subsystem in the Task-Efficiency Monitoring System HPC TaskMaster for the cHARISMa Supercomputer Complex at HSE University

2024 · CHAPTER · en

The detection of computational tasks that inefficiently utilize high-performance computing (HPC) resources is one of the major problems facing supercomputer centers. Such tasks can block valuable computational resources and slow down other supercomputer users’ computations. HPC TaskMaster, a task-performance monitoring system developed at the Higher School of Economics, addresses this issue by analyzing task metrics, aggregating them, calculating indicator values, assigning tags, and automatically generating inferences about task performance. In this paper, we describe the enhancement of the HPC TaskMaster subsystem for analyzing the efficiency of tasks by introducing a new entity into it: parameters. This extension enables the detection of new types of problems, such as the incorrect selection of the type and number of computational resources. Additionally, it allows one to consider the variability of parameters in the inferences generated by the system.

Разработка подсистемы анализа эффективности использования вычислительных ресурсов для системы HPC TaskMaster

2023 · CHAPTER · ru

Обнаружение неэффективных задач на суперкомпьютере является одной из наиболее актуальных проблем в суперкомпьютерной отрасли, так как такие задачи могут блокировать ценные вычислительные ресурсы и приводить к общему замедлению работы всех пользователей. Существует множество критериев, по которым можно определить, что задача работает неэффективно – самым простым из них является сравнение средних показателей использования выделенных ресурсов с эталонным значением, которое считается границей определения эффективности задачи. Однако, такие критерии помогают отследить только самые простые примеры неэффективных задач. В данной статье предлагаются новые способы определения неэффективных задач, имплементированные в систему мониторинга эффективности задач HPC TaskMaster НИУ ВШЭ. Данные способы позволяют отслеживать запуск непараллельных программ, обнаруживать разбалансировку вычислительных ресурсов, а также определять задачи, создающие простои части выделенных им вычислительных ресурсов.

Экспериментальная оценка результатов внедрения технологии NVIDIA GPUDirect на суперкомпьютере НИУ ВШЭ

2023 · CHAPTER · ru

Оптимизация использования вычислительных ресурсов на высокопроизводительных кластерах является важной задачей в условиях высокой загрузки. Одним из способов такой оптимизации является применение современных технологий. В то же время, на разных серверных архитектурах поведение технологий может отличаться. В частности, влияние оказывает то, как именно осуществляется взаимодействие компонентов аппаратной архитектуры (например, между GPU и InfiniBand адаптером). В данной статье анализируется применение технологий NVIDIA GPUDirect RDMA и NVIDIA GPUDirect Copy на различных архитектурах вычислительных узлов суперкомпьютерного комплекса cHARISMa. Рассматривается изменение задержки и скорости передачи данных между GPU на разных вычислительных узлах при различных комбинациях задействованных технологий. В лучших случаях задержка при передаче данных уменьшилась в 7.8 раза, а увеличение пропускной способности составило до 286%. Полученные результаты показывают, что применение технологий GPUDirect Copy и GPUDirect RDMA с учетом аппаратной архитектуры может значительно ускорять выполнение задач, как использующих частые обмены с памятью GPU в рамках одного узла, так и выполняющих обмены между GPU на нескольких вычислительных узлах.

HPC TaskMaster - Task Efficiency Monitoring System for the Supercomputer Center

2022 · ARTICLE · en

This paper is devoted to the monitoring system HPC TaskMaster developed at the HSE University for the cHARISMa cluster. This system automatically evaluates the efficiency of performing tasks of HPC cluster users and identifies inefficient tasks, thereby significantly saving expensive machine time. In addition, users can view reports on completing their tasks, along with inferences about their work and interactive graphs. Particular attention in this paper is paid to determining the effectiveness of the task - the system allows the administrator to personally configure the criteria for evaluating the effectiveness of the task without the need for changes in the source code. The system is developed using open-source software and is publicly available for use on other clusters.

Сравнение производительности параллельной СХД суперкомпьютера с разными версиями файловой системы Lustre

2022 · CHAPTER · ru

Суперкомпьютер "cHARISMa" [1] активно используется 64 подразделениями НИУ ВШЭ для проведения научных исследований и учебной работы. Суперкомпьютер представляет собой высокопроизводительный вычислительный кластер с 46 вычислительными узлами, и параллельной СХД. Шесть вычислительных узлов кластера оснащены восьмью GPU NVIDIA A100 80 ГБ SXM в каждом, 29 узлов с большим объемом оперативной памяти 768-1536 ГБ оснащены четырьмя графическими ускорителями NVIDIA Tesla V100 32 ГБ SXM в каждом, а для задач, не требующих GPU, в составе кластера есть 11 вычислительных узлов без GPU с более мощными центральными процессорами. Система хранения данных (СХД) суперкомпьютера построена на базе параллельной сетевой файловой системы Lustre [3]. СХД построена на базе эталонной архитектуры, рекомендуемой Dell и состоит из двух Object Storage Server (OSS), двух Lustre Metadata Service (MDS), Lustre Metadata Target (MDT), Integrated Manager for Lustre (IML).

Algorithm for replica redistribution in an implementation of the population annealing method on a hybrid supercomputer architecture

2021 · ARTICLE · en

The population annealing method is a promising approach for large-scale simulations because it is potentially scalable on any parallel architecture. We present an implementation of the algorithm on a hybrid program architecture combining CUDA and MPI. The problem is to keep all general-purpose graphics processing unit devices as busy as possible by efficiently redistributing replicas. We provide details of testing on hardware based the Intel Skylake/Nvidia V100 running more than two million replicas of the Ising model sample in parallel. The results are quite encouraging because the acceleration grows toward the perfect line as the complexity of the simulated system increases.

HPC Resources of the Higher School of Economics

2021 · ARTICLE · en

The National Research University Higher School of Economics launched its HPC cluster and created a new division named the Supercomputer Simulation Unit. Now the university HPC cluster occupies seventh place in rating the most powerful computers of the CIS TOP50. The HPC cluster uses to solve machine learning problems, population genomics, hydrodynamics, atomistic and continuous modeling in physics, generative probabilistic models, financial row forecasting algorithms, and other actual problems. Paper describes the HSE HPC resources and experience of their use for scientific and educational tasks.

HPC TaskMaster – система мониторинга эффективности задач суперкомпьютера

2021 · CHAPTER · ru

HPC TaskMaster– система мониторинга суперкомпьютера "cHARISMa" НИУ ВШЭ,которая автоматически распознает неэффективные задачи пользователей, позво-ляя существенно экономить дорогостоящее машинное время. Пользователи мо-гут просматривать отчеты о выполнении своей задачи вместе с интерактивнымиграфиками. Данная система построена на базе открытого программного обеспе-чения, что позволяет установить ее на других вычислительных кластерах.

Курсы (0)

Нет курсов.