Костенецкий Павел Сергеевич
Отдел суперкомпьютерного моделирования
Профессиональные интересы
Должности
- Начальник отдела — Отдел суперкомпьютерного моделирования
- Доцент — Факультет компьютерных наук, Департамент программной инженерии
Био
- · Начал работать в НИУ ВШЭ в 2019 году.
- · Научно-педагогический стаж: 18 лет.
Образование
- 2013 · Ученое звание: Доцент
- 2010 · Кандидат физико-математических наук: Южно-Уральский государственный университет
- 2003 · Специалитет: Челябинский государственный университет, специальность «Прикладная математика», квалификация «Математик»
- — · Кандидат физико-математических наук по специальности 05.13.18 "Математическое моделирование, численные методы и комплексы программ". Тема диссертации: "Моделирование и анализ иерархических многопроцессорных систем баз данных".
Опыт работы
- · Начальник отдела суперкомпьютерного моделирования
- · Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ)
- · https://hpc.hse.ru
- · 2010:
- · Руководитель Лаборатории суперкомпьютерного моделирования (20 сотрудников, 5 отделов) и Суперкомпьютерного центра.
- · НИУ Южно-Уральский государственный университет («5-100»)
- · http://supercomputer.susu.ru
- · Доцент, научный сотрудник, программист, начальник отдела
- · НИУ Южно-Уральский государственный университет («5-100»)
- · http://susu.ru
Награды и поощрения
- · Благодарность старшего директора по цифровой трансформации НИУ ВШЭ (декабрь 2023)
- · Благодарность факультета компьютерных наук НИУ ВШЭ (июль 2023)
- · Благодарность первого проректора НИУ ВШЭ (апрель 2023)
- · Почетная грамота дирекции по цифровой трансформации НИУ ВШЭ (декабрь 2022)
- · Благодарственное письмо ректора НИУ ВШЭ (май 2022)
- · Почетная грамота Администрации города Челябинска (октябрь 2017)
- · Почетная грамота Министерства образования и науки Российской Федерации (сентябрь 2013)
- · Участник программы «Административный кадровый резерв» (2021–2022)
Гранты и проекты
- 2025 · 2025 г. Разработка подсистемы динамического изменения приоритета вычислительных задач в очереди суперкомпьютера для расширения системы HPC TaskMaster.
- 2025 · 2025 г. Моделирование потока задач вычислительного кластера НИУ ВШЭ с использованием SLURM Simulator
- 2025 · 2025 г. Анализ и визуализация данных в системе мониторинга эффективности задач HPC TaskMaster суперкомпьютерного комплекса.
- 2023 · 2023 г. Расширение подсистемы анализа данных для программной системы HPC TaskMaster.
- 2022 · 2022 г. Разработка подсистемы анализа данных для системы “HPC TaskMaster” суперкомпьютера «cHARISMa» НИУ ВШЭ. 2022 г. Генератор пакетных файлов для планировщика задач суперкомпьютера «cHARISMa» НИУ ВШЭ.
- — · и др.
Конференции (6)
Показать все
- · 2025: Параллельные вычислительные технологии (ПаВТ) 2025 (Москва). Доклад: High-Performance Computing at HSE University
- · 2025: International Conference on Computational Optimization (ICOMP) 2025 (Абу-Даби). Доклад: Simulation-Based Optimization of HPC Job Scheduler Configuration
- · 2024: Параллельные вычислительные технологии (ПаВТ) 2024 (Челябинск). Доклад: Enhancement of the data analysis subsystem for the task efficiency monitoring system HPC TaskMaster for the cHARISMa supercomputer complex of the HSE University
- · 2024: Суперкомпьютерные дни в России 2024 (Москва). Доклад: Разработка новых индикаторов для системы HPC TaskMaster
- · 2022: Параллельные вычислительные технологии (ПаВТ 2022) (Дубна). Доклад: HPC TaskMaster - система мониторинга эффективности задач для суперкомпьютерного центра
- · 2012: Научный сервис в сети Интернет: поиск новых решений (Новороссийск). Доклад: Опыт использования VDI-системы «Персональный виртуальный компьютер» в ЮУрГУ
Идентификаторы исследователя
- ORCID:
0000-0002-9365-0525 - ResearcherID:
L-7971-2013 - SPIN РИНЦ:
2954-2980 - Google Scholar: https://scholar.google.ru/citations?user=p42ydFoAAAAJ&hl=ru
- Scopus AuthorID:
56962776700
Публикации (23)
High-Performance Computing at HSE University
2026 · CHAPTER · en
High-performance computing (HPC) has emerged as a critical tool for accelerating research across diverse scientific domains, enabling the efficient processing of large datasets and complex simulations. This article offers a comprehensive overview of the HPC resources available at HSE University in Moscow. We outline the university’s current HPC infrastructure, detailing its computational capabilities, software environments, and key recent upgrades implemented to address the evolving needs of researchers. Furthermore, we showcase how these resources are being leveraged to support cutting-edge research projects across multiple disciplines. By highlighting available opportunities, this review seeks to inform the academic community and inspire innovative applications of HPC in both research and education.
Scaling Up Molecular Hydrodynamics of Non-Laminar Flows with GPU-Aware MPI
2026 · CHAPTER · en
This work presents atomic-scale modeling of the perturbed flow of a Lennard-Jones fluid in a quasi-two-dimensional system containing one billion atoms. A statistically stationary flow regime corresponding to a Reynolds number of Re ≈ 1000 has been achieved, the flow structure has been analyzed, and the energy spectrum of velocities has been calculated. The results show a spectrum shape characteristic of quasi-two-dimensional turbulence. The analysis confirms the feasibility of using molecular dynamics to investigate turbulence at scales close to the Kolmogorov scale. The results of using GPU-aware MPI technology for these calculations on the Desmos and cHARISma supercomputers are discussed.
Моделирование потока задач вычислительного кластера НИУ ВШЭ с использованием SLURM Simulator
2025 · CHAPTER · ru
Задача эффективного распределения ресурсов вычислительной системы широко известна. Она становится критически важной в многопользовательских многопроцессорных системах, таких как суперкомпьютеры. В НИУ ВШЭ функционирует высокопроизводительный вычислительный кластер «cHARISMa», состоящий из 48 вычислительных узлов шести типов. Основными характеристиками узлов являются наличие графических ускорителей и их модели, типы центральных процессоров и объем оперативной памяти. На суперкомпьютере используется планировщик задач SLURM версии 23.02.4.
Анализ и визуализация данных в системе мониторинга эффективности задач НРС TaskMaster суперкомпьютерного комплекса
2025 · CHAPTER · ru
Данная работа посвящена созданию подсистемы визуализации данных о вычислительных задачах пользователей для системы HPC TaskMaster [1], разработанной Отделом суперкомпьютерного моделирования НИУ ВШЭ для суперкомпьютера cHARISMa. Основная цель этой подсистемы – предоставить пользователям и администраторам удобный инструмент для исследования большого массива данных о задачах. В качестве платформы визуализации выбрана система Grafana, уже используемая для мониторинга нагрузки на кластер в TaskMaster. Ключевым элементом данной работы является разработка интерактивного трехмерного scatter plot для визуализации задач в пространстве их характеристик.
Разработка подсистемы динамического изменения приоритета задач в очереди суперкомпьютера
2025 · CHAPTER · ru
С ростом числа задач в различных областях науки, требующих высокопроизводительных вычислений, правильное распределение приоритетов задач и квот пользователей стало одним из важнейших факторов, влияющих на эффективную работу суперкомпьютерных центров. На суперкомпьютере НИУ ВШЭ «cHARISMa» настроено множество дополняющих друг друга алгоритмов планирования потока задач, а также ограничений, таких как проектные лимиты и пользовательские квоты. Алгоритмы и ограничения не позволяют одному или нескольким пользователям полностью занять ресурсы суперкомпьютера и таким образом парализовать вычислительные эксперименты других пользователей университета. Кроме того, для поиска и устранения некорректно запущенных и не выполняющих вычислений задач, в НИУ ВШЭ разработана система мониторинга эффективности HPC TaskMaster.
Интеллектуальное прогнозирование времени выполнения вычислительных задач GROMACS для оптимизации работы планировщика задач суперкомпьютера «cHARISMa» НИУ ВШЭ
2025 · CHAPTER · ru
Современные суперкомпьютеры являются незаменимыми инструментами для решения сложных научных и промышленных задач. Эффективное планирование потока вычислительных задач суперкомпьютера требует информации о времени, за которое может завершится каждая из ожидающих запуска задач. Нередко пользователи устанавливают задаче временной лимит с большим запасом, что снижает эффективность работы планировщика. Разработка метода предсказания времени выполнения задач Gromacs на суперкомпьютере позволит более точно выстраивать поток задач, оптимально загружая вычислительные ресурсы суперкомпьютера.
Выполнение распределенных вычислительных экспериментов на MLOps платформе НИУ ВШЭ
2025 · ARTICLE · ru
Несмотря на распространение и успешные применения средств интеллектуального анализа и обработки данных для решения отдельных прикладных задач, все еще не решена проблема разработки технологии создания таких программных средств. В работе в контексте единого процесса MLOps создания технологий машинного обучения рассматриваются возникающие задачи автоматизации и выполнения распределенных вычислительных экспериментов на базе единой вычислительной платформы. Разрабатываемая в НИУ ВШЭ платформа MLOps предназначена для развертывания интеллектуальных веб-сервисов и программных средств анализа данных. Платформа должна управлять доступными локально и в облачной среде разнородными ресурсами и объединять их с ресурсами вычислительного кластера cHARISMa НИУ ВШЭ под управлением Slurm. Таким образом актуальна задача интеграции указанных ресурсов для проведения вычислительных экспериментов, реализации конвейеров настройки моделей машинного обучения, решения задач обработки и анализа данных. Особенностями решаемой задачи являются рассмотрение процесса вычислений, как составной части технологии создания интеллектуальных веб-сервисов, обусловленная этой технологией необходимость использования разнородных ресурсов и использование единой гибридной платформы для выполнения вычислений. В работе предложено решение указанной задачи интеграции вычислений и приведены результаты апробации решения для интеллектуальных веб-сервисов. Показана принципиальная возможность такой интеграции разнородных ресурсов в одном вычислительном эксперименте на базе расширяемой пользователем объектной модели эксперимента и предметно-ориентированного языка его спецификации, решены вопросы динамического управления развертыванием интеллектуальных приложений, интеграции конвейеров обработки данных, веб-сервисов и наборов данных для выполнения распределенных вычислительных экспериментов.
Enhancement of the Data Analysis Subsystem in the Task-Efficiency Monitoring System HPC TaskMaster for the cHARISMa Supercomputer Complex at HSE University
2024 · CHAPTER · en
The detection of computational tasks that inefficiently utilize high-performance computing (HPC) resources is one of the major problems facing supercomputer centers. Such tasks can block valuable computational resources and slow down other supercomputer users’ computations. HPC TaskMaster, a task-performance monitoring system developed at the Higher School of Economics, addresses this issue by analyzing task metrics, aggregating them, calculating indicator values, assigning tags, and automatically generating inferences about task performance. In this paper, we describe the enhancement of the HPC TaskMaster subsystem for analyzing the efficiency of tasks by introducing a new entity into it: parameters. This extension enables the detection of new types of problems, such as the incorrect selection of the type and number of computational resources. Additionally, it allows one to consider the variability of parameters in the inferences generated by the system.
Разработка подсистемы анализа эффективности использования вычислительных ресурсов для системы HPC TaskMaster
2023 · CHAPTER · ru
Обнаружение неэффективных задач на суперкомпьютере является одной из наиболее актуальных проблем в суперкомпьютерной отрасли, так как такие задачи могут блокировать ценные вычислительные ресурсы и приводить к общему замедлению работы всех пользователей. Существует множество критериев, по которым можно определить, что задача работает неэффективно – самым простым из них является сравнение средних показателей использования выделенных ресурсов с эталонным значением, которое считается границей определения эффективности задачи. Однако, такие критерии помогают отследить только самые простые примеры неэффективных задач. В данной статье предлагаются новые способы определения неэффективных задач, имплементированные в систему мониторинга эффективности задач HPC TaskMaster НИУ ВШЭ. Данные способы позволяют отслеживать запуск непараллельных программ, обнаруживать разбалансировку вычислительных ресурсов, а также определять задачи, создающие простои части выделенных им вычислительных ресурсов.
Экспериментальная оценка результатов внедрения технологии NVIDIA GPUDirect на суперкомпьютере НИУ ВШЭ
2023 · CHAPTER · ru
Оптимизация использования вычислительных ресурсов на высокопроизводительных кластерах является важной задачей в условиях высокой загрузки. Одним из способов такой оптимизации является применение современных технологий. В то же время, на разных серверных архитектурах поведение технологий может отличаться. В частности, влияние оказывает то, как именно осуществляется взаимодействие компонентов аппаратной архитектуры (например, между GPU и InfiniBand адаптером). В данной статье анализируется применение технологий NVIDIA GPUDirect RDMA и NVIDIA GPUDirect Copy на различных архитектурах вычислительных узлов суперкомпьютерного комплекса cHARISMa. Рассматривается изменение задержки и скорости передачи данных между GPU на разных вычислительных узлах при различных комбинациях задействованных технологий. В лучших случаях задержка при передаче данных уменьшилась в 7.8 раза, а увеличение пропускной способности составило до 286%. Полученные результаты показывают, что применение технологий GPUDirect Copy и GPUDirect RDMA с учетом аппаратной архитектуры может значительно ускорять выполнение задач, как использующих частые обмены с памятью GPU в рамках одного узла, так и выполняющих обмены между GPU на нескольких вычислительных узлах.
Курсы (0)
Нет курсов.