Аннотация
Рассматривается актуальная задача разработки отечественных методов и средств организации функционирования распределенных вычислительных систем для малобюджетных предприятий. Особое внимание уделено системности подхода к разработке программных средств, характеризующейся комплексированием программ организации функционирования РВС с модулями расширения функциональных возможностей, наборами параллельных алгоритмов. Функционирование РВС увязывается с критерием продуктивности реализации вычислений, основанным на соотношении «цена – производительность – качество». В основе решения лежит концепция однородных вычислительных систем, сформулированная в Институте математики СО РАН СССР под руководством Э.В. Евреинова в 1962 году [1]. Подход актуален в условиях распространенности информационных сетей, объединяющих многочисленные ЭВМ. Описываемый в статье метод и программное обеспечение организации распределенных ВС были апробированы при организации РВС кафедры вычислительной техники НГТУ на базе существующей сети персональных компьютеров. Разработанное программное обеспечение для функционирования системы включает в себя библиотеку и сетевое приложение. Библиотека представляет собой инструментарий для реализации параллельных алгоритмов. Сетевое приложение предназначено для управления запуском параллельных алгоритмов одновременно на нескольких компьютерах: настройки системы, организации подсистем, распределения данных между вычислителями, вывода информации о состоянии ПК. В настоящее время ведется разработка модуля балансировки вычислительной нагрузки и модуля обеспечения продолжения счета при отказе одного или нескольких вычислителей. В статье приводятся полученные результаты численных экспериментов по оценке эффективности на тестовом примере решения системы линейных алгебраических уравнений. Оценены предельные значения коэффициента ускорения.
Ключевые слова: высокопродуктивные вычислительные системы, параллельный алгоритм, мелкозернистое распараллеливание, крупноблочное распараллеливание, эффективность, масштабируемость, системное программное обеспечение, система линейных алгебраических уравнений
Список литературы
1. Евреинов Э.В. Однородные вычислительные системы, структуры и среды. – М.: Радио и связь, 1981. – 208 с.
2. Хорошевский В.Г. Архитектура вычислительных систем. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2008. – 520 с.
3. Хорошевский В.Г. Распределенные вычислительные системы с программируемой структурой // Вестник СибГУТИ. – 2010. – № 2 (10). – С. 3–41.
4. Перышкова Е.Н., Мамойленко С.Н., Ефимов А.В. Инструментарий решения масштабируемых задач на распределенных вычислительных системах // Восьмая Сибирская конференция по параллельным и высокопроизводительным вычислениям, Томск, 28–30 октября 2015 г. – Томск, 2015. – С. 143–150.
5. Алгоритмы отказоустойчивого управления ресурсами пространственно-распределенных вычислительных систем / А.Ю. Поляков, О.В. Молдованова, А.А. Пазников, М.Г. Курносов, С.Н. Мамойленко, А.В. Ефимов // Вестник СибГУТИ. – 2014. – № 4. – С. 11–29.
6. Воеводин В.В., Воеводин Вл. В. Параллельные вычисления. – СПб.: БХВ-Петербург, 2004. – 608 с.
7. Durech J., Hanus J., Vanco R. Asteroids@home – A BOINC distributed computing project for asteroid shape reconstruction // Astronomy and Computing. – 2015. – Vol. 13, N 1. – P. 80–84.
8. Asteroids@home – Customizable execution environments for evolutionary computation using BOINC + virtualization / F. Fernández De Vega, G. Olague, L. Trujillo, D. Lombraña González // Natural Computing. – 2013. – Vol. 12, N 2. – P. 163–177.
9. Kurose J.F., Ross K.W. Computer networking: a top-down approach. – Boston: Addison Wesley, 2009. – 864 p.
10. Tanenbaum A.S., Steen M. Distributed systems: principles and paradigms. – New Jersey: Prentice Hall PTR, 2002. – 803 p.
11. Jalote P. Fault tolerance in distributed systems. – New Jersey: Prentice Hall, 1994. – 448 p.
12. Tel G. Introduction to distributed algorithms. – Cambridge: Cambridge University Press, 2000. – 596 p.
13. Vaidya N.H. A case for two-level distributed recovery schemes // Proceedings of the ACM SIGMETRICS Joint International Conference on Measurement and Modeling of Computer Systems, Ottawa, Canada, 15–19 May 1995. – New York: ACM, 1995. – P. 64–73.
14. Considerations of implementation and application of high-perfomance computing for low-budget enterprices / V.K. Mishchenko, P.V. Mishchenko, V.V. Gubarev, M.A. Karneev // Proceedings XII international conference Actual Problems of Electronic Instrument Engineering, APEIE–2014, Novosibirsk, Russia, 2–4 October 2014: in 7 vol. – Novosibirsk, 2014. – Vol. 1, pt. 2. – P. 11–13.
15. Мищенко П.В., Губарев В.В., Мищенко В.К. Распределенная вычислительная система кафедры вычислительной техники НГТУ // Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов: сборник статей Всероссийской научно-практической конференции, Барнаул, 27 февраля 2015 г. – Барнаул, 2015. – С. 150–155.
16. Библиотека разработки параллельных алгоритмов для распределенных вычислительных систем с программируемой структурой (Библиотека РВС ПС): свидетельство о государственной регистрации программы для ЭВМ № 2015618556 / П.В. Мищенко, К.А. Бородин, М.А. Карнеев, В.К. Мищенко. – Заявка № 2015615598; заявл. 25.06.15; опубл. 20.09.15, Бюл. № 9. – 1 с.
17. Сетевое приложение для организации распределенных вычислительных систем с программируемой структурой (РВС ПС Агент): свидетельство о государственной регистрации программы для ЭВМ № 2015618557 / К.А. Бородин, П.В. Мищенко, М.А. Карнеев, В.К. Мищенко. – Заявка № 2015615602; заявл. 25.06.15; опубл. 20.09.15, Бюл. № 9. – 1 с.
18. Бондаренко А.А., Якобовский М.В. Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. – 2014. – № 3. – С. 20–36.