@techreport{oai:hiroshima-cu.repo.nii.ac.jp:00001701, author = {松岡, 俊輔 and 前田, 哲宏 and 窪田, 昌史 and 北村, 俊明 and MATSUOKA, Shunsuke and MAEDA, Tetsuhiro and KUBOTA, Atsushi and KITAMURA, Toshiaki}, issue = {80}, month = {2007-08-01, 2023-03-10}, note = {application/pdf, 大規模な並列計算機やPCクラスタ,グリッドなどのノード数が増加するにつれ,ノードやネットワークの故障に対処することが必要不可欠となってきている.MPIは,それらの並列処理環境上で事実上の標準並列ライブラリとして広く用いられている.そのため,同期チェックポインティングやメッセージロギングの機能を備えた耐故障性MPIが多数提案されているが,それらは大きなオーバヘッドをもたらすという問題がある.本稿ではオーバヘッドの低減を図るプログラム主導の自律チェックポイント方式を提案し,その有効性をNAS Parallel Benchmarksを用いて評価する., With the increase of nodes in parallel computing platforms such as large-scale parallel machines, PC clusters and Grids, it has become necessary to handle frequent failures in node and network. On those platforms, MPI is widely used as a de-facto standard library for parallel computing. Many researches have focused on fault tolerant MPI and proposed fault tolerant message passing protocols based on coordinated checkpointing or message logging, which bring about large overhead in performance. In this report, we propose a program-initiated self-checkpointing which aims to reduce the overhead in performance. We evaluate the effectiveness of the proposed method using the NAS parallel benchmarks.}, title = {MPIプログラムの自律チェックポインティング方式の実現}, year = {}, yomi = {マツオカ, シュンスケ and マエダ, テツヒロ and クボタ, アツシ and キタムラ, トシアキ} }