2013-03-18

Risa/Asir Conference 2013 + 第5回六甲博多計算代数会議 一般講演「行列 Horner 法の並列化の実装について」

3月16日から18日まで、神戸大学で行われた研究会「Risa/Asir Conference 2013 + 第5回六甲博多計算代数会議研究会」にて、田島慎一先生(筑波大学)、小原功任先生(金沢大学)と共同で「行列 Horner 法の並列化の実装について」というタイトルで講演を行いました。

これは、田島先生、小原さんと取り組んでいる、行列のスペクトル分解や固有ベクトル計算などの一連の計算のによく現われる計算で「1変数多項式に行列を代入する」計算が、計算機では(行列や多項式のサイズが大きくなると)なかなか大変なので、計算効率を改善しようという取り組みの一つです。

昨夏の研究発表の際は、並列計算の効果がなかなか上がらないという課題がありましたが、昨年の夏休みに金沢大学の小原さんのもとに滞在して実装を改善し、その後も徐々に改良を重ねて今回の結果を出しました。

少し詳細を述べますと、これまでの行列 Horner 法の効率化は、行列どうしの積の算法は古典的算法のまま扱い、行列どうしの乗算の回数を減らすことで全体の計算を効率化させる方針をとっています。それを踏まえて並列化する部分を検討したところ、行列どうしの乗算の部分を並列化することにしました。

並列化の実装には、数式処理システム Risa/Asir 上で、小原さん作の「並列計算フレームワーク oh_p」を用いました。もともと、Risa/Asir では、並列計算基盤の OpenXM を使うことができますが、現時点では基本的な命令しか実装されていません。このため、一般ユーザが使うのにはちょっと敷居が高かったですが、oh_p の登場により、これまでよりもかなりお気楽に並列計算の実装が可能になると思います。

行列 A と B の積を並列化する際には、A の方を何らかの形で分けて B との積をとる計算を、同時にいくつかのプロセスに振り分けます。A の分け方として、1) A を1行ずつ行ベクトルに分ける、2) A をプロセス数と同じ個数のブロックに分ける、の2方法を比較した結果、2) の方がより並列計算の効果が現われることを実験で確かめました。その理由としては、2) の方が並列計算のプロセスの起動回数が少ない分、並列計算に伴うプロセスの起動やプロセス間の通信などの手間が省けるためだろうと推測しています。

以上が講演の概要です。参考までに、講演時のスライドを以下に掲げます。

行列 Horner 法の並列化の実装について (A Parallel Implementation of Horner's Rule for Matrices) by Akira Terui


0 件のコメント: