第27回単独研究会(SWoPP2019)

日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第27回研究会

日本応用数理学会「行列・固有値問題の解法とその応用」研究部会では,第25回研究会を開催致します.本研究会は「2019年並列/分散/協調処理に関する『北見』サマー・ワークショップ (SWoPP2019)」において,電子情報通信学会,情報処理学会の6研究会との連携により開催されます.


講演募集

申込みは締め切りました。

プログラム

7月25日 (木) 会場:2F 7号室

セッション1:MEPA-1 行列計算1(13:25 – 14:55) 座長:多田野寛人(筑波大学)

  • 講演1(13:25 – 13:55)
    レゾルベントを用いたフィルタによる一般固有値問題の解法について
    ○ 村上 弘(首都大学東京)
    概要:一般固有値問題の固有値が指定区間にある固有対の近似をフィルタを用いて求める.フィルタはレゾルベントを用いて構成する.レゾルベントの作用は固有値問題のシフト行列を係数とする連立1次方程式を解いて実現されるが,それを行列分解を用いて解く場合に,分解の計算量と分解後の行列を保持する記憶量を減らすためには用いるレゾルベントの数を少なくしたいが,得られるフィルタの特性が悪くなる困難があるので,工夫を要する.
  • 講演2(13:55 – 14:25)
    前処理付きCholesky QRアルゴリズムとその応用
    ○ 寺尾 剛史(芝浦工業大学)、尾崎 克久(芝浦工業大学)、荻田 武史(東京女子大学)
    概要:我々は、thin QR分解におけるCholesky QRアルゴリズムの前処理手法を提案した。 この手法は、前処理による性能の低下を抑え、かつCholesky QRの数値的な不安定性を解消することが出来る。 計算時間は、従来のCholeskyQR2アルゴリズムと比較して1.5倍程度である。 本発表では、前処理手法の高速な実装方法を紹介する。 また、前処理付きCholesky QRアルゴリズムを一般化内積空間に拡張した方法を提案し、数値実験を用いてその有効性を示す。
  • 講演3(14:25 – 14:55)
    時系列データの適切なノイズ除去を行う動的モード分解の計算手法
    ○ 相島 健助(法政大学)
    概要:時系列データの特徴を捉える数値計算技術として動的モード分解が近年有力視されている.一般的に,このような時系列データに含まれるノイズの除去には特異値分解が用いられ,これにより適切に次元削減が行われる.動的モード分解にも特異値分解は標準的に用いられるが,特異値分解を行う行列データの生成法にはいくつか異なる方法が存在する.本発表では,ノイズが平均0の独立同一分布であることを仮定した場合に解へ収束する動的モード分解の計算手法を示す.

セッション2:MEPA-2 行列計算2(15:05 – 16:35) 座長:深谷猛(北海道大学)

  • 講演4(15:05 – 15:35)
    Block GWBiCGSTAB法における漸化式動的グループ化の性能評価
    ○多田野 寛人(筑波大学)
    概要:Block GWBiCGSTAB法は複数右辺ベクトルをもつ連立一次方程式の反復解法の一つで,Block BiCGSTAB法の近似解精度を改良した手法である.同法では,事前に設定した周期毎に漸化式更新量をグループ化することで精度劣化を回避するが,グループ化周期が大きすぎると収束性が低下し,グループ化終了のタイミングで相対残差が増大すると近似解精度が劣化することがある.本発表では,同法の漸化式グループ化を動的に行う手法を提案し,収束性・近似解精度の面からその性能を評価する.
  • 講演5(15:35 – 16:05)
    ブロック赤黒順序付け緩和MILU(0)前処理法のGPU実装と性能評価
    ○ 塩谷 明美(電気通信大学)、山本 有作(電気通信大学)
    概要:ブロック赤黒順序付けは少ない同期点を持ち、緩和を導入したMILU(0)法と組み合わせることで棄却要素の補償による収束加速効果と高い並列性を得ることが出来る。この前処理法をGPU並列化するためには、ブロック分割条件による収束性の変化や、GPUの並列度、データアクセス等の考慮が必要になる。本発表では、GPU上で高速に計算するための条件の検討と既存のGPU並列反復法ライブラリとの比較について報告する。
  • 講演6(16:05 – 16:35)
    倍々精度複素数に向けた効率的な手法の精度評価
    ○ 桝井 晃基(名古屋大学)、山中 脩也(明星大学・早稲田大学) 、荻野 正雄(大同大学)、片桐 孝洋(名古屋大学)
    概要:今まで倍々精度複素数演算を実装するにあたり,実数向けの倍々精度手法を用いていたが,今回は複素数の倍々精度演算手法に向けた高精度演算手法を実装しその誤差や演算性能・また反復法における性能を示す.

セッション3:MEPA-3 高性能計算(16:45 – 18:15) 座長:大島聡史(名古屋大学)

  • 講演7(16:45 – 17:15)
    ポストムーア時代の計算機環境における数値計算カーネル実装の変革
    ○ 片桐 孝洋(名古屋大学)
    概要:本発表では、ポストムーア時代の計算機環境において変革が予想される数値計算カーネル実装について述べる。本発表でのポストムーア時代の計算機環境では、ノード内においてFLOPS性能の向上よりもデータ移動性能(BYTES)の向上が相対的に高くなるという仮定を置き、この仮定の下で現在主流の実装方式は必ずしも高速とならないことを予備評価結果とともに示す。
  • 講演8(17:15 – 17:45)
    格子階層型行列法における行列ベクトル積計算の通信隠蔽手法
    ○ 星野 哲也(東京大学)、伊田 明弘(東京大学)
    概要:科学技術計算に現れる密行列の近似手法として、階層型行列法(H-matrices)が注目されている。階層型行列はそれぞれ大きさの異なる低ランク行列と密行列の集合からなり、並列計算時におけるロードバランシングやプロセス間通信が課題となる。本発表では、並列計算機向けに開発された格子階層型行列(Lattice H-matrix)とベクトルの積演算を対象とし、超並列環境に向けた高速通信手法を提案する。
  • 講演9(17:45 – 18:15)
    Parallel Preconditioned Iterative Solvers on Oakforest-PACS
    ○ Masashi Horikoshi (Intel), Kengo Nakajima (University of Tokyo/RIKEN R-CCS), Balazs Gerofi (RIKEN R-CCS), Yutaka Ishikawa (RIKEN R-CCS)
    概要:We evaluated the performance of parallel preconditioned iterative solvers, such as ICCG, on the Oakforest-PACS system operated by JCAHPC. Effects of asynchronous progress on pipelined conjugate gradient method are mainly investigated.