暗号アルゴリズムの高速化を目指し、Intel CPUのAVX-512IFMA52命令サブセットを使用したモンゴメリ乗算の実装に取り組みました。
本記事では、AVX-512IFMA52の導入により高速な整数乗算が可能となり、SIMD実装におけるデータ配置の最適化が述べられています。実際のプログラムの性能比較では、AVX-512IFMA52を使用した実装が高速であり、その効果が数値(その他の実装より約85%高速化)で示されています。
詳細は以下のブログ記事をご覧ください
ブログ記事:Intel AVX-512IFMA52 命令セットによるモンゴメリ乗算の高速化
本Techブログ記事の完成には、インターン生の宮下敦行様に協力していただきました!