Pythonコードの中で、GPUで並列化したい箇所だけをCUDAで記述できるCuPyのElementwiseKernelを紹介した。パッチのマッチングを題材に、コーディング例と速度比較も掲載した。https://t.co/MTYpqxTG1N (@dl_hacks)