ディープラーニングは、今日の人工知能を推進する上で大きな成功を収めています。教師あり学習の世界でラベル付きデータが限られているという課題を解決するために、教師なし学習が数年前に提案されましたが、低精度は現実的なアプリケーションを示唆しています。生成的敵対ネットワーク(GAN)は、有望な精度を備えた教師なし学習アプローチとして登場し、広く研究されています。ただし、GANの実行は非常にメモリと計算を集中的に行うため、超低速および高電力消費になります。この作業では、メモリスタベースのニューロモルフィックシステムを介した高速でエネルギー効率の良いGAN計算のための全体的なソリューションを提案しました。最初に、ハードウェアとソフトウェアの共同設計アプローチを活用して、GANの計算ブロックを効率的にマップしました。また、異なるコンピューティングブロック間の計算相関に応じて、最適な並列処理のトレーニングとテストのための効率的なデータフローを提案しました。 GANのユニークで複雑な損失を計算するために、最適化された精度とパフォーマンスを備えたdiffブロックを開発しました。ビッグデータの実験結果は、従来のGPUアクセラレータと比較して、設計が従来のGPUアクセラレータと比較して2.8倍の高速化と6.1倍のエネルギー節約を達成することを示しています。
Deep Learning has gained immense success in pushing today's artificial intelligence forward. To solve the challenge of limited labeled data in the supervised learning world, unsupervised learning has been proposed years ago while low accuracy hinters its realistic applications. Generative adversarial network (GAN) emerges as an unsupervised learning approach with promising accuracy and are under extensively study. However, the execution of GAN is extremely memory and computation intensive and results in ultra-low speed and high-power consumption. In this work, we proposed a holistic solution for fast and energy-efficient GAN computation through a memristor-based neuromorphic system. First, we exploited a hardware and software co-design approach to map the computation blocks in GAN efficiently. We also proposed an efficient data flow for optimal parallelism training and testing, depending on the computation correlations between different computing blocks. To compute the unique and complex loss of GAN, we developed a diff-block with optimized accuracy and performance. The experiment results on big data show that our design achieves 2.8x speedup and 6.1x energy-saving compared with the traditional GPU accelerator, as well as 5.5x speedup and 1.4x energy-saving compared with the previous FPGA-based accelerator.