随着当前深度学习模型(特别是Transformer架构)不断地增大,计算需求也不断增大。
提升计算速度的一种方式是并行计算,即利用并行的思路拆解目标计算,使其能用并行的方式进行计算从而能够在一定程度上加快计算。
而在具体的实践中,除了考虑并行计算的方法之外,还需要考虑不同硬件的计算性能,通信时间等。
在这里从基础的内容到并行计算再到具体的模型案例进行梳理和介绍
从基础的C语言到并发编程基础,再到并行计算基础:
- C/C++基础:熟悉C/C++的基础内容。
- 并发编程基础:熟悉基于C/C++的并发编程基础内容。
- 并行计算基础:熟悉并行计算基础。
- 具体项目案例:以小的案例为主,一些大型案例以新的仓库为主
注:该项目主要是个人的学习笔记,其目的主要是快速熟悉并行计算的相关思路和技巧。
官网:https://nodejs.org/en/download/package-manager
# 安装docsify
npm i docsify-cli -g
# 启动docsify
docsify serve ./docs