GPU并行计算与CUDA编程 视频教程
计算机软件界较大的变迁是从串行编程转向了并行编程。其中,CUDA起到了重要的作用。究其本质,图形处理单元(Graphics Processor Unit,GPU)是为高速图形处理而设计的,它具有天然的并行性。CUDA采用了一种简单的数据并行模型,再结合编程模型,从而无需操纵复杂的图形基元。我们也可以轻而易举的发现各种各样的开源计算机库,例如OpenCV,Caffe,TensorFlow等等,都提供了对应于GPU的使用接口,使得GPU的使用越来越主流而高效。
对并行计算,GPU编程刚兴趣的同学,熟悉C/C++编程语言。需要有带NVIDIA显卡的计算机,如果没有的同学可能需要额外购买AWS的GPU服务器,费用约是0.4美元/小时。
一. GPU与CUDA背景基础介绍
- 第1课 CUDA硬件环境,体系结构,软件环境介绍,包括平台、架构、开发工具和热点技术
- 第2课 并行编程介绍,CUDA核心概念,包括网格、线程块,不同类型内存的工作机制
二. CUDA编程基础
- 第3课 CUDA设备内存、常量内存、共享内存和纹理内存,CUDA流和事件
- 第4课 CUDA执行模式、线程调度、内核执行和CUDA存储器的使用
- 第5课 CUDA流处理器簇、多GPU编程、纹理操作
三. CUDA性能优化与设计
- 第6课 CPU/GPU协同编程,串行/并行程序中提高并行度的常用策略
- 第7课 流式负载以及使用GPU做应用程序性能优化常用策略
- 第8课 在集群中使用CUDA
四. 实战项目经验
- 第9课 应用CUDA做高维数据处理
- 第10课 CUDA+OpenGL做图形渲染
- 第11课 CPGPU实现视频流实时光流跟踪
- 第12课 深度学习框架中的GPU应用