前言
本系列为CUDA入门的学习笔记,调整和优化一些知识点次序使得其更加容易阅读和学习。
本系列主要面向拥有自己的Nvidia CUDA 开发环境,并致力于高性能计算工作的人群。
本文建议环境GPU:1060 >CUDA toolkit:10.0+;
本文测试环境GPU:Laptop 3060 >CUDA toolkit:11.6;
(TODO: 在代码中增加架构属性检查以便处理这方面问题)
在此感谢参考书籍和参考项目的作者,本项目仅供学习使用,转载请注明出处。
目录
- CUDA Basic
- CUDA Memory Management
- CUDA Kernel
- CUDA Kernel Exection and Optimization
- CUDA Debug and Profile
- CUDA Libraries
- Deep Learning in CUDA
- Embedded CUDA
目录说明:
1. CUDA Basic:安装开发环境,测试CMake编译环境,编写第一个CUDA的程序
2. CUDA Memory Management:讨论CUDA基础元素,CUDA内存分类
4. CUDA Kernel Exection and Optimization:讨论CUDA Kernel执行调度优化。
5. CUDA Debug and Profile:讨论如何Debug和计算CUDA代码的性能指标
6. CUDA Libraries:讨论CUDA相关库
7. Deep Learning in CUDA:讨论使用CuBlas,CuDNN 和 TensorRT的数据科学分析及深度学习
8. Embedded CUDA:讨论嵌入式CUDA环境,主要指Jetson(视我能买到什么Jetson而定)
这些目录并没有完全包含CUDA的方方面面,进一步学习可以从相关资源的书籍和官方文档中学习。也非常建议在阅读相关章节时,以相关官方文档作为参考,本系列专栏只是开胃大餐前的小甜点。
相关资源
书籍
以下书籍都可以在library.lol 找到
- 《Jaegeun Han, Bharatkumar Sharma - Learn CUDA Programming_ A beginner's guide to GPU programming and parallel computing with CUDA 10.x and C_C++-Packt Publishing (2019)》
- 《Richard Ansorge - Programming in Parallel with CUDA_ A Practical Guide-Cambridge University Press (2022)》
项目
链接
- Nvidia CUDA Toolkit Documentation
- CUDA C++ Programming Guide
- CUDA C++ Best Practices Guide
- NVIDIA-developer-blog
更新日志
2023-04-20 创建 入门学习笔记目录
本文参与了SegmentFault 思否写作挑战赛,欢迎正在阅读的你也加入。