GPU高性能编程CUDA实战

- 书名:GPU高性能编程CUDA实战
- 作者: JasonSanders EdwardKandrot
- 格式:PDF
- 时间:2024-07-27
- 评分:
- ISBN:9787111326793
内容简介:
UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高性能编程CUDA实战》首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA C的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA C的基本语法和使用模式。通过学习《GPU高性能编程CUDA实战》,读者可以清楚了解CUDA C中每个功能的适用场合,并编写出高性能的CUDA软件。
《GPU高性能编程CUDA实战》适合具备C或者C++知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计算的学生和教师的教辅。
Jason Sanders是NVIDIA公司CUDA平台小组的高级软件工程师。他在NVIDIA的工作包括帮助开发早期的CUDA系统软件,并参与OpenCL 1.0规范的制定,该规范是一个用于异构计算的行业标准。Jason在加州大学伯克利分校获得计算机科学硕士学位,他发表了关于GPU计算的研究论文。此外,他还获得了普林斯顿大学电子工程专业学士学位。在加入NVIDIA公司之前,他曾在ATI技术公司、Apple公司以及Novell公司工作过。
Edward Kandrot是NVIDIA公司CUDA算法小组的高级软件工程师。他在代码优化和提升性能等方面拥有20余年的工作经验,参与过Photoshop和Mozilla等项目。Kandrot曾经在Adobe公司、Microsoft公司工作过,他还是许多公司的咨询师,包括Apple公司和Autodesk公司。
下载地址:
标签:
文章链接:https://www.dushupai.com/book-content-56867.html(转载时请注明本文出处及文章链接)
- 上一篇: Retracing the Aurochs
- 下一篇: 性与文本的政治
最新评论:
更多
-
我想养条柴2021-05-14部分内容已过时。总体好评,推荐阅读。
-
牧2022-01-11虽然内容比较浅,没有我想看的shm、bank conflict等相关的内容;但是更深的理解了多gpu的内容。收获还是很大的
-
桃夭2015-01-06真正的实战,通俗易懂,适合入门
最新书摘:
更多
-
豆友19075702013-01-03CUDA架构中,warp是指一个包含32个线程的集合,这个线程集合以步调一致的形式执行,warp中的每个thread都将在不同的数据上执行相同的指令。当处理常量内存时,nVidia硬件将把单次内存读取操作广播到每个half warp(即16个thread)。如果在half warp中的每个线程都从常量内存的相同地址上读取数据,那么GPU只会产生一次读取请求并在随后将数据广播到每个thread。
-
豆友19075702013-01-03与从全局内存中读取数据相比,从常量内存中读取相同的数据可以节约内存带宽,原因有两个:1.对常量内存的单词读操作可以广播到其他的邻近线程,这将节约15次读取操作;2.常量内存的数据将缓存起来,因此对相同地址的连续读操作将不会产生额外的内存通信量。
-
豆友19075702013-01-03CUDA C编译器对共享内存中的变量与普通变量将分别采取不同的处理方式。对于在GPU上启动的每个线程块,CUDA C编译器都将创建该变量的一个副本。线程块中的每个线程都共享这块内存,但线程却无法看到也不能修改其他线程块的变量副本。这就实现了一种非常好的方式,使得一个线程块中的多个线程能够在计算上进行通信和协作。
猜你喜欢:
-
经济管理
-
经济管理
-
经济管理
-
经济管理
-
经济管理
-
经济管理
-
经济管理
-
经济管理