CUDA精讲（4）-- 性能优化 - 物流网资讯

分享好友最新动态首页最新动态分类切换频道

CUDA精讲（4）-- 性能优化

2024-12-27 05:31

通信 vs 计算

Kepler架构来说，其峰值处理性能达到了3900Gflops，而其带宽只有250GB/s,约等于63Gflops。计算/通信约等于60。也就是说我们编写的程序达到的计算/通信极限是60左右，一般来说很难达到这个数值，但是我们需要朝着这个目标而努力。
计算/通信比还有一个叫法：Compute to Global Memory Access（CGMA）ratio。
具体来说，执行一个计算指令只需要1~4个时钟周期，而从global memory中访问一个数据需要400 ~ 800个时钟周期，从shared memory中访问需要1 ~ 20 个时钟周期。

CUDA精讲（4）-- 性能优化

数据预取与重用

尽量复用GPU中更快的内存空间，比如shared memory、register。即将频繁使用的数据从global memory中预取数据到shared memory中。

针对不同内存层次的优化技术

Host memory

Global memory/ Local memory

Memory coalescing
从GPU硬件的角度来看，对于global memory来说如果一个warp中的所有线程访问的是一个连续的内存地址，那么就可以批量的读取（也就是将多个线程的io request变成一个io request）内存中的数据。
因此当从global memory中读写数据的时候，尽量使得线程进行连续的内存访问，可以提高访存效率。
1. 线性的访存
2. 1:1对应
3. broadcast
  4. Memory padding：额外的增加内存避免bank 冲突，比如下面看到32个warp同时访问32个bank就会有bank冲突：
  
  但是如果我们多加一列的话，就不会存在bank 冲突了：

最新文章

短视频平台源码，短视频软件开发，短视频app源码搭建

一、短视频平台源码的功能1、短视频功能：短视频是短视频平台源码的主要功能，用户可以发布、编辑、观看短视频。2、直播功能：短视频软件开发实现直播功能，主播可以带货、连麦、进行PK。3、聊天功能：短视频app源码支持用户聊天，方便用户

金东一医生-哈尔滨市金东一医生产阴道紧致手术价格及案例口碑深解析

作为哈尔滨市产阴道紧致手术好的医生，金东一医生产阴道紧致手术精细、效果良好，引得哈尔滨市整友纷纷关注，大家想知道金东一产阴道紧致手术价位多少钱？金东一医生产阴道紧致手术贵不贵？金东一产阴道紧致手术收费价位合理，快来看看。下

自治区农业农村厅办公室关于印发2024年基层农业技术推广服务能力提升项目实施方案的通知（桂农厅办发〔2024〕10号）

各市、县（区）农业农村局，自治区蚕业技术推广站：为保证基层农业技术推广服务能力提升项目顺利实施，进一步激发各地农科院（所）改革创新活力，提升科研推广服务能力，推动现代特色农业高质量发展，现将《2024年基层农业技术推广服务能力

震惊！聊天机器人教唆少年“杀害父母”！科技到底会带给我们什么？

点击

奔驰EQE AMG怎么样内外兼修

主流车尺寸适中，能够很好的满足各方面需求，同时主流车的价格也比较合理，所以买它就对了！如今消费者买车首先就是要看这款车配置丰不丰富，对于自然也不例外。赶紧来看看它吧。先看下奔驰EQE AMG的外观，奔驰EQE AMG前脸整体看上去较为精

海外外贸独立站怎么建站？如何做外贸独立网站建站？

百度手机卫士 app下载v9.26.12

《百度手机卫士app》一款非常好用的手机软件，这一款是百度手机软件的精简版，这一版保留了核心功能删除了多种没有必要的功能和广告，减小了体积。喜欢的朋友可以来下载一下。有趣的手机软件好用的安卓软件手机安全软件下载从心出发，5.54M

谷歌浏览器官方版 v124.0.6116.78 Chrome中文版

谷歌浏览器(Google Chrome)是Google公司开发的网页浏览器。谷歌浏览器设计超级简洁，使用起来更加方便，支持多标签浏览，每个标签页面都在独立的“沙箱”内运行，很大程度上避免了恶意网页和应用软件侵入而崩溃。此外，谷歌浏览器基于更强

英文SEO（Search Engine Optimization）是一种通过优化网站内容和结构，提高网站在搜索引擎中排名的技术。它包括关键词研究、内容创建、链接建设、网站架构优化等多个方面。通过SEO技术，可以提高网站的曝光率，吸引更多的潜在客户，并最终

谷歌SEO营销攻略，解锁网站流量与品牌声望提升之道

谷歌SEO营销策略旨在提升网站流量和品牌知名度。通过关键词优化、高质量内容创作、链接建设、移动优化等技术手段，提升网站在谷歌搜索结果中的排名。利用社交媒体、付费广告等渠道扩大品牌影响力，吸引更多潜在客户，实现网站流量和品牌价

相关文章

推荐文章

重大通报“新西游是不是有挂”分享装挂步骤技巧

苹果首次开放第三方NFC支付

百度站长、SEO、收录，网站自动提交百度链接 vuejs

电网大数据分析

职场宝典：如何撰写出色简历

用AI轻松生成逼真美女写真，教你如何一键拥有梦中女友！

Portainer--Docker的图形化管理工具

微信小程序必须是公司吗,复刻版正品数据_标准版453

《K》动漫周边（官网图+画集+图标）

python爬取网页图片并下载

发表评论