网站地图官方微信:
网站首页 福利镇 梅村镇 横路乡 新里镇 大富乡 薛镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | Caddy 和 Nginx 比有哪些优点和缺点? |

    本内容是对知名性能评测博主 Anton Putra Ngin...

    查看详情>>
  • | 高校里那些「非升即走」后「走」了的青年教师都怎么样了? |

  • | 导师给了1.4W要我给工作室买个主机,是整机还是自己配? |

  • | 你们学校的校花都是怎么样的? |

  • | NAS的盘是否需要一次性买齐? |

  • | 为什么 CRT 画质这么好也被淘汰,液晶反而发展的很好? |

  • | 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二? |

  • | ***拍大尺度片子时摄影师不会看光吗? |

  • | Firefox是如何一步一步衰落的? |

  • | 四口之家100M的宽带够用吗? |

  • | 什么是稳定币?有人说它是「一场饮鸩止渴的游戏」,你怎么看? |

  • 我看某音上有不少河南老乡在非洲教会很多当地人说河南方言,最有...

    2025-06-22
  • 扔掉Mac是不可能的 但没有什么比Windows更适合被苹果...

    2025-06-22
  • 你看,我在这个回答中说: 女生真正的完美身材是什么样子? -...

    2025-06-22
  • 只吞了init的。 剩下的那些玩意儿,只是套个壳。 比如...

    2025-06-22

关注我们

添加微信好友,关注最新动态