微信号:扫一扫 联系我们
Fabrice Bellard 是个什么水平的程序员?
为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
为什么当今 Web 应用不都***用 WebSocket 形式进行数据交互?
软件开发公司真就赚不到钱了吗?
当初 RTX 5090D 出来后大家都发现它的游戏性能丝毫不亚于 RTX 5090,原因就是对于很多游戏来说,在极高画质设置下,性能基本卡在渲染着色单元、内存带宽上,Tensor Core 削减的性能此时很难体现。
即使是在生成式 AI 应用例如 ComfyUI、生成式聊天对话中,性能瓶颈也往往卡在内存带宽上,我应该最先提出这个问题的。
不过经过我的大量测试,也发现了一些可能会卡在 Tensor Core 性能的应用场景,例如 ComfyUI 里跑 Flux.1 Dev NF…。