logo

G

  • 教程
  • API
  • 示例
  • 插件
  • 所有产品antv logo arrow
  • 6.1.26
  • 画布
    • 简介
    • 初始化参数
    • 场景图能力与生命周期
    • 内置对象
    • 坐标系
    • 画布事件
    • OffscreenCanvas 和服务端渲染
    • CustomElementRegistry
    • 常见问题
  • 渲染器
    • 简介
    • Canvas 渲染器
    • Canvaskit 渲染器
    • SVG 渲染器
    • WebGL 渲染器
    • WebGPU 渲染器
    • 自定义渲染器
  • 相机
    • 简介
    • 相机参数
    • 相机动作
    • 相机动画
  • 事件
    • 简介
    • 事件对象
    • 手势和拖放
    • 常见问题
  • 动画
    • Web Animations API
    • Lottie 动画
  • 基础图形
    • 基础概念
    • DisplayObject
    • Group 图形分组
    • Text 文本
    • Circle 圆形
    • Ellipse 椭圆
    • Rect 矩形
    • Image 图片
    • Line 直线
    • Polygon 多边形
    • Polyline 折线
    • Path 路径
    • HTML 内容
  • 样式系统
    • 简介
    • 继承机制
    • CSS Typed OM
    • CSS Properties & Values API
    • CSS Layout API
    • Pattern
    • Gradient
  • 三维世界
    • 材质
    • 几何
    • 光源
    • Mesh
    • 雾
    • 交互
  • 内置对象
    • EventTarget
    • Node
    • Element
    • Document
    • MutationObserver
    • 工具方法
  • GPGPU
    • 简介
    • 编程模型
    • Kernel API
    • 经典 GPGPU 的实现原理
    • webgpu-graph
  • 声明式用法
    • 使用 Web Components
  • 开发调试工具
    • G 开发者工具
    • 内置的渲染统计信息
    • 第三方开发调试工具

简介

上一篇
工具方法
下一篇
编程模型

资源

Ant Design
Galacea Effects
Umi-React 应用开发框架
Dumi-组件/文档研发工具
ahooks-React Hooks 库

社区

体验科技专栏
seeconfSEE Conf-蚂蚁体验科技大会

帮助

GitHub
StackOverflow

more products更多产品

Ant DesignAnt Design-企业级 UI 设计语言
yuque语雀-知识创作与分享工具
EggEgg-企业级 Node 开发框架
kitchenKitchen-Sketch 工具集
GalaceanGalacean-互动图形解决方案
xtech蚂蚁体验科技
© Copyright 2025 Ant Group Co., Ltd..备案号:京ICP备15032932号-38

Loading...

什么是 GPGPU ?

由于硬件结构不同,GPU 与 CPU 擅长执行不同类型的计算任务。特别的,在单指令流多数据流(SIMD)场景下,GPU 的运算速度远超 CPU。

下图来自:https://www.techpowerup.com/199624/nvidia-to-launch-geforce-337-50-beta-later-today,清晰的展示了 GPU 在每秒浮点数运算次数与数据吞吐量两项指标下的巨大优势。

gpu vs cpu

GPU 强大的计算能力早已不局限于渲染,General-purpose computing on graphics processing units 即 GPU 通用计算概念的提出将这种能力推向了更广阔的计算场景。

早期的经典系列书籍 GPU Gems Gem2 🔗 Gem3 🔗 中就收录了大量通用计算领域的实践,包括了视频解码、实时加解密、图片压缩、随机数生成、仿真等等。

现代的 GPU 更是针对特定类型的计算任务设计硬件。例如 NVIDIA 的 Turing 架构中就包含了专门进行张量计算的 Tensor Core 和光线追踪计算的 RT Core。

NVIDIA turing

为了降低开发者面向 GPU 编程的门槛,Nvidia 提出了 CUDA(Compute Unified Device Architecture,统一计算架构),开发者可以使用 C、Java、Python 等语言编写自己的计算任务代码。

而作为前端开发者,我们面对的适合并行的数据密集型计算任务也越来越多,是否能在 Web 端使用 GPGPU 技术呢?

在 Web 端应用

事实上,在 Web 端已经有了很多优秀的 GPGPU 实践,例如:

  • tensorflow.js。用户通过 API 组合调用完成计算任务。
  • GPU.js。用户使用 JS 编写简单的计算任务。
  • Stardust.js。用户使用 Mark 语言定义计算任务,实现 Sanddance 效果。

WebGL 实现

从实现角度看,以上方案都使用 WebGL 图形 API 来模拟并不支持的 Compute Shader,具体来说都是通过常规渲染管线中可编程的 Vertex/Fragment Shader 完成,如果对我们的实现感兴趣,可以阅读经典 GPGPU 的实现原理。下图来自 http://www.vizitsolutions.com/portfolio/webgl/gpgpu/,简单展示了基本的实现过程:

GPGPU based on WebGL

这当然是出于兼容性考虑,Compute Shader 中本应具有的线程组、共享内存、同步等机制都无法通过 Vertex/Fragment Shader 模拟。另外计算管线相比常规渲染管线也要精简很多。下图中左右两侧分别是 Vulkan 的可编程渲染与计算管线,来自 https://vulkan.lunarg.com/doc/view/1.0.26.0/windows/vkspec.chunked/ch09.html:

compute pipeline

当然 WebGL 2 也考虑过原生支持 Compute Shader,毕竟这也是 OpenGL ES 3.1 中的核心特性。甚至 WebGL 2.0 Compute 草案 和 DEMO 也早就提出了。但由于苹果的不支持,目前 WebGL 2.0 Compute 也仅能在 Windows Chrome/Edge 下运行。同理 WebGL 2.0 的 Transform Feedback 作为另一个选择也存在兼容性问题。

下图来自 https://slideplayer.com/slide/16710114/,展示了 WebGL 与 OpenGL 的对应关系:

WebGL vs OpenGL

WebGPU 实现

而作为 WebGL 的继任者 WebGPU,目前得到了各大浏览器厂商的支持,可以在以下浏览器中体验(需要开启实验特性 webgpu flag):

  • Chrome Canary
  • Edge Canary
  • Safari Technology Preview

目前 Chrome 94 版本已经通过 Origin trial 支持:https://web.dev/gpu/

下图来自:https://www.chromestatus.com/feature/6213121689518080,作为现代化的图形 API,WebGPU 的一大特性就是支持 Compute Shader。这理所当然成为了未来我们的第一选择:

WebGPU on Chrome

除了计算,浏览器实现 WebGPU API 时封装了 Vulkan、DX12、Metal 这些现代化图形 API 而非 OpenGL,进一步降低了驱动开销,也更好地支持多线程。对于使用者而言,过去 WebGL API 中存在的种种问题也将得到解决。目前 WebGPU 的 Shader 语言已经确定为 WGSL。

虽然 WebGPU 还处于开发中阶段,但也有了很多优秀的实践,例如:

  • tensorflow.js 正在尝试 基于 WebGPU 的 backend 实现。
  • Babylon.js 正在尝试实现 基于 WebGPU 渲染引擎。

我们面对的计算场景与挑战

当我们从通用计算领域聚焦到可视化场景时,会发现存在着很多适合 GPU 执行的可并行计算任务,例如:

  • 布局计算。G6 中的 Fruchterman 布局算法是一个很典型的例子,在每次迭代中每个节点的位置都需要根据其他节点位置进行计算,并且需要经历很多次迭代才能达到稳定状态,因此计算量很大。
  • Instanced-based 可视化。Stardust.js 正是针对这个场景,例如 sanddance 效果。
  • data transformation。在海量数据要求高交互的图表场景下,很多可并行的算法例如 reduce & scan 都可以在 GPU 中执行。P4 & P5(IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, VOL. 26, NO. 3, MARCH 2020) 在这方面有很多实践。