2021.02.03

Bfloat16 – 简介

分享:

AI 计算在计算上是昂贵的,特别是在处理 FP32 的较大数字集时。半精度 FP16 浮点数只有 8 位精度的有效数字和 5 位的指数,与 FP32 相比,其精度和可表示的数字范围都较低。

BFloat16 是由 Google 开发的,专门用来满足 AI 的特殊需求,AI 需要大量数字的范围,而对有效数字的精度要求较低。BFloat16 本质上是一个截断有效数字的 FP32,带来 FP16 的性能和 FP32 的动态范围,同时使用一半的内存。使用 BF16 的好处是可以轻松将现有的 FP32 数据转换为 BF16,以便进一步的神经处理。BF16 提供了足够的精度,没有更多。这是完成工作的合适工具。

bfloat16-2-2

BF16 bfloat16 :
1位元用于符号
8位元用于指数
2-127最小正值为2128最大正值(指数偏移量为127)。
7bit 用于有效数字

 

我们正处于人工智慧时代的边缘。拥有一种针对人工智慧的通用且快速的数字格式实现将加速我们朝着正确的方向前进。业界已经支持BFloat16格式,并在广泛的硬体平台上提供支持。格式的发明者Google在云端提供了他们自己的TPU(张量处理单元)。人工智慧加速器的事实领导者Nvidia也接受了bf16,并将其实施到他们最新的基于Ampere的硅晶片中的张量核心。CPU巨头Intel在Nervana加速器中提供了专门的解决方案,并将BF16整合到他们的AVX-512扩展中,以便在对人工智慧的依赖较少的特定使用情况下,减少的工作负载可以由CPU本身处理。ARM也将bf16整合到他们的SVE和Neon指令中。这一点非常重要,因为ARM v8在从移动设备到基础设施的广泛平台上都有使用。

 

表1 – 支援BFloat16的选定硬体列表

CPU Support
第一代和第二代英特尔® Xeon® 可扩展处理器 no
第三代英特尔® 至强® 可扩展处理器(Cooper Lake) yes
GPU 支持
Nvidia Volta (V100) No
Nvidia Turing (T4) No
Nvidia Ampere(A100) yes
AMD Radeon RX6000 No
AMD Radeon Instinct yes

 

 

相关讯息

Rack-Scale AI Infrastructure: Maximizing Performance, Efficiency, and Scalability for the AI Era
2026.06.30

Rack-Scale AI Infrastructure: Maximizing Performance, Efficiency, and Scalability for the AI Era

Driven by the explosion of Gen AI, Agentic AI, and the massive datasets behind them, computing infrastructure is evolving from standalone servers to rack-scale architectures. Modern AI workloads require a tightly integrated combination of computing, networking, storage, and cooling solutions to deliver maximum performance and efficiency. Future-Ready AI Infrastructure has become the foundation for the AI Era.

Enhancing Network Resilience with AEWIN Gen4 LAN Bypass
2026.06.30

Enhancing Network Resilience with AEWIN Gen4 LAN Bypass

Traditional LAN bypass focuses on keeping traffic flowing when a system goes down, but modern deployments require greater flexibility to balance availability and security. AEWIN Gen4 LAN bypass builds on the Gen3 foundation by introducing enhanced traffic control mechanisms to enable network behavior to better align with real-world operational demands.

Optimizing Thermal Design for High-Performance Network Appliances and Servers
2026.06.30

Optimizing Thermal Design for High-Performance Network Appliances and Servers

As modern data centers and network infrastructures continue to scale, the demand for higher computing performance is rapidly increasing. This trend drives CPU power consumption to new levels, especially with the latest server-grade processors. As a result, optimized thermal management has become a critical design factor that directly impacts system stability and performance. High-performance network appliances and servers require advanced cooling solutions to sustain performance under heavy workloads.

咨询车

您的咨询车共计 0 件产品

产品比较

您的比较共计 0 件产品

订阅电子报

数字验证

请由小到大,依序点击数字

我们使用 cookies 以确保我们的网站正常运作,个性化内容和广告,提供社交媒体功能并分析流量。我们还会与社交媒体、广告和分析合作伙伴分享您使用我们网站的信息。

管理Cookies

隱私權偏好設定中心

我们使用 cookies 以确保我们的网站正常运作,个性化内容和广告,提供社交媒体功能并分析流量。我们还会与社交媒体、广告和分析合作伙伴分享您使用我们网站的信息。

管理同意設定

必要的Cookie

一律啟用

这些 cookies 是网站运作所必需的,您无法在系统上关闭它们。

这些 Cookie 通常仅在您执行某个动作(即服务请求)时设置,例如设置隐私偏好、登录或填写表单。

您可以设置浏览器以阻止或提示您这些Cookie,但这可能会导致某些网站功能无法正常运作。

行銷的Cookie

行销 Cookie 用于追踪访客在我们网站上的旅程。其目的是显示对个别用户相关或吸引人的广告,因此对出版商或第三方广告商来说更为重要。

目标定位 Cookies
这些 Cookies 是由广告合作伙伴通过我们的网站设置的。这些公司可能会使用 Cookies 来建立您的兴趣档案,并在其他网站上向您展示相关的广告。它们只需要识别您的浏览器和设备即可运作。如果您不允许这些 Cookies,您将无法在不同的网站上体验到定向广告。

社交媒体 Cookies
这些 Cookie 是由我们添加到网站的一系列社交媒体服务设置的,以便让您与朋友和网络分享我们的内容。它们可以追踪您在其他网站上的浏览器并建立您的兴趣档案。这可能会影响您在访问其他网站时查看的内容和消息。如果您不允许这些 Cookie,您可能无法使用或查看这些分享工具。