第二代 Versal -- 资料整理

第二代 Versal -- 资料整理AMD 在 2024 年国际嵌入式展上发布了第二代 VersalAIEdge 和 Prime 系列 SoC 提供端到端 AI 加速 包括性能提升和新型开发板如黑金 Versal 开发板

目录

1. Versal 第二代发布

1.1 第一代 Versal 分类:

1.2 升级了其中两个系列:

2. 可用开发板

2.1 黑金Versal 开发板:

2.2 官方开发板

2.3 官方Kria SOM板

3. 几个官方的概念

3.1 AI端到端加速

3.2 MX6数据类型

3.3 BDR 框架

4. 交付及过度计划

5. 资料入口


1. Versal 第二代发布

2024 年 4 月 9 日,德国纽伦堡(国际嵌入式展)——AMD宣布推出第二代 Versal AI Edge 系列和第二代 Versal Prime 系列自适应 SoC,其将预处理、AI 推理与后处理集成于单器件中,能够为 AI 驱动型嵌入式系统提供端到端加速。Versal官网链接https://www.amd.com/en/products/adaptive-socs-and-fpgas/versal.html

1.1 第一代 Versal 分类:

  • AI Edge Series:为功率和热限制的边缘应用提供卓越的AI性能/瓦,加速预处理和AI推理。
  • Prime Series:基础的Versal自适应SoC系列,提供了一系列适用性广泛的设备,跨越多个市场。
  • Premium Series:在一个可适应的平台上,网络化、功耗优化核心的突破性集成,适用于最具挑战性的计算和网络应用。
  • AI Core Series:通过集成的AI引擎提供突破性的AI推理和无线加速,这些AI引擎提供卓越的计算性能。
  • HBM Series:特性包括快速内存、安全数据和自适应计算的超级集成,适用于内存受限、计算密集、高带宽应用。

整的云里雾里的。。。

1.2 升级了其中两个系列:

  • AI Edge系列
  • Prime系列

Versal AI Edge系列第二代和Versal Prime系列第二代为AI驱动和传统嵌入式系统提供单芯片智能——平衡了性能、功耗、面积、功能安全和安全性能。Versal AI Edge系列第二代和Versal Prime系列第二代相比第一代系列提供高达10倍的标量计算能力。

2. 可用开发板

2.1 黑金Versal 开发板:

XCVE2302https://item.taobao.com/item.htm?abbucket=2&id=768663304035&ns=1&spm=a21n57.1.item.1.20cb523crjW2fj&sku_properties=1627207:30708718887;-1:-1

Versal型号:XCVE2302-SFVA784-1LP-E-S

DDR4:4GB-64bit

QSPI-Flash:64MB

eMMC:8GB

2.2 官方开发板

AMD Versal开发板https://www.xilinx.com/products/boards-and-kits/device-family/nav-versal-acap.html

 官方开发板非常贵,除非公司采购,个人承担不起。。。

2.3 官方Kria SOM板

我等官方的High Compute SOM(Versal平价版)好久了,这个Coming Soon也停留了好几年~

估计是AMD收购Xilinx影响了此板卡的推出。

官方的KR260和KV260真香~

3. 几个官方的概念

3.1 AI端到端加速

支持嵌入式计算的全部三个阶段

  1. 预处理:传感器处理、融合和数据调节
  2. AI 推理:执行深度学习算法
  3. 后处理:决策和后续举措

个人理解:实际上,将三个阶段全部部署在FPGA上也是可行的,只不过这样做会极大地增加开发难度。将一些调度和控制任务交给PS核处理,可以相对简化这一过程。

3.2 MX6数据类型

MX6是一种用于AI计算的数据类型,为了提高AI训练和推理的效率而设计的,它支持更低的位宽算术运算和更小的内存占用,从而推动硬件性能和效率的提高。MX6属于BDR框架中,识别了基于共享微指数(MX)的新格式。

3.3 BDR 框架

Block Data Representations (BDR) 是一个专为深度学习设计的框架,用于探索和评估各种窄精度格式。这里的“窄精度”指的是使用较少的位数来表示数据,旨在减少模型的存储和计算需求,同时尽可能保持性能。

BDR 允许对流行的量化标准进行比较,并通过该框架,基于共享微指数(Microexponents, MX)的新格式被识别出来,这些新格式在性能上超越了其他先进的量化方法,包括窄精度浮点数和块浮点数。

MX(共享微指数):

  • MX是一种新的量化方法,它使用多个量化缩放级别,这些级别基于共享的微指数。
  • 微指数是一种用于量化缩放的超细粒度因子,可以在硬件中实现。
  • MX的效果已经在现实世界的模型上得到了验证,包括大规模生成预训练和推理,以及生产规模的推荐系统。

INT量化:

  • INT量化是一种流行的方法,将实数值映射到整数(INT)。
  • 在INT量化中,一组实数值X被对称且均匀地映射到INT值Xq,其中Xq ∈ [2^(m-1), 2^(m-1)-1]。
  • 这种方法可以用于改善内存和通信的效率,或者在训练和推理过程中加速计算。

缩放策略:

  • 图1中的(a)-(b)展示了不同的缩放方法,包括使用更具硬件效率的量化二次幂或INT表示。
  • 最佳的缩放方法取决于实现复杂性和开销,对量化误差有着一定的影响。
  • 处理动态激活和梯度时,需要采用保守的缩放因子或动态缩放方法。

参考论文:With Shared Microexponents, A Little Shifting Goes a Long Way

4. 交付及过度计划

官方建议,设计人员可以由现已推出的 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列早期访问文档、以及第一代 Versal 评估套件与设计工具入手。

AMD 预计于 2025 年上半年提供第二代 Versal 系列芯片样片,随后于 2025 年年中提供评估套件及系统模块( SOM )样品,并预计于 2025 年末提供量产芯片。

但愿明年中能入手一个High Compute SOM~

5. 资料入口

Microexponents数据类型https://arxiv.org/pdf/2302.08007.pdfhttps://github.com/Xilinx/Vitis_Librarieshttp://Vitis_Librarieshttps://github.com/Xilinx/Vitis-Tutorialshttp://Vitis-Tutorials

 

 

今天的文章 第二代 Versal -- 资料整理分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2024-12-16 07:51
下一篇 2024-12-16 07:46

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/88166.html