AI

AMD现已完结了对赛灵思的收买,个人外汇出资美股处分由于曩昔一年半时刻里AMD的股价上涨,终究本钱靠近490亿美元,而非在2020年10月宣告该买卖时估量的350亿美元。

现在外界很自然地想了解CPU和GPU规划师将怎么运用他们所取得的东西。不仅是作为Xilinx器材中心的FPGA可编程逻辑,还包括在悉数FPGA混合中变得遍及的模块,例如DSP引擎、AI加速器、内存操纵器、I/O操纵器和其他类型的互连SerDes。

AMD需求很长时刻才干树立一支工程师团队,个人外汇出资美股处分才干具有赛灵思在可编程逻辑方面以及在其航空航天、国防、电信/通讯、工业和播送/媒体事务范畴所取得的专业学识。再加上Vitis软件仓库,这便是为什么赛灵思的价值超过了一家在其他范畴具有收入和赢利流且与AMD中心事务几乎没有堆叠的公司的价值。这为AMD打开了一个更广泛的潜在出售市场,LisaSu估量AMD潜在出售市场到达1350亿美元,远超于六个月前猜测的790亿美元规划。

AMD以及数据中心的任何要害芯片规划师都不明晰他们从第三方取得了多少IP块的答应。这或许会比人们许多人意识到的本钱更高,假定赛灵思实际上创立了自己的内存操纵器、I/O操纵器、络操纵器和更通用的SerDes以及片上互连,那么AMD或许跟着时刻的推移转移到赛灵思IP块,然后能够节省一些本钱。赛灵思IP块会比AMD的更好還是杰出从AMD仓库中消逝,将来将有各种或许性来改善AMD在CPU和GPU插槽中的内容以及它怎么从中创立自己的新IP。

dde决策(东方精工)

例如,个人外汇出资美股处分幻想一下根据XilinxSerDes的数据中心级InfinityFabric交流结构以及由AMD和Xilinx交融团队一起创立的数据包处理引擎?幻想一下类似于IBM为其Power10处理器创立的内存区域络,但跨机架、EpycCPU和InstinctCPU加速器的运作。

看看Versal系列的“Everest”一代中的XilinxFPGA混合器材:

那些用于机器学习推理的AI矩阵引擎和用于各种信号处理的DSP引擎是曩昔在可编程逻辑中完结的模块,个人外汇出资美股处分赛灵思在其Versal系列中一向将其称为自适应引擎。

AMD的工程师在考虑怎么构建核算引擎、体系和集群,能够运用这些模块中的每一个,包括Arm内核。AMD规划的每个核算设备,不管是单片芯片還是封装中的小芯片调集,都能够在AMD以为适宜的时分增加一些可编程逻辑。

那么除了在很大程度上保持事务不变之外,个人外汇出资美股处分AMD将怎么与赛灵思协作呢?它还没有说,除了说AMD在买卖失利之前现已授权了一些XilinxIP,并且不管该IP是什么,都将在之前的某个时分隐藏在AMD芯片中下一年年末。

首要,人们以为整个CPU和整个FPGA的单芯片混合完结是不太或许的,但有或许会产生一起封装的CPU-FPGA混合。

这是英特尔早在2014年就与FPGA制造商Altera协作的东西,个人外汇出资美股处分甚至在它收买该公司之前,然后英特尔在2018年宣告将“Skylake”至强SP处理器与Arria10FPGA混合在一个封装中。人们以为这些并没有在数据中心起飞,原因与为什么人们在数据中心的单个封装中看不到CPU-GPU混合体的原因相同。除非是比较特别的状况,例如带有集成显卡的PC芯片被从头用作媒体处理服务器引擎,就像AMD和英特尔曩昔在其嵌入式产品线中所做的那样。

在CPU-GPU复合体中,英特尔将125w的20核XeonSP-6138P与额外70w的Arria10GXFPGA1150放在同一封装中。它们经过UltraPath互连(UPI)链接进行联接,这些链接用于与CPU进行同享内存NUMA装备,这意味着英特尔将UPI操纵器移植到Arria10上。(这个UPI操纵器如同不太或许在可编程操纵器中完结逻辑,但UPI协议或许是在硬编码SerDes之上完结的,该SerDes合适UPI的时序,可编程逻辑填补了空白。)Arria10GX没有在FPGA复合体上激活Arm内核。

AMD十多年来一向在考虑这种混合CPU-GPU核算方法及其异构体系架构,个人外汇出资美股处分甚至在一些服务器部件中完结了它们,并且显着现已为PC和大批量定制嬉戏机芯片做到了这一点。在必定程度上,InfinityFabric互连是HSA的一种完结。

AMD能够将整个CPU和整个FPGA集成在一起——由用于CPU核算的frankensocket、用于FPGA可编程逻辑的小芯片以及它们两者的同享内存和I/O集线器组成。这很风趣,由于它能够供给连接的同享插槽内跨CPU和FPGA容量的内存。运用InfinityFabric链接,它也能够跨套接字完结。正如人们所定见的,运用InfinityFabric交流,它能够跨机架甚至跨行完结。

其间一个问题是确定任何套接字中的装备。CPU与FPGA可编程逻辑的比例会因运用、职业和客户用例而异。假设将GPU参加其间,就有许多不同的变量需求排序,个人外汇出资美股处分实际上,每个芯片都会及时成为特定客户的定制部件。能够为超大规划企业和云建设者这样做,由于出售市场规划值得,但假设AMD想把它卖给其他服务供给商和大型企业,它就必定选择一些SKU,并且它所做的任何事情都或许非最理想的。

Nvidia的联合创始人兼首席实行官黄仁勋表达除了或许用于模仿自己的芯片,FPGA针对Nvidia没有任何用途。但英特尔收买了Altera而现在AMD又收买了赛灵思,至少标明,FPGA在现成CPU上运作的编程语言和用于完结某些功用或软件仓库的定制ASIC之间的鸿沟仍然具有吸引力。人们以为,一个平稳的体系将包括悉数三个核算引擎,需求用于快速串行处理和大内存占用的CPU,用于快速并行处理和高内存带宽的GPU,以及用于加速硬编码算法的FPGA,这些算法在X86或Arm处理器上的软件完结中可用,但在由于这些算法改变太大,或许由于无法付出功耗或本钱溢价,因而无法确保定制ASIC的数量。

将FPGA可编程逻辑嵌入到每个CPU插槽甚至每个GPU插槽中作为这些设备的暂存器是有含义的测验,这样它们就能够在FPGA中完结(或部分完结)的哈希算法,个人外汇出资美股处分加密算法,安全协议或虚拟开关元素,而非CPU或GPU芯片上的逻辑块中,或增加到CPU或GPU插槽的独自小芯片中,或许在CPU上运作的更高等级软件中。多年来,IBM现已将这种暂存器(请注意,非用FPGA逻辑完结的)增加到其Systemz和Power处理器中,赞同它们完结新的指令,或许创立复合指令,这些指令是在芯片显卡好久之后动态增加到架构中的。这不会是芯片/插座空间的严重组成部分。

很快就会有运用XenX86内核交给的VersallFPGA混合体,Vitis仓库将被调整,以便能够将代码编译到这些内核以及Versall核算综合体的其他元素。人们以为AMD不太或许将X86或Arm内核拉到其GPU上,但人们真实以为该公司能够创立一系列SmartNIC和DPU,这些SmartNIC和DPU混合了FPGA和X86内核-假设它具有架构含义,甚至或许是GPU雏形。AMD是SmartNIC的新手,但赛灵思非,特别是在2019年4月收买Solarflare之后。

人们希望看到AMD这样创立一个高功能的Zen4内核,个人外汇出资美股处分去掉悉数矢量引擎的部分,并在芯片上放置更多内核或在芯片上放置更多更快的内核。人们选择后者是由于在这个CPU上,人们想要惊人的串行功能。人们想要这个东西上的HBM3内存,人们以为完结256GB的容量,应该是或许的。

使用这些核算引擎模块,客户能够在体系板上、机架内和跨行装备他们需求的比率。或许有一个客户需求为每个CPU装备四个GPU,为每个具有单个InfinityFabric交流机的杂乱体系装备两个DPU。