当前位置:首页 > 新闻中心 > 公司新闻

寒武纪获64家机构调研:公司目前已推出2款加快卡MLU370-S4和MLU370-X4 已与国内主流互联网厂商发展深刻的使用适配(附调研问答)

发布时间: 2022-12-09 03:04:31  来源:华体会平台官网app 作者:华体会平台下载 

  寒武纪2月7日宣布投资者合联营谋记载表,公司于2022年1月25日采纳64家机构单元调研,机构类型为QFII、保障公司、其他、基金公司、海表机构、证券公司、阳光私募机构。

  答:公司自创办此后无间用心于人为智能芯片产物的研发与身手更始,悉力于打造人为智能界限的中央惩罚器芯片。公司的主交易务是行使于各种云效劳器、边沿推算筑筑、终端筑筑中人为智能中央芯片的研发、安排和发卖,为客户供给丰厚的芯片产物。

  公司的紧要产物线网罗云端产物线、边沿产物线、惩罚器IP授权及软件。公司仍旧成为一家具备软硬件全栈编造本领的芯片安排公司,从云端推理思元270、边沿推理思元220、云端练习思元290,到最新宣布的推训一体思元370,公司可为客户供给分歧尺寸、全品类多场景的产物及联合的平台化根源编造软件,餍足客户的不同化需求。

  答:基于思元370的两款加快卡MLU370-S4和MLU370-X4正在实测功能和能效方面展现出肯定上风。

  MLU370-S4智能加快卡的功耗为75w,体积幼巧、能效精采,可正在效劳器中达成高密度安置。的确而言,(1)实测功能方面,MLU370-S4加快卡的功能均匀亲热商场主流70W GPU的2倍;(2)能效方面,相较于同尺寸商场主流GPU,MLU370-S4惩罚雷同AI使命的用电量可删除50%以上,将有力地帮帮用户达成“双碳”主意。其它,MLU370-S4加快卡正在解码方面拥有较强竞赛力,相较于同尺寸GPU,可供给3倍的解码本领和1.5倍的编码本领。

  MLU370-X4智能加快卡为单槽位150w全尺寸加快卡。该加快卡的上风展现为高功能,可供给256TOPS(INT8)推理算力和24TFLOPS(FP32)练习算力,同时供给FP16、BF16等多种练习精度,配合全新Cambricon Neuware软件栈,可足够餍足推训一体AI使命需求。

  问:公司新推出的思元370和第二代产物思元270的区别或者升级点再现正在哪些方面?是否会巩固公司云端产物的商场竞赛力?

  答:思元370依靠7nm造程工艺和寒武纪最新智能芯片架构MLUarch03,峰值算力可达256TOPS(INT8),是寒武纪第二代产物思元270算力的2倍。同时,思元370芯片援帮LPDDR5内存,高带宽且低功耗,可正在板卡有限的功耗界限内给AI芯片分派更多的能源,输出更高的算力。并且,寒武纪初度采用chiplet身手,通过分歧芯粒组合规格多样化的产物,为用户供给合用分歧场景的高性价比AI芯片。

  基于思元370,公司目前已推出2款加快卡MLU370-S4和MLU370-X4,已与国内主流互联网厂商发展深化的行使适配。与商场主流同尺寸GPU比拟,思元370系列加快卡正在实测功能和能效方面展现出肯定上风,更加正在语音、视觉等场景的功能展现较为精采。

  答:公司为云边端全系列智能芯片与惩罚器产物供给联合的平台级根源编造软件Cambricon Neuware,并通过络续研发和升级,以适配新的芯片。Cambricon Neuware是公司打造云边端联合的人为智能开采生态的中央部件,毋庸繁琐的移植即可让统一人为智能行使圭表便捷高效地运转正在公司云边端整个产物之上。

  公司最新升级的联合根源软件平台Cambricon Neuware整合了练习和推理的一共底层软件栈,新增推理加快引擎MagicMind,将MagicMind和深度进修框架Tensorflow、Pytorch深度交融,达成训推一体。正在寒武纪全系列推算平台上,从云端到边沿端,用户均可能无缝地结束从模子练习到推理安置的一共流程,实行乖巧的练习推理交易混布和潮汐式的交易切换,可火速反应交易转折,提拔开采安置的结果,下降用户的进修本钱、开采本钱和转移本钱。

  正在通用性方面,Cambricon Neuware援帮FP32、FP16混淆精度、BF16和自合适精度练习等多种练习方法并供给乖巧高效的练习器材,高功能算子库已完美笼罩视觉、语音、天然措辞惩罚和探寻引荐等表率深度进修行使,可餍足用户对付算子笼罩率以及模子精度的需求。

  答:修筑和完备公司联合的软件生态是提拔中央竞赛上风、达成不同化竞赛的主要身分。公司通过络续研发、升级联合的平台级根源编造软件Cambricon Neuware,以适配新的芯片。并且公司已推出智能芯片编程措辞(BANG措辞),用户既可能基于TensorFlow和PyTorch等主流编程框架接口编写代。