IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了

再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢家(jiā)之一、英伟达背后的那个身穿黑(hēi)色(sè)皮衣的男人又来了。

  前脚(jiǎo)才交出(chū)亮眼业(yè)绩狂拉股价,英伟达CEO黄仁勋(xūn)后脚就在(zài)昨日的(de)COMPUTEX大会上宣(xuān)布,“我们(men)已到达(dá)生成式AI引(yǐn)爆(bào)点。从此,全世界(jiè)的每(měi)个角落,都会有计算需求。”

  如今英伟(wěi)达掌握着(zhe)全球多(duō)家科技公(gōng)司“算力命(mìng)脉”,而在这场大会上,黄仁勋激情(qíng)演讲(jiǎng)2个(gè)小时,甩出(chū)了多(duō)项重磅新发(fā)布,包括算力“杀器”DGX GH200超(chāo)级计(jì)算机、针对游戏的ACE代工服务、MGX服务器规范等内容。

  算(suàn)力(lì)“杀器”:DGX GH200超级计算机+GH200超级(jí)芯(xīn)片

  先看“集成了英(yīng)伟达最(zuì)先(xiān)进加速计算和网(wǎng)络技术(shù)”的DGX GH200人工(gōng)智能超级计算机(jī)

  这款(kuǎn)超算(suàn)专为大规模生成式AI的负载(zài)所设计(jì),由(yóu)256块GH200超级芯片组成,拥有1 exaflop超凡AI性能、144TB内存(是英(yīng)伟达目前DGX A100系统的近500倍)、150英里光纤、2000多个风(fēng)扇。

  DGX GH200重达40000磅(约合18143千(qiān)克),堪比(bǐ)四只成年大象的体重。

  预计DGX GH200将于(yú)今年年(nián)底投入问世,英伟达暂未公布价格,而(ér)谷歌云、Meta与(yǔ)微(wēi)软将(jiāng)是首批(pī)用(yòng)户

  同时,英伟(wěi)达也正在打造自家(jiā)基于DGX GH200的大型AI超级(jí)计算机(jī)NVIDIA Helios,以支持其研究和(hé)开发团队的工作。其(qí)中采用4个DGX GH200系统、1024颗(kē)Grace Hopper超级(jí)芯片,每个都将与英(yīng)伟达Quantum-2 InfiniBand网络连接(jiē),带宽(kuān)高达400Gb/s,将于今(jīn)年(nián)年底(dǐ)上线。

  值得一提的(de)是,黄仁(rén)勋透露,DGX GH200集成的GH200 Grace Hopper超级(jí)芯片已进入全面生产

  “拉踩”CPU:成(chéng)本、功耗、处理数(shù)据(jù)量不如GPU

  在本次大会上,黄仁勋(xūn)还“拉踩”了一(yī)波CPU。他从功耗(hào)、处理数据(jù)量(liàng)等方面,指出(chū)使用GPU胜(shèng)过(guò)CPU。

  举例(lì)来说(shuō),花费1000万美元,可以建(jiàn)设一个有960颗CPU的数据中心,其可处理1X LMM(大语言模(mó)型)数(shù)据量,需要11GWh功耗;

  同(tóng)样成本下,也可以建设一个有(yǒu)48个GPU的数据中心,其可处理44X LLM数(shù)据量,仅(jǐn)需(xū)要3.2GWh功耗。

  若只想处理(lǐ)1X LMM数据量,则只需(xū)40万美元(yuán),便(biàn)可拥(yōng)有一个搭载2个GPU、功耗仅0.13GWh的(de)数据中心。

  “买越多,省越(yuè)多(duō)(The more you buy, the more you save)。”黄仁(ré再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了n)勋再次表示。

  同(tóng)时,他也(yě)列出了(le)数据中(zhōng)心(xīn)成本公(gōng)式:数据中心总持有成本=f[成本(芯(xīn)片、系统、硬件生(shēng)态系统)、吞吐量(GPU、Algo软(ruǎn)件、网络、系统软件(jiàn)、软(ruǎn)件(jiàn)生态系统)、使(shǐ)用率(Algo Lib, 软件生态系统)、采购运营(yíng)、生命周期最佳化(huà)、电力]

  ACE代工(gōng)服务:用AI激(jī)活NPC生命(mìng)

  游戏一(yī)直是备(bèi)受关(guān)注(zhù)的一大AI应用落地领(lǐng)域。英伟达也在(zài)大会(huì)上宣布(bù),推出面向游戏的定制AI模(mó)型(xíng)代工服(fú)务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家角(jiǎo)色(NPC)更智能且不断进化的对话技能,中间件、工具(jù)和游戏开发(fā)者可(kě)使用它(tā)来构建和(hé)部署定制(zhì)的语音、对话和动画(huà)AI模(mó)型

  其中包括:英伟达NeMo,使用专有(yǒu)数据构(gòu)建、定制和(hé)部(bù)署语言模型;英(yīng)伟达Riva,用(yòng)于自动语音识别和文本(běn)转语音实现实时语音对话(huà);英伟达Omniverse Audio2Face,用于即时创建游(yóu)戏角色表情动画,以匹配任何(hé)语音轨道。

  开发人员(yuán)可选择集成(chéng)整个(gè)NVIDIA ACE for Games解(jiě)决方案,也可仅使用需要的组件。

  新(xīn)参考(kǎo)工作(zuò)流(liú)程:帮助(zhù)建设数字化智能(néng)工厂(chǎng)

  黄仁勋表示(shì),全球电子制(zhì)造商正在使用(yòng)一种全新的综合参考工(gōng)作流(liú)程推进工(gōng)业数字化(huà)工作,该工作流程结合了(le)英(yīng)伟达用(yòng)于生成式(shì)AI、3D协作、仿真和自主机(jī)器的技术,包括:

  英伟达Omniverse,其连接了顶级计算机辅助设计应用以及生成式AI的API和前沿(yán)框(kuāng)架(jià);用于模拟和(hé)测试机器(qì)人的英伟(wěi)达Isaac Sim应用程序;英(yīng)伟达Metropolis视(shì)觉(jué)AI框架(jià),用(yòng)于(yú)自(zì)动(dòng)光学检测。

  同(tóng)时,黄仁勋(xūn)现场展示了(le)一个完(wán)全数字(zì)化的智(zhì)能工厂的(de)演示。

  目前(qián)富士康工(gōng)业互联(lián)网(wǎng)、宜(yí)鼎国际、和(hé)硕、广达和纬(wěi)创(chuàng)正(zhèng)在使用(yòng)这一参考(kǎo)工(gōng)作流程(chéng),具体用例包括(kuò)电(diàn)路板质保检测点自动化、光学(xué)检(jiǎn)测(cè)自动化、建设虚拟工厂、模拟协(xié)作机器人、构建及运(yùn)营数字孪生等(děng)。

  MGX服务器(qì)规范:快速高效再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了构(gòu)建百余种服务(wù)器(qì)配置

  英伟达发布(bù)NVIDIA MGX服务器规范,为系(xì)统制造商提(tí)供模块化参(cān)考(kǎo)架构,满足各种规模(mó)的(de)数据(jù)中心需求。系统(tǒng)制造商(shāng)可使用它快速且经济高效地构(gòu)建100多种服(fú)务器配置,以适(shì)应广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟达(dá)全系列(liè)GPU、CPU、DPU和网络适(shì)配(pèi)器(qì)、各种x86、完(wán)整(zhěng)软件堆栈及Arm处理(lǐ)器,还可(kě)集(jí)成到云和企业(yè)数据(jù)中心中。

  华硕、和(hé)硕、QCT、超微(Supermicro)等都(dōu)将采用MGX构建下一(yī)代加速计算机,可(kě)将(jiāng)开发成本(běn)削减(jiǎn)多(duō)达3/4,并将开(kāi)发时间缩(suō)短(duǎn)2/3至(zhì)仅需6个(gè)月

  其中(zhōng),QCT和超微(wēi)基于MGX的设计将于8月面世(shì)。超微昨(zuó)日公(gōng)布(bù)的ARS-221GL-NR系统将采用Grace CPU,而QCT的S74G-2U系(xì)统(tǒng)将采用Grace Hopper。

  推出Spectrum-X网络平台 构(gòu)建超大规模生成式AI超(chāo)级计算机Israel-1

  另外(wài),黄仁勋宣(xuān)布推出NVIDIA Spectrum-X网络平台(tái),旨在提高基于以太网的AI云的性能(néng)和效率。

  相(xiāng)比(bǐ)传统以太网结构,Spectrum-X可(kě)实现1.7倍的(de)整体AI性能和(hé)能再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了效(xiào)提(tí)升,并具有高度通用性,可(kě)用(yòng)于各种(zhǒng)AI应用。它使用完全基于(yú)标准的以太(tài)网,并可与基于以太网的堆栈(zhàn)互操作。该平台支持256个200Gb/s端(duān)口,通过单个交换机连接,或在两层leaf-spine拓扑中提供16000个(gè)端口,以支持AI云增长和扩(kuò)展(zhǎn),在保持(chí)性能(néng)的同时(shí)最(zuì)大限度减少网络延迟。

  全球领先(xiān)云计算提供商正在(zài)采(cǎi)用Spectrum-X平台扩展生(shēng)成式(shì)AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已(yǐ)在(zài)戴尔(ěr)、联想(xiǎng)等系统制造商处提供。

  此外(wài),作为(wèi)Spectrum-X参考设计(jì)的蓝图和(hé)测(cè)试平台,英伟达(dá)正构(gòu)建(jiàn)一台(tái)超大规模(mó)生成式AI超级计算机Israel-1。这台AI超算价值数亿美元(yuán),将采(cǎi)用戴尔PowerEdge XE9680服务器(qì)、英伟达HGX H100超(chāo)级计算平台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台。

  结语

  “40年来,我们创造了PC、互(hù)联网、移动、云(yún),现在是(shì)人工智(zhì)能时代。你会创造什么?不管是什么(me),都要像我们一(yī)样追赶它(tā)。要奔跑(pǎo),不要走。要(yào)么为了(le)食物奔跑,要么作为(wèi)食物奔跑。”

  在5月27日的(de)台湾大学(xué)发表了毕业(yè)典礼(lǐ)演讲上,黄仁(rén)勋再次强调了(le)掌握AI技(jì)术的重(zhòng)要(yào)性(xìng):很(hěn)多人担心,AI会抢(qiǎng)走(zǒu)自己的工作(zuò)。但真正会抢走你饭(fàn)碗的(de),是(shì)掌握了AI技术的人。

  他(tā)表示,从各方(fāng)面来看(kàn),AI的兴盛是计算机产业(yè)的再生契(qì)机。在下个十年,我们的产业将使用新型AI电脑(nǎo),取代价(jià)值万亿美(měi)元的传(chuán)统电脑。

  而从昨日大会上黄仁勋(xūn)的展(zhǎn)示中,人(rén)工智能时代的(de)未(wèi)来轮(lún)廓(kuò)似乎(hū)已(yǐ)逐渐浮现。

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 再大的胸躺下都是平的,胸明明很大但为什么一躺下就平了

评论

5+2=