IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有 的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有 的东西

“大家好(hǎo),我是刘强东,今天是不是看起来有些不同?很久没直播(bō),还有些许(xǔ)紧张……话不(bù)多说,老刘的数字直播带货(huò)现在开始。”4月16日(rì),京东创始人刘强东在京东平(píng)台(tái)开启数字人 直播。

“东(dōng)哥”数字人直播,迅速引起广泛关注,数字人替代真人直(zhí)播的时代来临了吗?

4月18日,数字人头部厂商硅基智能创始人(rén)司马华(huá)鹏 接受了《每日经济新闻》记者的专访。司(sī)马华鹏表示:“刘强东这次数字人直播,对我们行业(yè)是非常大的品牌宣传。他使用(数字(zì)人直播),说明这个行业(yè)得到了一(yī)次非(fēi)常重(zhòng)要(yào)的认(rèn)可。”

对于AI的使用,司马华鹏建议:“未来所(suǒ)有使用AI的人(rén),应该专注到人类特(tè)有的 东(dōng)西,比如创意,比如(rú)有温度的东西。”

拆解数字人技术

“数字人刘强东(dōng)”是否(fǒu)有硅基智能技(jì)术(shù)的支持?司马华鹏(péng)表示:“我们不太(tài)方便对外公开,但这些(xiē)技术最早的开创者肯定是我(wǒ)们。我(wǒ)们在整(zhěng)个(数字人(rén))直播上大概有40多项(xiàng)发明专 利,在申(shēn)请的(de)也有几十项。现在行业内有很多在使用我们的技术授权(quán),也有很多在使用硅基智能的API(应用程(chéng)序编程接口)。”

“东(dōng)哥”数(shù)字人究竟是如何打(dǎ)造出来的?司马(mǎ)华鹏介绍:“它(数字(zì)人)这(zhè)些内容是用AI渲染出来的。如果现(xiàn)在想做东哥同款,你(nǐ)需要提供几 分钟(zhōng)的视频。然后我们会将其(qí)训练成一个数字人模型。这个数字人模型背后,将由大模型驱(qū)动它。定时去(qù)上一些产品、定时回复一些(xiē)客户(hù)需求、定时作一些记录,这些(xiē)都是事先做好的剧本,这些剧本实质由大模型驱(qū)动,比较接近于人类的(de)行为和反馈。”

那么,除了上述AI渲染技术外,数(shù)字人直播还需要哪些技术支持?司马华鹏称(chēng):“我(wǒ)们的大(dà)模型是多模态(tài)的,是文本生成、声(shēng)音生成和数(shù)字人(rén)生成的结合。其实(shí)很多人在反馈(kuì),他(刘强东(dōng))声音和节奏(zòu)感与他原来讲话不太一(yī)样。这很(hěn)可能克隆的(de)是平时的语速(sù),但是直播(过程中),一个用(yòng)户停留时(shí)长是比较(jiào)短的,你必须在很短时间(jiān)内把大量(liàng)的信息披(pī)露出来,所以(yǐ)必(bì)须把(bǎ)声音放得(dé)快一些(xiē)。”

对于语(yǔ)音合成技术,司马华鹏表示(shì):“我(wǒ)们全部技术都(dō加盟茶饮第一股茶百道今日上市破发,超8000家门店高度依赖加盟商u)是自己的(de)。从目前端到(dào)端(duān)的生成来讲,(语音合成)已经是(shì)一个非常成熟的技术。”

数字人形象、语音合成,都是外在展现形式,数(shù)字人直播内(nèi)容仍旧离不开文本。对于文本,司(sī)马华鹏称:“文本(běn)大模型方面,我们基本上(shàng)都是原创(chuàng)的(de)技(jì)术,最近‘炎帝(dì)’大模型(xíng)刚刚通过(guò)网信办的备案。”

能否替代(dài)真人直播?

目前,大家看到的直播带货,很可 能就是(shì)数字(zì)人(rén)。司马华鹏介绍:“我们在(zài)2021年开创AIGC直播的大方向(xiàng),(刘强东数字人)基本上是我们2023年产品能(néng)够呈现出来的(de)效果,这样的直播间(jiān)我们已 经卖掉了上万个,京东、淘宝、抖音、快手(shǒu)和视频号平台都有。”

真人(rén)直播会面(miàn)临各种复杂场景,特别(bié)是情感交流,数字人可以做到吗(ma)?司马华鹏表示:“我们在看东哥直播的时候,会不会(huì)把他(数字人)当作(zuò)真正的东哥来看,这(zhè)是决定数字 人智 能化程度的重要(yào)标志。从开播到现在,行业有非常多的评价,大家觉得还是能看到一些(xiē)机械的痕迹。”

“这个(数(shù)字人)行业发展的核心就是‘看不出来’。”司马华鹏强调(diào)。

其认为:“我们现在也有大量的直(zhí)播间,效果比这个(刘强东(dōng)数字人)要好很多。如果他(tā)这个直播不(bù)是在自家平(píng)台,而是在其他平台(tái),很容易被(bèi)机器识别出来,很快(kuài)就会被限流。”

因此,在司马华鹏看来,数字人行业的核心是让整个直播间符合图 灵测试。对于数字人行(xíng)业的发展,其(qí)认为(wèi):“(该领域)图灵测试1.0是分不清(是人(rén)类还是AI);图灵测试2.0则是双向情感交互(hù);图灵测试3.0就是‘死生相契’,未来我们(men)与AI之间,可(kě)能是Soul Mate(心灵伴侣)的关系,它是你(nǐ)非常(cháng)重要的(de)助手、朋友,也(yě)可能是你亲密的合作伙伴。”

目前,很多问答式大(dà)模型主要给受(shòu)众提供专业类辅助,但若诉(sù)诸情感,是否兼具图像、声音和(hé)文本的多模态大模型更具优势?对此,司马华鹏(péng)表示认可。“人类(lèi)大脑的设计中,90%以上是 针对图形,所以我(wǒ)们说(shuō)有图有真相。基于文本,产(chǎn)生的是想象(xiàng)力,(阅读文 本)的能力确实非常重要,但(dàn)对大部分人(rén)而言,(自己的大脑)生(shēng)成图片 ,然后再想象出一(yī)个 空间,还原出这个东西,是非常累的。因此(cǐ),多模态(tài)或者视频化交互能力,能够大大降低我们之间信(xìn)息(xī)沟(gōu)通对应的脑(nǎo)力消耗 。”

对于未(wèi)来AI电商的形态,司马华鹏认(rèn)为,未来更大的价值是专业性。比如说,假设我们在食品领域有一个很好的AI专家,它可(kě)以(yǐ)从数据、算法的角(jiǎo)度给我们提供很多的专(zhuān)业内容。这样的专家,它带来的影响力会超过现(xiàn)有的人类专家,这会带来真正的、更好的电(diàn)商交易(yì)。

其进一步(bù)解(jiě)释称:“人 类在做很多行为的时候,有(yǒu)一定的(de)偏颇或者偏见,或者(zhě)带(dài)有一(yī)定的商业目(mù)的。而以(yǐ)数字和算法驱动(dòng)的AI专家,会成为(wèi)我们的朋友、我们的伙(huǒ)伴,很有可(kě)能成为(wèi)AI电(diàn)商(shāng)未来的主流。现在这些成本还比较高,只是出现在奢侈品(pǐn)领域。我希望未来 每一类小产品上,都有(yǒu)这样一个专家顾问,来(lái)给我们提供非常好的沟通交(jiāo)流方式。这是AI电(diàn)商未来非常重要的一部分。”加盟茶饮第一股茶百道今日上市破发,超8000家门店高度依赖加盟商>

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 加盟茶饮第一股茶百道今日上市破发,超8000家门店高度依赖加盟商

评论

5+2=