IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大(dà)家好,我是刘强东,今天(tiān)是不是看起来有些不同?很(hěn)久没(méi)直播,还(hái)有些许紧张……话(huà)不多说,老刘的(de)数字直播带(dài)货(huò)现在开始。”4月16日,京东创始人刘强东在京东平台开启数字人直播。

“东哥”数字人(rén)直播,迅(xùn)速(sù)引起广泛关注,数字人替代真人直播(bō)的时代来临了吗(ma)?

4月(yuè)18日,数字人(rén)头部厂商硅基智能创始人司马(mǎ)华鹏接受了《每日经济新(xīn)闻》记者的(de)专访。司马华鹏表(biǎo)示 :“刘强东这次(cì)数字(zì)人 直播 ,对我们行业是非常大的品牌宣传。他使用(数字人直播(bō)),说明这个行业(yè)得到了一次非常(cháng)重要的(de)认可。”

对 于AI的(de)使(shǐ)用,司马华鹏建议:“未来(lái)所有使用AI的人,应该专注到人类特有的东西,比如创意,比如有温度的东西。”

拆解数字人技术

“数字人刘 强东”是否有硅基智能技(jì)术的支持?司马华鹏表示:“我们不太方便对外(wài)公开,但这些技术最早的开创(chuàng)者(zhě)肯定是我们。我们在整(zhěng)个(gè)(数(shù)字人)直播上大概有40多项发明专利,在申请的也有几十项。现在行业内有很多在(zài)使用我们(men)的技术(shù)授(shòu)权,也有很多在使用硅基智能的API(应用程序编程接口)。”

“东哥”数字(zì)人究竟是如何打造出来的?司马华鹏介(jiè)绍:“它(数字人(rén))这些(xiē)内容是用AI渲染出来的。如果现在(zài)想做东 哥同款,你需要(yào)提供几(jǐ)分钟的视频。然后我们会将其训练成(chéng)一个数字人模型。这(zhè)个数字人模型背后,将(jiāng)由大模型驱动它。定 时去上一些产品、定时(shí)回复一些客(kè)户需求、定(dìng)时作一些记录,这(zhè)些都是事先做好的剧本(běn),这些剧(jù)本实质由大模型(xíng)驱动,比(bǐ)较接近于人类的行为(wèi)和反馈。”

那么,除了上述AI渲染技术外,数字(zì)人直播还需要哪些技术支持?司马(mǎ)华鹏称:“我们的大模型是多模态(tài)的,是(shì)文本生成、声音(yīn)生成和数字人生成的结合。其实很多(duō)人在反馈,他(刘强东)声音和 节奏感与他原来(lái)讲话(huà)不太一样。这很(hěn)可能克隆的是平时(shí)的语速,但是直(zhí)播(过程中),一个用户停留时长(zhǎng)是比较短的,你必须在(zài)很短时(shí)间内把大量的信息披露 出来,所以必须(xū)把声音放 得快一些。”

对于语音合成技术,司马华鹏表示:“我们(men)全部技术都是自己(jǐ)的(de)。从目前端(duān)到端的生成来讲,(语音合成)已(yǐ)经是一个非常成熟的(de)技术(shù)。”

数字(zì)人形(xíng)象、语音合成,都是外在(zài)展现形(xíng)式,数字 人直播内容仍(réng)旧离不开文本。对于文本,司马华鹏(péng)称:“文本大模型方面,我们基本上(shàng)都是原创(chuàng)的技术,最近‘炎帝’大模(mó)型刚(gāng)刚通过网信办的备案。”

能否(fǒu)替代真人直播?

目前,大家(jiā)看到的直播带货,很可能(néng)就是数字人。司马华鹏介绍:“我们在2021年开创AIGC直播(bō)的 大方向,(刘强东数字人)基本(běn)上(shàng)是我们2023年产品能够呈现出来的效(xiào)果,这样的直播(bō)间我们已经卖掉了上(shàng)万个,京东、淘宝、抖音、快手和 视频号平(píng)台都有。”

真人直播会(huì)面(miàn)临各种复杂(zá)场景,特别是情感交流,数(shù)字人可以做到吗?司马华鹏(péng)表(biǎo)示:“我们在看 东哥直播的时候,会不会(huì)把他(数字人)当作真(zhēn)正的(de)东哥来看,这是决定数字(zì)人智能化程度的重(zhòng)要标志。从开播到现在,行业有非常多的评价,大家觉得还是能看到 一些机械(xiè)的生活的美好600字作文痕迹。”

“这个(数字人)行业发展的(de)核心就是‘看不出来’。”司马 华鹏强调。

其(qí)认为:“我们现(xiàn)在也(yě)有(yǒu)大量的直播间,效果比这 个(刘强东数字人)要好很多。如果他这个直播不是在自 家平台,而(ér)是在其他平(píng)台(tái),很容易被机(jī)器识别(bié)出来,很快就会被限流。”

因此,在司马华鹏看来,数字人行(xíng)业的核心是让(ràng)整(zhěng)个直(zhí)播间符合图灵测试。对于数字人行业的发展,其认(rèn)为:“(该领域)图灵测试(shì)1.0是分不清(是人类还是AI);图灵测试2.0则是双向情(qíng)感交互;图灵测试3.0就是(shì)‘死生相契’,未来(lái)我们与AI之间,可能是Soul Mate(心灵伴侣)的关系(xì),它 是 你非常重要的助手、朋友,也可能是你亲密的合作伙伴(bàn)。”

目前,很多问答式大模(mó)型主要给(gěi)受(shòu)众(zhòng)提供专 业类辅助(zhù),但若诉诸情感,是否兼(jiān)具图像、声音和(hé)文本(běn)的多模态大模(mó)型更具(jù)优势?对此,司马(mǎ)华鹏表示认可。“人类大脑的设计中,90%以上是针对 图形,所以我 们(men)说有图有(yǒu)真相。基于文本,产生(shēng)的是想象力,(阅读文本)的能力确实非常重要,但对大部分人而言,(自己的大脑)生成图片 ,然后再想象出(chū)一个空间,还原(yuán)出这个东西(xī),是非常累的。因此,多模(mó)态或者(zhě)视(shì)频化交互能力,能够大(dà)大降低我们之间信息沟通对应的脑力消耗。”

对于未(wèi)来AI电商的(de)形态,司马华(huá)鹏认为,未来更大的价值是专业性。比如说,假设我(wǒ)们在食品领域有一个很好的AI专家,它可(kě)以(yǐ)从数据、算法(fǎ)的角度给我们提供(gōng)很多(duō)的专(zhuān)业(yè)内容。这样的专家,它带来的影响力会超过(guò)现有的(de)人类专家,这会带来真正的、更好(hǎo)的电商交易。

其(qí)进一步解释称:“人类(lèi)在做很多行为的(de)时候,有一定的偏颇或者偏见,或者(zhě)带有一定的(de)商业目的。而以数字和算法驱动(dòng)的AI专家,会成为我(wǒ)们(men)的朋友、我们的伙伴,很有可能成为AI电商 未来的主流。现在这(zhè)些(xiē)成本(bě生活的美好600字作文n)还(hái)比(bǐ)较高,只是(shì)出现在奢侈品领域。我(wǒ)希望未(wèi)来每一类(lèi)小产品上,都有这样(yàng)一个专家顾问,来给(gěi)我们提供非 常好的沟(gōu)通交流(liú)方(fāng)式。这生活的美好600字作文是AI电商未来非常重 要的一部(bù)分。”

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 生活的美好600字作文

评论

5+2=