IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大家好,我是刘强(qiáng)东,今天是不是(shì)看起来有些不同?很久没直播,还有(yǒu)些许紧张(zhāng)……话不多说,老刘(liú)的(de)数 字直播带货现在开始。”4月16日,京东(dōng)创始人刘(liú)强东在京东平台开启数字人直播。

“东哥”数字人直播,迅速引(yǐn)起广泛关注(zhù),数字人替代(dài)真(zhēn)人直播的(de)时代来临了吗?

4月18日,数字人(rén)头部厂商(shāng)硅基智能创始人司马华鹏接受(shòu)了《每日经(jīng)济新闻》记者的专访。司马华(huá)鹏表示:“刘强东这次数字(zì)人直播,对我们行业是非常大的品(pǐn)牌宣传(chuán)。他使(shǐ)用(数字人直(zhí)播),说明这个行业得到了(le)一次非常重要的(de)认可。”

对于AI的使用,司马(mǎ)华鹏建议(yì):“未来所有使用AI的人,应该专注(zhù)到人类(lèi)特(tè)有的东西(xī),比如创意,比如有(yǒu)温度的东西。”

拆解 数字人技术

“数字人刘强东(dōng)”是(shì)否有硅基智(zhì)能技(jì)术(shù)的支持?司马华鹏表示(shì):“我们不太方便对外公开,但这些技术最早的(de)开创者肯定是我们。我们在整个(数字人)直播上大概有40多项(xiàng)发明专利,在申请的也(yě)有几十项。现在行业内有很多在使(shǐ)用我(wǒ)们的技(jì)术授权,也(yě)有很多在(zài)使用硅基智能的(de)API(应用程序编程接口)。”

“东哥”数字人究竟是(shì)如何打(dǎ)造出来的?司马华鹏介绍:“它(数字人)这(zhè)些内(nèi)容是用AI渲(xuàn)染出来的。如果现在想做东(dōng)哥(gē)同款,你需要提供几分钟的视频。然后我(wǒ)们(men)会将其训练成一个数字人模型 。这个数字人(rén)模型背后,将由大模型驱(qū)动它。定时(shí)去上(shàng)一些产品、定时回(huí)复(fù)一些客户需求、定时(shí)作一些记录,这些都是事先做好(hǎo)的剧(jù)本,这些剧本实质由大模型驱动(dòng),比较接近于人类的行为和反馈。”

那么,除 了上(shàng)述AI渲染技术外,数字人直播还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音(yīn)生成和数(shù)字人生成的结合。其实很多人在反馈,他(tā)(刘强东)声音和节奏感(gǎn)与他原来讲(jiǎng)话不(bù)太一样。这(zhè)很可能(néng)克隆的是(shì)平时的语速 ,但是直播(过程中),一个用户停留时长是比较短 的,你必须在很短 时 间内把大量的信息披露出(chū)来,所以必须把声音放得快一些。”

对(duì)于语音合成技术,司马华鹏表示(shì):“我们全部技术都是自己的。从(cóng)目前端到端的生成来讲,(语音合(hé)成)已(yǐ)经(jīng)是一个非常成熟(shú)的技术。”

数字人形象、语 音合成,都是(shì)外在展现形式,数字人直播内容仍旧离不开文本。对于文本,司马华鹏称:“文本大模型方面,我们基(jī)本上(shàng)都是原创的技术,最近‘炎(yán)帝’大模型刚刚通过网(wǎng)信办的备案。”

能否替 代真人直播?

<高中的新生活作文p>目前,大家看到的直播带货,很可能就是数字人。司马华鹏介绍:“我们在2021年开创AIGC直播的(de)大方向,(刘强东数(shù)字人)基本上是我(wǒ)们2023年产品能(néng)够呈现出来的效果(guǒ),这样的直(zhí)播间我们已经卖掉了上万个,京(jīng)东、淘宝、抖音、快手和视频号平台都有。”

真人直 播会面(miàn)临各种复(fù)杂(zá)场景,特别是情感交流,数字(zì)人可以做到(dào)吗?司马华鹏表示:“我们在(zài)看东哥(gē)直播的时候,会不会把他(数字人)当作真正的(de)东哥(gē)来看,这是决(jué)定数字(zì)人智(zhì)能 化程度的重要标志。从开播到现高中的新生活作文(xiàn)在,行业有非常多的评价,大家觉得(dé)还是能看到一些机械的痕迹。”

“这(zhè)个(数字(zì)人)行业发展的核心就是‘看不出来’。”司马华鹏强调。

其认为:“我们现在也有大(dà)量(liàng)的直播间,效果比这个(刘强东(dōng)数字人)要好很多。如果他这个(gè)直(zhí)播不是在自家平台,而是在其他平台,很容易被机器识别(bié)出来,很快就会被限流。”

因此,在司马华(huá)鹏看来,数字人行业的核心(xīn)是让整个直播间符合图(tú)灵 测(cè)试。对于数字人行业的发展(zhǎn),其认为:“(该领域)图(tú)灵测试1.0是分不清(是人类还是AI);图灵测试2.0则是双向情感交互;图灵测试3.0就是‘死生相契(qì)’,未来我们与AI之间,可(kě)能 是Soul Mate(心灵伴侣(lǚ))的关系,它是你非(fēi)常重要的助手、朋(péng)友,也(yě)可能是你亲密的(de)合作伙伴。”

目前,很多问答(dá)式大模型主要给(gěi)受众提供专业类辅助,但若诉诸情感(gǎn),是否兼具图像、声音和文(wén)本的多模态大(dà)模型更具优势?对此(cǐ),司(sī)马华鹏表(biǎo)示认可。“人类大脑的(de)设计中,90%以上是针对图形,所以我们说有图有真相(xiāng)。基于文本 ,产生的是想象力,(阅读文本)的能力确实非(fēi)常重(zhòng)要,但对(duì)大部(bù)分(fēn)人而言,(自己的大脑)生成图片,然后再想象出一个空间,还原(yuán)出(chū)这个东西,是非常累(lèi)的。因(yīn)此,多模态或者视频化交互能力,能够大大降低我们之间信(xìn)息沟(gōu)通对应的脑力消耗。”

对于未来AI电商的形(xíng)态,司马华鹏认(rèn)为,未来更大的价值是专业性。比如说,假设我们在食品(pǐn)领域有一个很好的AI专家,它可以从数据、算法的角度给(gěi)我们提供很(hěn)多的专业内容。这样的(de)专家,它(tā)带来的影响(xiǎng)力会(huì)超过(guò)现有的人类专家,这会带(dài)来真正的(de)、更好(hǎo)的电商(shāng)交 易。

其(qí)进(jìn)一步解释称:“人类在做很多行为的时候,有一定的偏颇或者偏见,或(huò)者带有(yǒu)一定的商业(yè)目(mù)的。而以数字和算法驱动的AI专家,会(huì)成为我(wǒ)们的朋友、我们(men)的 伙伴,很(hěn)有可能成为AI电商未(wèi)来的主流。现在这些成本(běn)还比较高,只是出现在奢侈品领域。我希(xī)望未来每一类(lèi)小产品上,都(dōu)有这样一个专家顾问,来给我们提供(gōng)非常好的(de)沟通交流方式。这(zhè)是AI电商未来非常重要的一部分(fēn)。”

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 高中的新生活作文

评论

5+2=