中国书画艺术中国书画艺术

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大(dà)家好,我是刘强东,今天是(shì)不是看 起来有些(xiē)不同?很久(jiǔ)没直(zhí)播,还有些许紧张……话不多(duō)说,老刘的数字直播(bō)带货现在开始。”4月(yuè)16日,京东创始人刘强东在京东平台开启数字(zì)人直播。

“东哥”数字人直播(bō),迅速引(yǐn)起广泛关注,数(shù)字人替代真人直播的时代来临了吗?

4月18日,数字人(rén)头部厂商硅基智能创始人司马华鹏接受了《每日经济新闻》记者的专访。司马华鹏表示:“刘强(qiáng)东这次(cì)数字人直播,对我(wǒ)们行业是非常大 的品(pǐn)牌宣传。他使用(数(shù)字人直播),说明这个行业得到了一次非常重(zhòng)要的认可。”

对于AI的使用,司马华鹏建议:“未(wèi)来所有使用 AI的人,应该专注到人类特有的(de)东西,比如创意,比如有温度的东 西。”

拆解数字人技术

“数字人刘强 东(dōng)”是(shì)否有(yǒu)硅(guī)基智能技术的(de)支持?司马(mǎ)华鹏表示:“我们不太方便对外公(gōng)开,但这些技术(shù)最早的开创(chuàng)者肯定是我们。我们在(zài)整个(数字人)直播上大(dà)概有40多(duō)项发明专利,在申请的也有几十项。现在行业 内有很多在使用我们的技(jì)术授权,也有(yǒu)很多在使用(yòng)硅基智能的API(应用程序编程接口)。”

“东哥(gē)”数字人究竟是如何打造出来的?司马华鹏介绍(shào):“它(数字人(rén))这些内(nèi)容是用AI渲染出来的。如果现在想做东哥同款 ,你需(xū)要提(tí)供几分钟的视频(pín)。然后我们(men)会将其训练成一个数字人模型(xíng)。这个数字(zì)人模型背后,将由(yóu)大模型驱(qū)动它。定时(shí)去上(shàng)一些产(chǎn)品、定时回复一些客户需求、定时作一些记录,这些都是事先做好的剧本,这些剧本实质由大模型(xíng)驱动(dòng),比较接近(jìn)于人类的行为和反馈。”

那么,除了上述(shù)AI渲染技术外,数字人直播还(hái)需要哪些技术(shù)支持?司马华 鹏称:“我们(men)的大模型是多模态的,是文本生(shēng)成、声音生成(chéng)和(hé)数字人(rén)生(shēng)成的结合。其实很 多人 在反馈(kuì),他(刘强东(dōng))声音和节奏感与他原来(lái)讲话不太一(yī)样。这很可能克隆(lóng)的是平时的语速,但是直播(过程中),一个用户停留(liú)时长(zhǎng)是比较短的,你(nǐ)必(bì)须在很短时(shí)间(jiān)内把大量的信(xìn)息披露出(chū)来,所(suǒ)以必须把声音放得快一些。”

对于语音合成技术,司(sī)马 华鹏表示:“我(wǒ)们全部技术都是自己的。从目前端到端的生(shēng)成来(lái)讲,(语音合(hé)成)已经是一个非常 成熟的技术。”

数字人形象、语音合成(chéng),都是外在展现(xiàn)形式(shì),数(shù)字人(rén)直播内容仍 旧离不开文本。对于文本,司马(mǎ)华鹏称(chēng):“文本大模型方面(miàn),我们基本(běn)上都是原创的技术,最近‘炎帝’大模型刚刚(gāng)通过网信办的备 案。”

能否替代真人直播(bō)?

目前,大家看到的直播带货,很可能就是数字人。司马华鹏介绍:“我(wǒ)们在2021年开创AIGC直播的大方向,(刘强东数字人)基本(běn)上(shàng)是我们2023年(nián)产品能够呈现出来的效果,这样的直播间我们已经卖 掉(diào)了上万(wàn)个,京(jīng)东、淘宝、抖音、快手和视频号平台都有。”

真人直播(bō)会(huì)面临(lín)各种复(fù)杂场景,特别是 情感交流,数字人可以做到吗?司马华鹏表示:“我(wǒ)们在看东哥直播的时候,会不会(huì)把他(数字人)当作真正(zhèng)的东哥(gē)来看(kàn),这是决定数字人(rén)智能化程度的重要标志。从开播到现在,行业有非(fēi)常多的 评(píng)价,大家觉得还是能看到一些(xiē)机械(xiè)的(de)痕迹。”<科技与生活论文0; line-height: 24px;'>科技与生活论文/p>

“这个(数字(zì)人)行业发展的核心就 是‘看不出来’。”司马华鹏强调。

其认为:“我们现在(zài)也有大量的直播间,效果(guǒ)比这个(刘强东(dōng)数字人)要好很(hěn)多。如果他这 个直播不是在自家平台,而是在其他平台(tái),很容(róng)易被机器识别出来,很快就会被限流(liú)。”

因此,在司马华鹏看来,数字人行业的核心是让整个直(zhí)播间(jiān)符合图灵测试。对于数字人行业的发展,其认为:“(该领域(yù))图(tú)灵测(cè)试(shì)1.0是分不(bù)清(是人类(lèi)还是(shì)AI);图灵测试2.0则是双向(xiàng)情感交(jiāo)互;图灵测试3.0就是‘死生相契’,未来我们与AI之间,可能是Soul Mate(心灵伴侣)的关系,它是(shì)你非常重要的助手、朋友(yǒu),也可能是你(nǐ)亲密的合作伙伴。”

目前,很多问答式大模(mó)型(xíng)主要给受众提供专业类辅助(zhù),但若诉诸情感,是否 兼具图像、声音和文本(běn)的多模态大模型更具优(yōu)势(shì)?对此,司马华(huá)鹏表示(shì)认可。“人类大脑的设计中,90%以上是针(zhēn)对图形,所以(yǐ)我们说有图有真相。基于文本,产生的是想象力,(阅读文本)的能力确实非常重要,但对大 部分人(rén)而言,(自己的大(dà)脑)生(shēng)成图片(piàn),然后再想象出一个空间,还原(yuán)出(chū)这个东西,是非常(cháng)累的。因此,多模态(tài)或者视频化交互能力,能够大大降低我们之间信息沟通对应的脑力消耗(hào)。”

对于未来AI电商的(de)形态,司马华鹏认为,未来更大的价(jià)值是专业性。比如说,假(jiǎ)设我们在食品领域有一个很(hěn)好的AI专家,它可以从数据、算法的角度(dù)给我们(men)提供很多(duō)的专业内容。这样的专家,它带来的影响力会超过现有的人类专家,这会带来真正的、更好的电商交易。

其进一步解释称:“人类在做很多行为的时候,有一定的偏颇或者偏见,或者带有一定的商业(yè)目的。而以数字和算法驱动的 AI专家,会成为我们(men)的朋友、我们的伙伴(bàn),很有可能成为AI电商未(wèi)来的主流。现在这些成本还比较高,只是出现(xiàn)在奢侈品领域。我希望未来每一(yī)类小产品(pǐn)上,都有这样一个专家顾问,来给我们提供非常好的(de)沟通交流方式。这是(shì)AI电商未来非常重要的一部分 。”

未经允许不得转载:中国书画艺术 科技与生活论文

评论

5+2=