自(zì)聊天机器人ChatGPT火爆以来,微软公司创始人比尔(ěr)·盖(gài)茨已多次(cì)公开谈论人工智能话(huà)题。在(zài)最(zuì)近的一(yī)次采访(fǎng)中(zhōng),他再次表示(shì):“AI可能会(huì)让(ràng)科技行业(yè)迎来一次剧烈的(de)洗(xǐ)牌”。
这个结论是他在当地时间2月20日接受《In Good Company》节目专(zhuān)访时(shí)提出的。
他预期,AI的发展可能会威胁(xié)到谷歌(gē)的(de)市占率(lǜ),因为微软在AI方面(miàn)的行动相(xiāng)当(dāng)迅速。而(ér)最(zuì)终科技(jì)巨头将把(bǎ)AI整合(hé)成用户(hù)的“全能助手”,包揽(lǎn)一切应(yīng)用,与(yǔ)人(rén)们进行沟(gōu)通并(bìng)提供建议,可以取代(dài)亚马(mǎ)逊、Siri或Outlook等应用。
大佬口(kǒu)中(zhōng)全能(néng)助(zhù)手的到来可能尚需时日,但由(yóu串子是什么意思网络,足球串子是什么意思)ControlNet引发的(de)又一次AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热点包(bāo)围中杀出(chū)重围。
01
ControlNet颠覆AI绘(huì)画(huà)新玩法
AIGC向可控靠近
以AI绘画为代表(biǎo)的(de)AIGC上一次爆火的时候,还是2022年8月,在(zài)美国科(kē)罗(luó)拉多(duō)州举(jǔ)办的(de)新兴数(shù)字艺术家竞赛中,一(yī)幅名为《太空歌剧院》的作品(pǐn)获奖。
随后各(gè)大厂商的AI绘画软件被广大(dà)网友(yǒu)熟(shú)知并体(tǐ)验,Stable Diffusion便是其中代表。
用户(hù)们(men)可以在应用中输入一(yī)组(zǔ)关(guān)键词或(huò)者一张照(zhào)片,就能获得一幅AI创(chuàng)作的画(huà)作。
作画的关键就是所输(shū)入的文(wén)本。同一(yī)组关键(jiàn)词(cí)也可以创作出很(hěn)多张风格不一样的(de)画(huà)作(zuò),这让(ràng)创作(zuò)的过(guò)程就(jiù)像开盲盒。
很多用(yòng)户很喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而另一部分(fēn)喜欢翻看(kàn)AI绘画的“翻(fān)车”作品。在社交媒体上,许(xǔ)多用户分享AI“翻(fān)车现场(chǎng)”,例如,一位网友的(de)小(xiǎo)狗照片被AI画成了“肌肉男”,还有网(wǎng)友的个人照片被AI识别成了建(jiàn)筑(zhù)。
而(ér)如(rú)今随(suí)着ControlNet的出现与加持,以往AI绘画的填写关键词游(yóu)戏可能要被(bèi)颠覆了。
ControlNet是(shì)一位(wèi)正(zhèng)在斯坦福(fú)读博的中(zhōng)国人张吕(lǚ)敏创作的一(yī)种基于控制(zhì)点的(de)图像变形算法,主要(yào)用于数字图像处(chù)理、计(jì)算机视觉(jué)和(hé)计算机图形学等领域(yù)。
其SD插件(jiàn)一(yī)经(jīng)发布,在短短的两天内便成为了AI绘画领域最新的热(rè)点。
在此(cǐ)之前,大家用了很多方法想让(ràng)AI生成(chéng)的(de)结果尽可能的符合(hé)要(yào)求,但(dàn)是(shì)都不尽如人意,它的(de)出现代表(biǎo)着AI生(shēng)成开始进入真正的可控时期。
因为ControlNet可以直(zhí)接提(tí)取画面的构图,人物的姿势和画面的深度信(xìn)息等。有(yǒu)了它的(de)帮助,就不用频(pín)繁的用提示词来碰(pèng)运(yùn)气,抽盲盒式的创作了。
通俗的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品已经获(huò)得了大量(liàng)的浏览量,“viggo”就(jiù)是其中之(zhī)一,他(tā)用朋友的照片直(zhí)接(jiē)带她们走进动漫世界(jiè)。
viggo先用StableDiffusion图片转文(wén)字。
再用Text2Prompt插件拓(tuò)展找(zhǎo)到(dào)对应的(de)关键词;最后用ControlNet插(chā)件绑定骨(gǔ)骼开(kāi)始换关(guān)键词(cí)试效果。
通过图片(piàn)就可(kě)以看出来,效果十分惊艳。
更厉(lì)害(hài)的是,除了真(zhēn)实的(de)照片,草图也(yě)可以加上(shàng)“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能(néng)实现线稿转全彩图(tú)。大神张吕敏(mǐn)其本(běn)尊也(yě)亲(qīn)自回应。
不得不说当下AIGC已经变得越来越强大,甚至输出的(de)作品都已(yǐ)经能以假乱真了。
02
难(nán)辨虚实,AIGC技术力爆发
警惕安全问题
近日,“苏州(zhōu)金鸡湖(hú)有游艇party”的消息火遍网络,而经过警方辟谣(yáo)这所谓的“party”可能(néng)是全国(guó)第一起(qǐ)AI绘图诈骗。
由于这个活动里面给出的美女照(zhào)片都(dōu)是AI制作的真人(rén)照片(piàn)绘(huì)图,因为太(tài)逼真,被大家当成真事传播(bō)了。
不过仔细观察可以(yǐ)发现,活动发起者提(tí)供的(de)照片中有个很(hěn)大的漏(lòu)洞可以发现(xiàn)并(bìng)非(fēi)真(zhēn)人,而是AI绘图,那便是图(tú)片中女性的手指部分(fēn)有的(de)存在异(yì)常。
有行业人事表(biǎo)示:“现在因为手指(zhǐ)部分的绘画算法(fǎ)比较复(fù)杂,AI还不太会(huì)画人的手,但最新看到的图片已经有越来越(yuè)完美的AI模(mó)型出现(xiàn),以后可能就完全没(méi)有漏(lòu)洞(dòng)了。”
类似的AI作图诈骗(piàn)在(zài)国外也已(yǐ)有(yǒu)发生。据(jù)英国广播公司(sī)报道,土耳其(qí)地震期间,有(yǒu)Tiktok用户使用AI合(hé)成(chéng)了儿童受灾的(de)假(jiǎ)照片发(fā)布到网络(luò),以此(cǐ)诱骗善良的人打赏“捐助(zhù)”从而(ér)实施诈骗。
目前(qián)随着技术发展,AIGC已经能做出真(zhēn)人(rén)照(zhào)片般的(de)绘图(tú)效(xiào)果,如果这样的图片被用来(lái)诈骗,将非常可(kě)怕。
此外AIGC还引发了很(hěn)多(duō)担忧,一方面(miàn),批判者认为AI在“学习”了大量前人的作(zuò)品之后(hòu),其创作没(méi)有任何情绪(xù)和(hé)灵魂,难以和人类的(de)艺术创(chuàng)作(zuò)相提(tí)并(bìng)论。
另一方面,AIGC背后(hòu)的(de)版权、目前(qián)都并没(méi)有得到有效的(de)解决,还有AIGC会不会(huì)代替人类(lèi)“至高(gāo)无(wú)上”的创意。
马斯克也强调(diào),人工(gōng)智能的(de)安全问题需(xū)要(yào)得到重(zhòng)视,太晚就(jiù)来不及了。
03
AIGC下(xià)一站除了视频(pín),还有远方
技术(shù)都(dōu)是有两面(miàn)性(xìng)的,潜在的危害并(bìng)不能掩盖其光辉的贡(gòng)献。现在看(kàn)来,人工智(zhì)能技(jì)术将是(shì)第四次工业革(gé)命(mìng)的核心驱(qū)动力量,将创造新的(de)增长奇迹。
过去一(yī)年,人工智(zhì)能在技(jì)术和商业层面都(dōu)有了巨大进展,AI绘画就是人工(gōng)智能技术发(fā)生方向性改变(biàn)的一个代表。其下一站或许就是视(shì)频。
此(cǐ)前(qián),Meta和谷歌先(xiān)后发布(bù)了几条(tiáo)引爆科技(jì)圈的(de)短(duǎn)视频。这些视频引发(fā)关注(zhù)并非内容做得多优秀(xiù),反(fǎn)而都非常简单,比如一(yī)匹正(zhèng)在喝水的马,一只画(huà)画的(de)玩具(jù)熊,或者一(yī)段骑摩托车的第一视角录像(xiàng),随便一个(gè)有手机(jī)的人都可以随手录(lù)下(xià)一段。
但(dàn)这些短(duǎn)视频的创作方式非(fēi)常简单,创(chuàng)作者仅仅需要向AI输入一段话,甚(shèn)至只是说一(yī)下要求,AI就可以根(gēn)据需要生成一段视频。
谷歌发(fā)布(bù)的两个(gè)AI生成视频分别来自(zì)于Imagen Video和Phenaki,前者主要突出(chū)的(de)是高清,与Meta的Make-A-Video没(méi)有太(tài)多的差别。
在Make-A-Video公(gōng)布了AI生成的视频后,AI圈就已经玩(wán)了(le)一(yī)波梗,一(yī)个(gè)能(néng)够做(zuò)出更高(gāo)清视(shì)频(pín)的AI还(hái)不足以在短(duǎn)时间内(nèi)戳中兴奋(fèn)点。
Phenaki更加令人(rén)震惊的(de)地方在于(yú),它可以制(zhì)作(zuò)出超过(guò)2分钟(zhōng)的(de)连贯的(de)也有确切内容的(de)视频,这才是(shì)真正让人们(men)感(gǎn)到惊喜的(de)地方。因为无(wú)论AI生成的视频多(duō)么高清,也只(zhǐ)能(néng)是为内容生产者(zhě)提供一个灵感,一个素材(cái),一个过场(chǎng)动画(huà)。
不(bù)过(guò)能够(gòu)制(zhì)作出(chū)有具体剧情(qíng)内容的视频(pín)就意味(wèi)着,一(yī)些视频创作由(yóu)AI代替人工完成已(yǐ)经(jīng)初步有了可能。
当(dāng)下AI的发(fā)展速度已经超(chāo)过(guò)大(dà)部分人的想象。内(nèi)容产业的本质(zhì)是供给创造需(xū)求,AIGC作为全(quán)新(xīn)的内容生产(chǎn)方式(shì),可以为内容产业带来更新的内容风格、更快(kuài)的(de)生产速度(dù),更低(dī)的(de)生产成本(běn),这无疑会驱动(dòng)内容(róng)产业的(de)大(dà)爆发(fā)。
除了(le)AI绘图(tú)、视频,AIGC技术还能应用于音(yīn)乐、代码、机器人动作等(děng)多(duō)种内容形式的生(shēng)成。不难发(fā)现该项技术(shù)不(bù)仅在游戏等行业(yè)能得(dé)到有效应用,对于下一代(dài)互联(lián)网各种元素(sù)的构(gòu)建亦有(yǒu)关键意义。
从商业化的角度来看,文化娱乐、教育(yù)、传媒(méi)等诸多(duō)领域,本(běn)身就对基于AI的(de)可视化内容有强烈需求。
因此,AI绘画及视(shì)频或不是结(jié)果,而(ér)只(zhǐ)是AI进程中的一块重要(yào)拼(pīn)图,有(yǒu)望在技术更新的加持(chí)下实现更大的(de)应用(yòng)价(jià)值。
AI从理解内容(róng),走向了可以生成内(nè串子是什么意思网络,足球串子是什么意思i)容,甚(shèn)至能够创造出独立价值和独(dú)立视角(jiǎo)的内容。AIGC的再(zài)次出(chū)圈,更代表着未来的先进生产力即将到来。
04
紧抓大模型(xíng)与算(suàn)力,牢固AIGC底座
从技术的发展(zhǎn)也可以(yǐ)看出,在语言大模型、图像大模型(xíng)之后,多模态大模(mó)型已经(jīng)成(chéng)为了新的趋(qū)势。
大(dà)模型被誉为当(dāng)前人工智能发展的智能底座(zuò),是全(quán)球竞争最激烈的(de)研究方向之一,包括谷(gǔ)歌、亚马逊、百(bǎi)度、阿(ā)里、腾讯等(děng)众多(duō)头部(bù)企业(yè)都在竞相发力(lì)。
不(bù)过训练大(dà)模(mó)型的确价格不(bù)菲,以(yǐ)国(guó)盛证券发(fā)布的《ChatGPT需要(yào)多少算力》报告估(gū)算(suàn),GPT-3训练一次的成本(běn)约为(wèi)140万美元(yuán)。而对(duì)于一些更大的LLM(大型语言模型),训练成(chéng)本(běn)则(zé)介于(yú)200万美元至1200万美元(yuán)高价之间。
以ChatGPT在2023年1月的独立访客平均(jūn)数1300万计算,其对应芯片需求为3万多片(piàn)英伟达A100 GPU,初始投入成本约为8亿(yì)美元(yuán),每日仅电费就在5万美元左右。
此外不论是ChatGPT还是AIGC,都离不开庞大算力支持(chí)。在关注各类大模型的(de)发展同时,更应该关注算力网络的建设。
算力(lì)网络(luò)正(zhèng)驱动AI产(chǎn)业发展进入史诗级加速进(jìn)程,让AIGC及(jí)通用AI这一人工智能发展的终极目标离得(dé)更近(jìn)。
因为(wèi)算力可以(yǐ)对突破性(xìng)技术(shù)创(chuàng)新提供大(dà)力的支持。这方(fāng)面,多(duō)模态大模型是(shì)典型(xíng)。作为面向未来强(qiáng)人工智能、通(tōng)用人(rén)工智(zhì)能的重(zhòng)要(yào)技术(shù)创新,多(duō)模态大模型(xíng)已经在人工智能(néng)领域提出了很多年,业界(jiè)也有不少技术突破,但是(shì),多模态大(dà)模型进(jìn)一步(bù)往下走,算力(lì)需(xū)求呈几(jǐ)何式上(shàng)升,一(yī)般的算力基(jī)础(chǔ)设施很快将难以胜(shèng)任。
从图像、文(wén)字、语(yǔ)音单(dān)独一项的训练,到双模(mó)态、三模态的跃迁,让(ràng)人工智能(néng)可以灵活应(yīng)对不同模态的转化、像人与世界交互一样自然,这方面,由算力(lì)网络(luò)来驱动将有明显优(yōu)势。
此外,还有(yǒu)很多需要(yào)爆发(fā)式增(zēng)长的算力来(lái)支(zhī)撑的技术创新(xīn),将在人工智能算力(lì)网络支(zhī)撑(chēng)下快速(sù)推(tuī)进。
AIGC已经(jīng)露出(chū)曙光,期待在大模型和大算力的支持下AIGC能持续颠覆内(nèi)容生产的方(fāng)式,将创造(zào)的边际(jì)成(chéng)本(běn)降低(dī),让万众受(shòu)益。
未经允许不得转载:中国书画艺术 串子是什么意思网络,足球串子是什么意思
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了