自聊天机器(qì)人(rén)ChatGPT火(huǒ)爆以(yǐ)来,微软公司创始人比尔·盖茨(cí)已多次公(gōng)开谈(tán)论人(rén)工(gōng)智能话(huà)题。在最近的一次采访(fǎng)中,他再次表示(shì):“AI可能会让科(kē)技行业迎来一次(cì)剧(jù)烈的洗牌(pái)”。
这个结(jié)论是他在当地(dì)时间2月(yuè)20日接受《In Good Company》节目(mù)专访(fǎng)时提(tí)出的。
他预(yù)期,AI的发(fā)展可(kě)能会威胁到(dào)谷歌的(de)市占率,因(yīn)为微软在AI方面(miàn)的行动相(xiāng)当迅速(sù)。而(ér)最(zuì)终科技巨头将把AI整合成(chéng)用户的“全能助手”,包(bāo)揽一切应(yīng)用,与人们(men)进行沟通并提供建议(yì),可(kě)以取代亚(yà)马(mǎ)逊、Siri或Outlook等(děng)应用。
大佬口中全能助手(shǒu)的到来可能(néng)尚需(xū)时(shí)日,但由(yóu)ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出(chū)重围。
01
ControlNet颠覆AI绘(huì)画新玩法
AIGC向可控(kòng)靠近
以AI绘(huì)画为(wèi)代表的AIGC上一次爆火(huǒ)的时候,还是2022年8月,在美国(guó)科罗拉多州(zhōu)举办的(de)新兴数(shù)字艺(yì)术(shù)家竞(jìng)赛中,一幅名为(wèi)《太空歌剧院(yuàn)》的(de)作品获奖。
随后各大厂商的(de)AI绘画软件被广大网友熟(shú)知并体验,Stable Diffusion便(biàn)是其中代(dài)表(biǎo)。
用户们可以(yǐ)在应用中输入(rù)一组关(guān)键(jiàn)词或者一张照片(piàn),就能获得一(yī)幅AI创作的画(huà)作(zuò)。
作画的关键就(jiù)是所输(shū)入的文(wén)本。同一组关键词也可以创作出很(hěn)多张风格不一样的画作,这让创作(zuò)的过程就像开(kāi)盲(máng)盒(hé)。
很多用(yòng)户很喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而(ér)另一部分喜欢翻看AI绘(huì)画的“翻车”作品(pǐn)。在社交媒体上,许多用户(hù)分享AI“翻车现场”,例如,一位(wèi)网友的小狗照(zhào)片(piàn)被AI画(huà)成了(le)“肌肉男”,还有网友的(de)个人照片被AI识别成了建筑(zhù)。
而如今随(suí)着ControlNet的出现与加持,以往AI绘画的填(tián)写关键(jiàn)词游(yóu)戏(xì)可(kě)能要被颠覆(fù)了。
ControlNet是一位正在斯坦福读(dú)博的中国(guó)人张吕敏创(chuàng)作的(de)一(yī)种基于(yú)控制点(diǎn)的图(tú)像变形(xíng)算法,主要用于数字图像处理(lǐ)、计算机视(shì)觉和计算(suàn)机图形学等领域。
其SD插件一经发布,在短短(duǎn)的两天内(nèi)便成为了AI绘(huì)画领域最新的热点。
在此(cǐ)之前(qián),大家用了很多方法想让(ràng)AI生成的结果尽(jǐn)可能的符合要求,但(dàn)是都不尽如人意(yì),它(tā)的出(chū)现(xiàn)代表着AI生成(chéng)开始进入真正的可控(kòng)时期(qī)。
因(yīn)为(wèi)ControlNet可(kě)以直接提取画面的(de)构图,人(rén)物(wù)的(de)姿势和画面(miàn)的深(shēn)度信息等。有了它的帮助(zhù),就不(bù)用频繁的用提(tí)示词来碰运气(qì),抽盲盒式的创作(zuò)了。
通俗的说(shuō)ControlNet相当于给(gěi)AI绘画加了“魔法”,不少博(bó)主(zhǔ)的作(zuò)品(pǐn)已经获(huò)得了大量的浏览(lǎn)量,“viggo”就是其中之(zhī)一,他用朋友的照片直接带她们(men)走进动漫(màn)世界。
viggo先用StableDiffusion图(tú)片转文字。
再用Text2Prompt插件拓展(zhǎn)找(zhǎo)到对应的关(guān)键(jiàn)词;最后用(yòng)ControlNet插(chā)件(jiàn)绑定骨(gǔ)骼(gé)开始换关键词试效(xiào)果。
通过图片就可以(yǐ)看出来,效果十分惊艳(yàn)。
更(gèng)厉(lì)害的(de)是,除了真(zhēn)实的(de)照片,草图也(yě)可以加上“魔法”,知(zhī)乎大牛“DevPoint”和(hé)“逗砂”介绍到(dào)ControlNet还能(néng)实(shí)现线(xiàn)稿(gǎo)转全彩图。大神张吕(lǚ)敏其本尊也(yě)亲自回应。
不得不(bù)说当下AIGC已经(jīng)变得越来(lái)越强大,甚(shèn)至输(shū)出的作品(pǐn)都已经能以假乱真了。
02
难辨虚实(shí),AIGC技术(shù)力爆发
警(jǐng)惕安(ān)全问题(tí)
近日,“苏州金鸡湖有游艇p过生日小寿星一般指几岁,十八岁可以叫小寿星吗,18岁生日可以叫小寿星吗arty”的消息火遍网络(luò),而经(jīng)过警方辟谣(yáo)这所(suǒ)谓的“party”可能(néng)是全国(guó)第一(yī)起(qǐ)AI绘图诈骗。
由于这个活(huó)动里面给出的美女照(zhào)片都是AI制作的真人照片绘图,因为太逼真,被大家当成真(zhēn)事传播(bō)了。
不过仔细(xì)观察可以发(fā)现,活动(dòng)发(fā)起(qǐ)者提供的照片中有个(gè)很大的漏洞(dòng)可以(yǐ)发现并非真(zhēn)人(rén),而是AI绘(huì)图,那便是图片中女(nǚ)性的手指部分有的存(cún)在异(yì)常。
有行业人(rén)事表(biǎo)示:“现在因(yīn)为手指(zhǐ)部分的绘画算(suàn)法(fǎ)比较复杂,AI还不(bù)太会画人的手,但最新看(kàn)到的图片已(yǐ)经有越来(lái)越(yuè)完美的(de)AI模型(xíng)出(chū)现,以后可能就完全没有漏洞了。”
类似(shì)的AI作图诈骗在国外也(yě)已有发生。据英国广播公司报道,土耳其(qí)地(dì)震期间,有Tiktok用户(hù)使用AI合成了(le)儿童受(shòu)灾的假照片发布到网络(luò),以此诱骗善良的人打(dǎ)赏“捐助”从(cóng)而实(shí)施诈骗。
目前(qián)随着技术发(fā)展,AIGC已经能做出真人(rén)照片般的绘图效果,如果这(zhè)样的图片被用(yòng)来(lái)诈骗,将(jiāng)非常(cháng)可怕。
此外AIGC还(hái)引发了很多担忧,一(yī)方面,批判者(zhě)认为AI在“学习”了(le)大量前人的作品之后,其(qí)创作没(méi)有任(rèn)何情绪和(hé)灵魂,难以和人类的(de)艺术创(chuàng)作相(xiāng)提并论。
另(lìng)一方面,AIGC背后的版权、目前都并没有得到有效的解决,还有AIGC会不(bù)会代(dài)替人类“至高(gāo)无上(shàng)”的(de)创(chuàng)意。
马斯克也强调(diào),人工智能的安(ān)全问题需要得到重视(shì),太晚就来不及了(le)。
03
AIGC下一站除了视频,还有远方
技术都是(shì)有两面性的,潜(qián)在的危害并不能掩盖(gài)其(qí)光辉的贡献。现(xiàn)在看来,人工(gōng)智能技术(shù)将是第四(sì)次工业革命(mìng)的核心驱动力量,将创(chuàng)造新的增(zēng)长奇(qí)迹(jì)。
过去一年,人工智(zhì)能(néng)在技术(shù)和商业(yè)层面都有了巨大进展,AI绘(huì)画就是(shì)人(rén)工智能技术发生方向性改(gǎi)变的一(yī)个(gè)代表(biǎo)。其下一站或许就是视(shì)频。
此前,Meta和谷(gǔ)歌先后发布了几条(tiáo)引爆科技圈的短(duǎn)视频。这些视频引发关(guān)注并非内容做得多优秀,反而都(dōu)非常(cháng)简单,比如一匹正在喝水(shuǐ)的马,一只(zhǐ)画画的玩具熊,或者一段骑摩托车的第一视(shì)角录像(xiàng),随便一个有手机的人都可(kě)以随手录下一段。
但这(zhè)些(xiē)短视频的创作方式非(fēi)常(cháng)简单,创(chuàng)作者仅仅需(xū)要向AI输(shū)入一段话,甚至只是说一下要求,AI就可以(yǐ)根据需(xū)要(yào)生成(chéng)一段视频。
谷歌发布的(de)两(liǎng)个AI生成视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是高(gāo)清,与(yǔ)Meta的Make-A-Video没(méi)有(yǒu)太多的(de)差(chà)别。
在Make-A-Video公布了(le)AI生成的视(shì)频后,AI圈就已经(jīng)玩了一(yī)波梗(gěng),一个能够做(zuò)出更高清视频的AI还(hái)不足以在短时间内戳(chuō)中(zhōng)兴奋(fèn)点。
Phenaki更加令人震惊的地(dì)方在(zài)于,它可以制作出超过(guò)2分(fēn)钟的连贯的也有确切内容的视频(pín),这才是真正让人们感到(dào)惊喜(xǐ)的(de)地方(fāng)。因为无论AI生成的视频多么(me)高清(qīng),也只(zhǐ)能是为内容生产者(zhě)提供一个灵感,一个素材(cái),一个过场动画。
不过能够制作出有(yǒu)具体剧情内(nèi)容的视频(pín)就意(yì)味着,一些视频创作(zuò)由AI代替人(rén)工(gōng)完成已经初步有了可能。
当下AI的(de)发(fā)展速度已经超过大(dà)部分人的想(xiǎng)象。内容产业的本质是供(gōng)给创造需求(qiú),AIGC作为全新的内容生产方(fāng)式,可以为内容产业(yè)带来(lái)更新的内容风格、更快的生产速度,更低(dī)的生(shēng)产成(chéng)本,这无疑会驱动(dòng)内容产业的大爆发。
除了(le)AI绘图、视频,AIGC技术还(hái)能(néng)应(yīng)用于音(yīn)乐(lè)、代码、机器人动(dòng)作(zuò)等多(duō)种内(nèi)容(róng)形式的生成(chéng)。不难发现(xiàn)该项技术(shù)不仅(jǐn)在游(yóu)戏等行业能得(dé)到有效应用,对于下一代(dài)互联网各种元素的构建(jiàn)亦有(yǒu)关键意义。
从(cóng)商业化(huà)的角度来看,文(wén)化娱乐(lè)、教育、传媒等诸多领域,本身就对基于AI的可视化内(nèi)容(róng)有强烈(liè)需(xū)求。
因此(cǐ),AI绘(huì)画及视频或(huò)不是结果,而只(zhǐ)是AI进(jìn)程中的(de)一块(kuài)重要拼(pīn)图,有望在技术(shù)更新(xīn)的加持下(xià)实(shí)现更大(dà)的应用价值。
AI从理(lǐ)解(jiě)内容,走向了可以生成内(nèi)容,甚(shèn)至能够(gòu)创造出独立价值和独立(lì)视角的内容。AIGC的(de)再(zài)次出圈,更代表(biǎo)着未(wèi)来的(de)先进生产力即(jí)将(jiāng)到来。
过生日小寿星一般指几岁,十八岁可以叫小寿星吗,18岁生日可以叫小寿星吗ecoding="async" src="https://mmbiz.heiliaofuli.com/wp-content/uploads/2023/03/9b0686cb7769bb0.png?imageMogr2/thumbnail/2160x0/format/webp/quality/80" data-ratio="0.4984375" data-s="300,640" data-type="png" data-w="1280">
04
紧抓大模型与算力,牢固AIGC底座
从技术的发展也可以看出(chū),在(zài)语言大模型、图像大模型之后,多模态大模型已经成为了(le)新的趋(qū)势。
大模型被(bèi)誉为当前人工智(zhì)能发展的智能底座,是全球(qiú)竞争最激(jī)烈的研究方向(xiàng)之一(yī),包括谷歌(gē)、亚马逊、百度、阿里、腾讯等众多(duō)头部企业都(dōu)在竞(jìng)相发力。
不(bù)过训练大模型的(de)确价格不(bù)菲,以国(guó)盛(shèng)证券发布的《ChatGPT需要多少算力》报告估算,GPT-3训练一次的成本约为140万美元。而(ér)对于一些更大的LLM(大型语言模型(xíng)),训练(liàn)成本则介于200万美元至1200万(wàn)美元高价之(zhī)间。
以ChatGPT在2023年1月的独立访客平均数1300万(wàn)计算,其对应芯片需求为3万多片(piàn)英伟达A100 GPU,初(chū)始投(tóu)入(rù)成本约为8亿美元,每日仅(jǐn)电费(fèi)就(jiù)在5万美元左(zuǒ)右。
此外不论是ChatGPT还是AIGC,都离(lí)不开(kāi)庞大算力支持。在关注各类(lèi)大模型(xíng)的发(fā)展同时,更应该(gāi)关注算力网络的建设(shè)。
算力网络正驱动AI产业发(fā)展进入史诗级加速(sù)进程(chéng),让(ràng)AIGC及通用AI这一(yī)人工(gōng)智能发展的(de)终极目标离(lí)得更近。
因为算(suàn)力可以对突破性技术(shù)创新提(tí)供(gōng)大力(lì)的支持。这方(fāng)面,多(duō)模态大模型是典型(xíng)。作为面向未来强人工(gōng)智能、通用(yòng)人工智能的重要技(jì)术创(chuàng)新,多模态大模型(xíng)已经在人工(gōng)智(zhì)能领域提出了(le)很(hěn)多年,业(yè)界也(yě)有(yǒu)不少技术(shù)突(tū)破,但是,多模态大模型进一步往(wǎng)下走(zǒu),算力(lì)需求呈几何式上升,一般的算力基(jī)础(chǔ)设(shè)施很快将难以胜任。
从图(tú)像、文字(zì)、语(yǔ)音单独一项的训练,到双模态、三模态的跃迁,让人工智能可(kě)以(yǐ)灵活应对不(bù)同模态(tài)的转化、像人(rén)与世界交互一样(yàng)自然,这(zhè)方面,由算力网络来驱动将有(yǒu)明显(xiǎn)优势。
此外,还有很多需要爆发(fā)式增(zēng)长的算力来支撑的技术创新,将在人工智(zhì)能算力网络支撑(chēng)下快速推进。
AIGC已(yǐ)经露出(chū)曙(shǔ)光,期待在大(dà)模型(xíng)和大算力的支(zhī)持下AIGC能持续颠(diān)覆内容生产(chǎn)的方式,将创造的边际成本(běn)降低,让万众受益。
未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 过生日小寿星一般指几岁,十八岁可以叫小寿星吗,18岁生日可以叫小寿星吗
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了