AI绘画的“小秘密”都在这一篇文章里******
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
相约乌镇:共建网络世界,共创数字未来******
相聚诗画长廊,共绘数字未来。2022年世界互联网大会乌镇峰会将于11月9至11日举行。千年水乡再次拥抱现代互联网,吸引全世界的目光。
八年来,这里见证了一次次科技和产业的蝶变腾飞。从移动支付、大数据、智慧医疗,到5G/6G技术、人工智能……“乌镇峰会”已然成为全球网络信息领域发展的“风向标”,以及全球互联网共享共治、数字经济交流合作的重要舞台。
志合者,不以山海为远。接下来的几天,来自120余个国家和地区的近2000位代表将再次相约乌镇,坐而论道,共迎机遇挑战,共谋发展福祉,携手构建网络空间命运共同体。
跨越鸿沟,互联网让世界变得更“平”
当今世界,互联网无处不在。
出门游玩、享用美食,动动手指在地图软件里输入关键词,导航、购票、预订一站式服务悉数完成;手机“下单”,医院“接单”后派出专业护士上门,卧病在床的老人也能足不出户得到护理;“无人工厂”24小时不间断生产,“透明化生产线”监测全流程作业数据,工业互联网使“制造”变为“智造”……
作为20世纪最伟大的发明之一,互联网深刻改变着人们的生产和生活。不仅如此,互联网还将地球的千里之遥拉近为咫尺之间,让世界各国更为紧密地联系在一起。
随着互联网加速普及,全球网民数量稳步增长。《中国移动互联网发展报告(2022)》显示,截至2021年底,全球上网人口达49亿,约占全球总人口的63%。
作为网民数量最多的国家,中国业已成为名副其实的网络大国。11月7日发布的《携手构建网络空间命运共同体》白皮书显示,截至2022年6月,中国网民规模达10.51亿,互联网普及率提升到74.4%;累计建成开通5G基站185.4万个,5G移动电话用户数达4.55亿,建成全球规模最大5G网络,成为5G标准和技术的全球引领者之一。
近年来,中国在数字基建方面持续发力。不断完善的信息基础设施,让人们共享技术发展成果;数字经济向基层、农村进一步延伸;在金融、能源、高端制造、智慧城市、智能汽车等方面,数字技术不断赋能经济社会发展。
展望未来,专家认为,更多潜在应用场景将会大量涌现,从而助推新技术、新产品、新业态更新迭代。
中国工程院院士、中国互联网协会咨询委员会主任邬贺铨表示,中国宽带渗透率已很高,覆盖到所有乡镇并将进一步提升,造就了广阔的数字经济市场空间。不仅如此,网速也大幅提升,固网宽带的平均下载速率和移动网络平均下载速率都居世界前列。依托先进的公共网络基础设施,无需自建内网,中国企业就可以实现数字化转型。这些优势助力中国数字经济的发展能够以全世界最低的成本获得最大的回报。
动能澎湃,全球共迎数字经济新时代
在5G全连接工厂,从一张铁皮变成一台洗衣机只需要38分钟;
在偏远牧区,牛羊拥有电子档案,牧民们在家用手机检查牧场、给牛羊饮水;
在河北省怀来县,大数据为北京冬奥会、冬残奥会张家口赛区提供信息共享、高清视频、智能天气等一系列技术服务……
数字基础设施实现跨越式发展、数字产业创新能力加快提升、公共服务数字化深入推进、网络安全保障和数字经济治理水平持续提升……十年来,我国数字经济取得了举世瞩目的发展成就,在抢抓数字经济先机、抢占未来发展制高点上迈出了坚实的步伐。
2012年到2021年,我国数字经济规模从11万亿元增长到超45万亿元,数字经济占国内生产总值比重从21.6%提升至39.8%,成为推动经济增长的主引擎之一。
数字经济蓬勃发展是中国机遇,也是世界机遇。
放眼全球,新一轮科技革命和产业变革深入发展,互联网、大数据、云计算、人工智能、区块链等数字技术创新活跃,数字经济在全球经济中的作用日渐凸显。
数字经济是中国与“一带一路”沿线国家和地区合作的重要内容。近年来,中国积极搭建世界互联网大会等开放平台,与各国加强数字领域合作,积极开展双边、多边数字治理合作,参与数字领域国际规则和标准制定。
中国积极参与数字经济国际合作,大力推进信息基础设施建设,促进了全球数字经济与实体经济融合发展,携手推进全球数字治理合作,为全球数字经济发展贡献中国方案和中国智慧,有助于各国共享数字经济红利。
携手同行,构建网络空间命运共同体
2022年7月12日,世界互联网大会国际组织成立,这标志着世界互联网大会转型为国际组织年会。作为国际组织成立后的首届年会,本届峰会将与国际各方积极搭建全球互联网高端对话平台。
开放、合作,是构建网络空间命运共同体的重要条件。电子科技大学网络空间安全研究院副院长李洪伟表示,近年来,数据安全形势日益严峻,各种安全事件影响力升级,急需安全的数据采集、传输、存储和使用机制,克服传统方案的局限和缺陷,保障全球各国重要基础设施和人民生命财产安全。“全球各国应当携起手来,保障全球数据安全,共创数字未来,构建全球网络空间命运共同体。”
“信息时代没有哪一个国家或哪一方力量能够独善其身,必然是利益共享、责任共担的命运共同体。”中国现代国际关系研究院科技与网络安全研究所执行所长李艳表示,新形势下,确保网络空间的稳定与发展成为国际社会休戚相关的重大时代命题,各方都在为之努力。
以“构建网络空间命运共同体”为主旨,中国积极搭建国际平台“世界互联网大会”,致力于凝聚共识,促进交流,推进合作,既是对国际社会普遍关切的回应,更是对未来网络空间发展的中国贡献。
“国际社会越来越成为你中有我、我中有你的命运共同体。发展好、运用好、治理好互联网,让互联网更好造福人类,是国际社会的共同责任。”在世界互联网大会乌镇峰会召开前夕,国务院新闻办发布《携手构建网络空间命运共同体》白皮书,围绕网络空间发展、治理、安全、合作等方面,阐释了构建更加紧密的网络空间命运共同体的中国主张。
国家互联网信息办公室副主任曹淑敏表示,中国将坚持以构建网络空间命运共同体理念为指引,同国际社会一道,加强团结协作,推动构建更加公平合理、开放包容、安全稳定、富有生机活力的网络空间,让互联网更好造福世界各国人民。
夜晚的乌镇,遍布河网的灯光闪烁,犹如一张“互联互通”的信息网络。应一年一度之约,这座“互联网小镇”再次变得热闹非凡。共建网络世界,共创数字未来。未来几天,世界互联网大会汇集、迸发的数字之力将从乌镇快速辐射全球。(赵竹青 杨曦 罗知之)
(文图:赵筱尘 巫邓炎)