技术专家表示,用户每天使用人工智能绘画软件(Midjourney和DALL-E 2等)生成超过3,400万张图像。生成的画像往往富有创造性,令人震惊。
虽然人们可能会发现人工智能生成的艺术是一种放松、富有创造性的方式,但这些图像是有代价的。服务器“农场”,是一个装满计算机的巨大数据中心,每年处理人工智能艺术产生的能耗比阿根廷整个国家的能耗都要多。2023年,谷歌仅为冷却服务器就消耗了56亿加仑的水。
如何让那些想使用这些艺术工具的人在使用的同时,也能关注环境可持续性,这是计算机科学博士生弥勒·帕特勒热衷解决的问题。
帕特勒一直在ASU富尔顿工程学院计算与增强智能学院、计算机科学与工程副教授杨叶舟的指导下工作。杨叶舟是主动感知小组的负责人,该小组是一个研究计算机视觉和图像生成人工智能的实验室。
杨叶舟负责多项由国家科学基金资助的专门研究计算机视觉识别工具的项目。那里正在进行的一些新颖工作试图建立一个可以创建图像的系统,检查它是什么、再从比较中学习。计算机可能会画一只狗,接着会扫描图像,问自己画的像不像,然后根据结果更新其程序。
作为博士研究的一部分,帕特勒创建了一种资源高效的工具:Eclipse。它可以接收文本提示,然后生成图像。他制作了一个演示网站,用户可以在其中将想看到的内容进行简短描述,随后人工智能工具将根据描述生成图片。
更可持续的人工智能模型
这项工作涉及训练模型的核心问题。
如今,大多数人工智能解决方案都是通过将大量数据输入计算机网络和“训练”模型来创建的,即调整计算机用于完成工作的算法或指令集。软件工程师为计算机提供数千张狗的照片,然后让计算机生成自己的狗图像。
但帕特勒和杨叶舟认为,有更好的方法来利用人工智能的力量,而不是简单地使用越来越多的计算机来处理越来越多的数据。
帕特勒说:“我们已经创建了一个新的管道模型。这个模型将使用少量的处理单元,可以在一到两天内进行训练。”
该团队的工作涉及三个基本问题:创建一个需要较少时间和计算资源进行训练的图像生成模型;产生良好的可重复使用的开源系统;最后,制作用户可以专门使用自己的图像进行训练的软件。
在ASU研究计算提供的工具和技术专业知识的帮助下,该团队着手制作更高效的图像生成模型。
他们有了一些新想法。一种是使用对比学习的训练策略,另一种是教计算机指认不相关信息,以获得正确的结果。
帕特勒和杨叶舟还使用对抗性训练,这是一种故意攻击图像模型并试图使其失败的编程技术。
杨叶舟说:“这种训练的优点是,我们可以发现当前模式的缺点且及时处理,并在攻击结果的基础上改进系统。”
ASU工程博士生弥勒·帕特勒和杨叶舟副教授将Eclipse视为企业培训高资源利用率的人工智能艺术模型的潜在解决方案。
用户可以使用自己的图像
帕特尔和杨叶舟关心隐私问题和道德问题。许多人工智能图像工具对用于训练其模型的艺术来源充满了争议。
Eclipse团队还包括计算机科学博士生程胜(音译 Sheng Cheng)和郑尚民(Sangmin Jung),计算机工程博士生金昌勋(Changhoon Kim)和担任顾问的计算机科学与工程教授奇塔-巴拉尔(Chitta Baral)。
该团队制定了一项可以帮助企业实现的计划,让企业能够部署自己版本的Eclipse模型,并仅使用该企业拥有的图像进行训练。这样将会消除那些对诉讼或图片来源的担忧。
这些想法对在人工智能领域工作的艺术家来说很有趣。富尔顿工程学院的摄影师艾丽卡-格罗内克(Erika Gronek)使用了人工智能艺术工具,甚至写了一本关于人工智能艺术的书:《不可思议的事:人工智能为自己说话》。
艺术家可以用人工智能艺术工具来激发自己的创造力,用幽默或异想天开的提产生独特的结果。
格罗内克说:“人工智能不会消失。有人批判它,这很正常,但它也可以被视为艺术家工具箱中的另一个工具。至少,应该通过使用适当的数据集以合乎道德的方式并可持续地使用它,因为它可能需要非常巨大的计算能力。”
6月,杨叶舟和研究团队将在西雅图举行的著名的IEEE/CFF计算机视觉和模式识别会议上展示他们的工作。他们也在寻找可能希望支持这门技术进一步发展的企业合作伙伴。
杨叶舟说:“我们正试图找出视觉和语言的最佳结合点,从而能够关键性地提升这些模型的效率。”
他还希望这个项目能激励更多像帕特尔这样的博士和硕士论文学生。
杨叶舟说:“计算与增强智能学院正在进行令人兴奋的人工智能研究。我们希望吸引和激励新的博士和硕士论文生,帮助他们专业性发展,展现他们所作出的努力。”
- END -
编辑 | Catherine Ge
来源 | ASU 在线
关注我们,了解更多资讯
点击阅读原文 了解ASU在线中文项目↓↓↓