“设计人工智能+X"｜范凌&李晓梅&夏磊&童慧明&郭丽丽直播回顾

文摘科技 2024-09-02 20:01 广东

BDDLive NO.46

在当今数字化时代，人工智能（AI）已经成为一个无处不在的术语，它不仅频繁出现在科技新闻的头条，也慢慢渗透进我们的日常生活。从智能家居设备到AIGC，AI的应用案例比比皆是，其普及程度和影响力不断增长。然而，尽管AI技术的潜力巨大，它在设计领域的普及和应用仍然面临着一系列挑战和问题。

8月23日晚19:30，我们邀请了特赞创始人、同济大学设计人工智能实验室主任范凌教授及实验室的小伙伴李晓梅和夏磊，一起与BDDWATCH发起人童慧明教授共同探讨Design AI 的应用场景及未来趋势。

完整直播已剪辑为播客上传至小宇宙，欢迎大家收听

以下内容为BDDLive

💬嘉宾观点的文字精简版

全文约10000字

设计人工智能实验室：创新与融合之路

范凌：在2017年，我们有幸在同济大学成立了设计人工智能实验室。那时候，人工智能和设计还没被广泛认为是可以结合的领域。我们寻找的是一个能够融合工程和设计的环境，同济大学正好提供了这样一个理想的背景。当时，我花了不少时间思考实验室的命名，是叫“设计人工智能”还是“人工智能设计”。虽然只是字序的差别，但意义却大有不同。

我最终选择了“设计人工智能”，因为我认为人工智能应该是帮助人们拓展想象力的工具，而不是取代人类的创造力。设计人工智能的主角应该是设计师，是人，而不是机器。这个理念一直影响着我们，让我们思考如何设计出能够激发人们创造力的工具和技术。

随着时间的推移，我们不断在设计领域探索新的学科方向，不断发明新的垂直学科，比如创新创业、服务设计、视觉传达、环境设计等。设计人工智能被视为一个新的设计学科，我们甚至设立了“人工智能与数据设计”专业。我们的目标是培养下一代设计人工智能的人才，建立自己的学科边界，发展理论、实践和应用。

我们当时在想，什么样的形象能代表我们的实验室。于是我们设计了一个特别的logo，初看像两辆奥迪车，但实际上，它后面有七个圆圈。

有人问我，这个logo是什么意思。其实很简单，设计在数字化技术之前，有点像是奢侈的东西，只有有钱人或有资源的人才会去做设计。从包豪斯开始，设计变得更平民化、数字化，我看到最多人同时使用的设计是苹果的开机画面。第一代苹果手机的开机动作，有大约1000万人同时在使用。这让我想到，设计从只为少数人服务，经过100年，到现在可以同时服务于1000万人。人工智能可以让每个设计更个性化，让设计更平民化。所以我们的logo选择了七个零，也可以说是1000万实验室，不是1000万块钱，而是1000万个用户同时在使用的状态。我们的设计不是为个体，而是为大众设计。

从2017年到现在，我们研究了很多。大家可以查看我最近写的《教“设计”学“人工智能”的这几年｜范凌长文》。这篇文章是我几个月前在阿里设计周上的一个主题分享，讲述了我们设计人工智能实验室从2017年到2023年的研究和反思。

设计人工智能实验室的1.0阶段就是这些内容：设计作为一种垂直学科，人工智能作为一种垂直学科，设计人工智能作为以设计师为主体的研究。我们的目标不是让每个设计师都成为工程师，而是希望用人工智能来赋能设计，拓展设计的想象力边界。

大家都知道，从2022年底Chat GPT 3.5发布以来，人工智能确实给了我们丰富的想象力，我们每个人都或多或少在使用或感知生成式人工智能带来的变化。我们也在讨论，AIGC出现后，设计师的角色会如何变化。这正好为我们的1.0阶段画上了一个圆满的句号，也让我们开始思考下一个阶段。

今天我给大家带来的是我们设计人工智能的2.0版本，2.0版带来了一些重要的改变。我们过去6年都在进行设计学科与人工智能学科的垂直交叉，专注于培养这个方向的人才，进行相关研究和学科建设。但随着生成式人工智能的发展，技术门槛降低了，让每个人都有机会使用AI来改变自己的生活。

我们的设想是，设计人工智能不再只是一个垂直学科，而是成为一个水平学科，一个可以为各种学科添上翅膀的设计人工智能。它不是要取代任何学科，而是要与它们结合，共同发展。

从2023年年底开始，我们实验室就着手推动这一理念，希望设计人工智能能够成为一种水平能力，帮助我们更好地思考社会创新、设计方法、创新教育、文化研究和空间智能等领域。

我们还特别强调设计人工智能的普及化，希望它能像设计思维一样，成为解决各种问题的方法。为了实现这一点，我们创造了一种新的活动形式——创客松。这是一种实验性和挑战性的活动，让每个人都能通过设计人工智能来学习、解决问题。

我们希望设计人工智能能够更平民化，帮助更多人。虽然我们才刚刚开始，但我们已经用设计人工智能的方法和工具帮助了许多人，让他们的工作和生活变得更美好。

此外，我们也在扩大我们的影响力。虽然我们实验室的基地仍在同济大学，但我们正逐渐走出固有的物理空间，与华东理工大学、鲁迅美术学院以及其他企业和设计组织合作，希望设计人工智能实验室能成为一个开放的平台，帮助任何有意愿的机构提高他们的教学、科研和实践能力。

创新工坊：创客松与设计人工智能的实践探索

李晓梅：今天我想重点谈谈创客松，这个概念始于2023年5月，我们希望将创作马拉松的精神融入其中。我们的目标是在有限的时间内，实现观念、工具、技艺和趋势的快速结合和实践。在创客松的过程中，我们发现了许多问题，比如新工具的出现如何改变我们，以及我们如何通过逻辑来推动工具的变革。工具、创作者、观念和技艺之间的相互影响关系，以及设计中的变与不变，都是我们深入探讨的问题。

我们曾在国美的当代手工艺实验展和世界设计之都大会上展示了工具的发展史。我们发现，每次新工具或技术的出现，往往伴随着重大的社会变迁。我们想要研究这些变化之间的关系，以及新工具如何影响人们的创作方式、艺术形式和内容的呈现。这些变化又如何影响人们的思考和交流方式，推动我们去研究工具如何为创意工作者服务。

当讨论到人工智能时，许多人感到兴奋，认为这是一个弯道超车的机会。但经过一两年的观察，我们发现起跑快的人未必能坚持到最后，而起跑慢的人可能具有更好的持续爆发力。这让我们思考，如果创作的边际成本越来越低，门槛越来越低，创作是否真的变得更简单。我们发现，尽管工具降低了门槛，但创造力和想象力变得尤为重要，成为拉开创作差距的关键。

带着这些问题，我们进入了第二个层次的探讨：创意的重要性以及如何寻找或培养创意。过去，我们在创意过程中往往受限于工具的使用难度，预留了很长的时间去创作，而给创意和想象的时间却非常短。因此，创作过程往往是用很短的时间去思考，然后用很长的时间去实现。

工具在发展，我们的创意过程也在随之变化。我们可能被工具的发展或能力所牵引，有时我们更像是技工，而非创作者。但我们不应该仅仅是操作者，而应该用工具来实现我们的创意。

在这样的思考下，我们认为，当AI工具降低了创作的成本，节省出来的时间可以用来进行更多的迭代、验证和反馈，使我们的创造成果越来越好。

在明确了前两个问题后，我们就进入到第三个话题。我们知道工具深刻影响了我们，我们也了解了如何有意识地培养创造力。那在高校或科研环境中，我们需要做出改变和尝试，比如如何回归想象，获取更多知识，改变学习和创作的方式，真正让工具为创作者所用，让设计回归想象。

这三个问题梳理清楚后，我们面临了一个现实问题：工具的门槛有时会很高。我们之前做过一个统计，发现即使在AI爆发两年后，仍有很多人只是听说过AI工具，但在实际操作中遇到了困难，如注册、安装、硬件操作等，这些都阻碍了他们的学习信心。我们通过调研摸清了大家在哪个环节遇到了问题，于是我们研发了一个名为Muse AI的工具，逐步解决这些问题，让大家迈出第一步，真正尝试AI创作。

解决了工具问题后，我们开始思考创客松到底要做什么。我们将其定义为一个学术组织，因为我们想保持深度研究的初心。我们区分了不同的人群，比如在高校中，除了外部条件的限制，还有内部的独特需求。比如说很多老师的困扰，就是学生在技术使用方面会远超自己的能力和效率。但我们知道在人工智能使用过程中，技术并非最大优势，而是领域内的专家知识变得更重要。

那还有一些问题就是，既然跨学科变得很重要，我怎么样去做结合？我的理论和实践怎么样做平衡？这就是我们前文讨论到的那个问题，新的工具出现，它影响了创作的逻辑。

我们将开始做的一些教育实践定义为101工作坊，旨在从基础学科、概念、界面、工具的综合使用等方面进行教育。

我们的第一场工作坊在同济大学的设计创意学院举行，主要解决工具使用问题。到了第二阶段，我们意识到仅仅普及工具可能还不够，如何将工具真正回归到设计学科或创作应用中变得非常重要。于是我们开始有新的主题工作坊，围绕主题问题的调研、创作、呈现、突破和创新，用AI赋能学生，让他们在综合学习中顺便学习AI。

在教育的第三阶段，我们希望将综合能力的运用在主题工作坊中得到更有深度和宽度的呈现。从教育的角度来看，新工具的出现并不是颠覆性的，我们没有用新工具完全替代旧的，而是激发工具的协作或开发者模式，这是我们在教育中所做的第三个层次的升级。

在高校里，我们通过这样的形式探讨设计学科、教育方式、学生学习方式以及学习渠道的变化。我们希望通过主题式学习过程进行总结，不是先提出再执行，而是先做，在做的过程当中逐步反馈和提炼经验。

对于企业群体，他们的需求更加直接，面临同行竞争压力、商业提效压力，办公流程中的全员协作能力以及AIGC转型的变化。所以我们针对企业部分又进行了讨论，整合了不同部门和工作类别的具体需求。例如，设计师需要效果图生成和灵感呈现，HR或运营部门有他们的内在需求。我们获取了这些真实需求后，开始举办与商业创新相关的主题工作坊。

企业希望AI的能力能够落地，赋能真正的企业运营。我们在实验室的当前研究中，也在将部门的真实工作场景作为方案的整体解决与呈现的目标，去真正解决哪怕很小的一件事，提高其质量和效率。

目前，我们已经与一些企业进行了深度合作，虽然合作的领域并不是特别广泛，但我们自豪的是能够与企业进行深入的链接。我们深入企业内部，即使是对我们来说相对陌生的部门，也会亲自走访、尝试，并通过这个过程提炼出总结和经验。

此外，我们还与多个高校合作共建实验室。今年10月，我们将在鲁迅美术学院建立第三个设计人工智能实验室。在这里，大家不仅可以探讨新的变化，还可以共同进行课题研究、问题解决和协同创新等。

交互革新：空间计算在设计人工智能中的角色

夏磊：关于设计人工智能和空间计算的最初想法，我们希望探索空间计算如何改变人与计算机的交流方式，将“深度”作为一个新维度，让人在计算设备中感受到空间和深度，创造新的交互模式和可能性。

我们曾经所有的用户体验(UI)和图形用户界面(UX)都是基于X轴和Y轴的。然而，随着技术的发展，新的空间计算设备提供了Z轴，即深度空间计算的可能性，这将使我们与计算机的交互方式发生质的变化。从2016年到2018年，我们使用的是HTC VIVE，到了2020年，我们开始使用更先进的设备Meta Quest2。现在，我们正在考虑如何将最新的、具有强大计算能力的空间计算设备，如Vision Pro，融入到空间计算、设计和任何交叉学科的研究中，实现真正的交叉学科研究。

空间计算带来的深度交互，已经成为我们设计人工智能实验室在空间计算方向上的一个核心研究课题。关键在于如何将虚拟与现实世界连接起来，让用户能以全新的方式与三维空间互动。这种深度交互彻底改变了我们传统的图形界面交互模式。

现在，人们不仅能在屏幕上观察数字内容，还能在内容中自由移动和交互，甚至改变内容的结构和元素。无论是虚拟现实、增强现实还是苹果提出的空间计算，数字信息不再局限于屏幕，而是可以在现实空间中展开，为我们创造出全新的临场感和存在感。这样的技术进步，为我们探索人类与数字世界的互动提供了无限可能。

今天我将讨论我们实验室在硬件研究方面的进展，特别是我们如何从早期的虚拟现实技术发展到现代的VR。我们将回顾VR设备的历史，探讨我们是如何一步步走到今天，以及为何我们能够拥有目前这些设备。

VR设备发展有三个主要阶段：从最初的概念验证到消费者市场的兴起，再到现在的现代化设备。这个过程可以被看作是一系列关键的技术“战役”，它们决定了VR硬件的发展方向。

我们的研究揭示了三个主要的技术路线选择，它们可以被视为设备战争的关键战役。首先是独立设备（Standalone）与带线设备（Tethered）之间的竞争，其次是内部定位（inside-out）与外部定位（outside-in）的较量，最后是视频透视（VST）与光学透视（OST）之间的选择。

从早期的原型到现在被Meta收购的Oculus、HTC以及北欧公司Varjo的产品，我们见证了VR技术从单一的感官体验向沉浸式体验的转变。

2012年，Palmer Luckey在Kickstarter上为Oculus Rift发起了众筹活动，他明确了其目标是创造一款轻便的有线头显。尽管这款设备最终在市场上引起了巨大反响，并在某种程度上推动了现代VR的发展，但它仍然采用了有线连接，并且仅提供了三自由度（3DOF）的运动追踪。

这里需要简要解释一下自由度（DOF）的概念。自由度指的是用户在佩戴头显后能够进行的活动范围，以及头显能够捕捉到的运动。三自由度意味着头显只能捕捉到头部的旋转运动，包括前后、左右和上下的转动。而六自由度（6DOF）则不仅能捕捉头部的旋转，还能追踪用户身体在三维空间中的移动，包括前后、左右和上下的位置变化。目前，许多设备已经实现了六自由度的追踪，这极大地提升了用户体验，尤其是在防止眩晕方面。

HTC Vive是当时有线设备的代表之一，其复杂的设置和对空间的高要求使得在实验室环境中进行演示变得颇具挑战。用户需要在一个对角线长度约为三米的空间内使用设备，以获得最佳的追踪效果。这种设置不仅线缆繁多，而且对空间的要求限制了其在更广泛环境中的应用。

有线VR设备的局限性在于，对于许多设备而言，尤其是消费电子产品，有线连接是非常不便的。这就是为什么独立式设备，即无需连接线的解决方案，如今已成为市场主流。从谷歌的Cardboard开始，我们逐渐看到所有设备都趋向于这种独立存在的形式。独立式设备的便携性和无线特性使其用户体验大大超越了有线设备，尽管这可能意味着在图像质量上做出一定的妥协。

2022年的VR商业版图显示，市场上出现了大量独立式设备，它们与有线设备形成了竞争态势。而在追踪技术方面，我们可以看到Inside-out与Outside-in两种解决方案的并存，这将是我们的下一个讨论重点。

Inside-out与Outside-in追踪系统分别代表了VR头显追踪用户形态和空间位置的不同处理方案。Outside-in系统依赖于外部传感器来追踪头显的位置，并据此重建VR环境中的视角，为用户提供准确的视觉体验。

相比之下，Inside-out追踪方案将摄像头和传感器集成在头显内部，包括有时使用的红外追踪设备。这些设备能够映射出用户周围的环境，并在VR体验中精确重现，帮助用户在虚拟世界中获得更好的视觉体验。

传统的PSVR和早期的HTC设备都采用了Outside-in追踪方式。这种方式虽然精确，但设置过程繁琐，需要大量的准备工作和校准。

从消费者或用户的视角来看，Outside-in追踪系统的主要问题是其操作的复杂性。用户需要在身上绑定许多设备，并进行环境搭建，这无疑增加了使用难度。因此，Inside-out追踪技术因其简化的设置过程和便携性，正逐渐成为市场的主流。

同时，Inside-out追踪技术还确保了用户在体验过程中的舒适性，减少了眩晕感，并保持了视角的一致性。这种技术的进步不仅提升了用户体验，也为VR设备的便携性和易用性带来了显著的改善。

至于视频透视（Video See-Through, VST）与光学透视（Optical See-Through, OST）之间的竞争，这是VR领域的第三场主要技术战争。目前，这两种技术在市场上各有其优势，尚未有明显的胜者。

VST（视频透视）技术通过摄像头捕捉现实世界的画面，并通过处理器对这些画面进行处理，将虚拟图像与现实世界的视频流融合后呈现给用户。

OST（光学透视）技术则利用光学元件（如波导、半透明镜子等）将虚拟图像直接叠加到用户通过镜片看到的现实世界上，用户看到的是现实世界与虚拟元素结合的景象，这个过程不涉及数字视频流的处理，而是通过光学方式实现的。

这两种技术的选择将取决于它们如何更好地服务于特定的应用场景和用户体验需求。随着技术的不断进步，我们可以期待未来会有更加成熟和完善的解决方案出现，以提供更加沉浸和自然的VR体验。

从硬件迭代的角度来看，我们所讨论的三场技术战争，更像是一种阻尼运动。这种运动在不断震荡中最终趋向于我们期望的理想状态。理想状态下，硬件将在不断的震荡后稳定下来，贴近我们所追求的完美状态。

目前，空间计算硬件仍处于这一震荡过程中。正如Gartner技术采纳曲线所描述的，无论是VR头显、AR头显还是空间计算设备，它们可能还未进入早期市场，但已在创新者中逐渐尝试并得到认可。我们期望，随着市场的发展，当这些技术被推向主流市场时，我们对设计、人工智能与空间计算结合的研究，也能够被广泛接受和理解。

我们实验室在思考空间计算时，也在探讨VR和AR是否一定需要依赖于眼镜这类硬件设备。随着讨论的深入，我们开始反思：空间计算是否真的需要以硬件作为基础？就像设计人工智能成为我们研究的基石一样，我们对于VR硬件是否同样不可或缺持有疑问。

同时我们认识到，苹果等公司在推动空间计算技术时，他们的决策对我们有所启发，但我们也从设计师和研究者的角度去评估，哪些决策我们认同，哪些不认同。这些都是我们实验室在空间计算领域探索的重要内容。

数据驱动创新：AIGC与设计人工智能的融合探索

童慧明：关于AIGC的发展以及它与设计的交集，我特别关注了范老师在阿里的演讲，后来整理成文章，其中提到了AIGC的三个重要支柱：算力、算法和数据。算力方面，英伟达等已经确立了其领先地位。算法上，Open AI等公司和研究团队起步很早。

而第三个支柱——数据，这是我特别感兴趣的点。范老师早先分享时提到，尽管我们生活在全球化的世界，但大量数据实际上是本地产生的，留在了本地。目前，还没有一个明显的领导者出现，来定义和利用这些通用型的大数据。这为垂直领域的设计人工智能和数据研究应用提供了极好的机会，尤其对中国的院校和企业来说。

设计人工智能结合空间计算，未来将由一个庞大的垂直领域大数据模型来支撑硬件产品的扩展。当讨论到X轴、Y轴和Z轴时，我立刻意识到，在Z轴方向上，算力、算法和数据的需求可能会是之前基于屏幕的X和Y轴的数万倍甚至数百万倍。这其中的拓展空间和创造空间是巨大的，难以想象的，为今天的研究者提供了巨大的机会。

范凌：在实验室的工作中，我们确实遇到了一些困惑。作为设计和人文学科的从业者，我们对理工科的东西有时会有一种崇拜感。早年，我们尝试让设计和人文背景的学生学习编写代码，但后来我们意识到，即便是这些学科中最出色的学生，他们的代码质量可能也比不上计算机专业的毕业生。我们不应该用自己的短板去和别人的长板竞争，也不应该认为自己的知识不如别人的有价值。

我们花了很长时间思考，如何让设计创意学科的人能够理解和使用人工智能。这是我们的目标之一。正如童老师提到的，人工智能的三个支柱——算力、算法和数据。我们认为，专注于计算机、硬件和芯片的人应该致力于提升算力和优化算法。

在我们的领域，以及许多享用人工智能的行业，数据可能是一个可以把握的切入点。可以看到，过去一年里，大家都在期待GPT的5.0版本。但大型语言模型至今仍然在量的层面上竞争，让我们感到惊讶的3.5版本出来后，到4.0版本，实际上是量的增加，而非质的飞跃。

在与开发大型模型的创业者交流中，我发现一个可能的原因是，对于大型模型来说，公开领域内可用的数据已经被利用得差不多了，这可能限制了进一步增强模型性能的潜力。

但反过来看，这里其实存在两个巨大的机遇。在我之前的分享中，特别是在阿里的分享里，我提到了目前我们对公开领域数据的标注方式还是比较基础和中性的，例如标注这里有一个人、一张插画是什么风格的。这些标注方式还比较原始，并不是专家级的。因此，这些公开数据完全可以增加一层专业的标注，如果从设计、创意、营销等维度出发，就能产生新的数据。另外，每个行业都有自己的垂直领域数据，这些数据我们甚至不愿意与他人分享。这些垂直领域的数据有可能成为提升AI性能的一个关键输入，它们是目前还未被充分利用的资产。我们之前一直在研究的问题，即设计的可计算性或创意的可计算性，实际上正是在探索这方面的应用。

从这个角度来看，晓梅和夏磊所做的工作非常有价值。如果我们不能对人工智能进行“扫盲”，我们实际上就无法充分利用这些数据。

事实上我们距离真正利用好AI还有很长的路要走。我们现在大多数人还处于对AI的新鲜感阶段，刚开始了解，还没有达到最基本的“扫盲”阶段。

夏磊的视角指出了人工智能发展至今，很多研究都是围绕视觉进行的，甚至是西方视觉。这种视觉是静态的，就像站在某处看一个东西，像Midjourney或Stable Diffusion这样的AI模型中，视觉都扮演了重要角色。但仅仅"看"是不够的。

中国的视觉艺术，比如中国画，强调的是动态的游走，这涉及到行动。因此，我认为人工智能，特别是设计人工智能或生成式人工智能，需要从静态的视觉转变为动态的空间行动。这意味着增加了一个维度，这不仅仅是从二维到三维的转变，而是数据量级的增加，这将带来新的设计机会。

设计学自身的发展也反映了这种转变。现代主义设计学，如包豪斯风格，关注的是产品设计、家具设计、建筑设计等具体物体。而在当代，许多设计已经从具体的物体转向了更抽象的概念，比如社会设计、体验设计，从物体转向了"事"。在这个过程中，我们增加了一个维度，不再只是关注这里是否有棵树，而可能是关于整个生态系统的考量，不再是单一的用户界面，而是整个体验。

这种维度的增加为我们的学科提供了利用数据的新机会。我们不再局限于传统的视觉数据，而是开始探索如何将数据应用于更广阔的空间和行动中，从而创造出全新的设计和体验。这是我们在设计人工智能领域中的一个机遇，也是挑战，需要我们重新思考如何利用数据，以及如何教育和训练下一代设计师来适应这种变化。

能力构筑：以实践迎接AI时代

俪郦：无论是个人、企业还是高校，在AIGC和设计领域的发展中，确实需要培养一些基础能力，以便更好地拥抱AI时代。那我们应该部署哪些能力或资源？

李晓梅：我认为，首先我们要动手实践，要对AI持有一个理性和客观的态度。通过我们的活动，我深切感受到，许多人对AI工具的认识还不够深入，他们需要了解这些工具真正能做什么，哪些是可以做到的，哪些是做不到的。有了这样的认识，人们才能更好地运用这些工具。所以，我认为第一步就是开始行动。

其次，就像我们刚才讨论的，数据真的很重要。很多人在使用平台时会感到困惑，因为他们的想象力还不够丰富，习惯了直接在画板上作画或者操作软件。但现在情况变了，你需要先将想法转化为文字，再将文字转化为图像。在这个转换过程中，很多人担心信息的丢失，这也影响了他们使用AI的信心。因此，语言之间的转换能力，以及对转换内容的预判，变得非常重要。

第三，对于来自不同学科背景的学生，在入门AI时确实会遇到专业术语的障碍。因此，我们需要培养一些跨学科的基础知识，这将有助于我们快速融入新领域。

另外，我们还需要培养的一个能力是自学能力。目前，我们正准备一个科研项目，之前做过一些问卷调查，并进行了数据统计。一些学生在问卷中提到，他们认为自己最需要的能力是自学能力。他们觉得，由于工具更新换代太快，如果不知道学习渠道在哪里，学习知识点在哪里，或者不知道如何推动自己学习，那么仅仅等待学校开设课程来教授，或者仅仅等待身边的人传授知识，可能会远远落后。

夏磊：我非常赞同晓梅姐提到的，动手实践和自学能力至关重要。实际上，我们现在面临的问题之一是，很多人谈论AI，但实际去操作的却很少。特别是在设计领域，我观察到一个现象：许多设计师对新工具的讨论多于实际应用。

随着多模态技术的出现，我们的工具箱里不再只有文本生成工具，还有图像、视频，甚至是结合了图像、声音和视频的复杂工具。面对如此多的选择，我们需要自己去摸索工作流程，而不仅仅是讨论某个知名人士或团队所取得的成果。更重要的是，我们要探索这些工具如何真正融入我们的工作流程，提高我们的产出效率。

以我自己的经验为例，我记得年轻时制作PPT时，并没有意识到它的重要性。但如今，PPT已经成为了一个不可或缺的工具。我相信，AIGC工具最终也会成为我们工作和生活中的一部分。如果你没有掌握这些基础能力，没有动手实践的能力，那么无论讨论多少理论都是徒劳的。

想象力的画布：AI工具与用户互动的艺术

俪郦：在AI工具层出不穷、更新迅速的今天，我们需要找到一种方法来整合这些工具，并创造出有趣的创意。我想请问范老师，您在创客松和特赞的实践中，是否已经发现了一些优秀的工具？

范凌：我们之所以要自己来做创客松，原因是我们注意到像夏磊和小梅所指出的，大家更愿意转发关于新工具的消息，而不是去实际使用它们。举个例子，有段时间大家都在谈论OpenAI的sora视频工具，但真正用过它的人并不多，这有点像是AI领域的八卦。

但实际上，动手尝试是有障碍的。首先，很多工具需要特定的网络条件才能使用。其次，虽然这些工具看起来简单，但要生成一段满意的视频，可能需要生成数百段视频才能挑出一段可用的。这在一开始是非常令人沮丧的，因为你尝试了很多次，效果都不理想，可能到最后你自己都能做出视频了。

所以我们自己做的工具，主要是为了解决这两个问题。一是让每个人都能轻松使用，二是提供一些降低门槛的方法。比如我们在创客松中使用的一个工具叫Muse AI，它有一个功能我特别喜欢，叫做灵感画廊。在灵感画廊里，你可以搜索各种内容，搜索结果都是AI生成的图像，你可以直接使用这些搜索结果中的提示词和模型来进行生成，这是一种非常不同的用户体验，让使用变得更加简单。

我自己也购买了不少AI工具，最近购买的一个AI搜索引擎叫做Perplexity。Perplexity的创始人最近有一个三小时的访谈，里面提到了两个非常吸引人的观点。

第一个观点是，Perplexity不仅仅是搜索引擎，它不像谷歌这样的上一代搜索引擎是信息的索引，Perplexity是知识的组织者。我们搜索信息的目的是什么？是为了做下一件事，比如学者搜索完知识后，目的是为了写论文。论文是知识的载体。原来我们只能用搜索引擎搜索信息，然后用人的大脑来组织知识，现在Perplexity可以帮助你组织知识。

其次，他谈到了Perplexity的最大竞争对手不是谷歌，而是人们提问的能力。这是一个引人深思的观点。我们经常讨论AI的强大，但无论工具多么先进，它们都是为了让人类的想象力得到更好的发挥。我们面临的真正挑战不是AI工具的技术限制，而是我们能否想象并创造出这些工具的新用途。

对创客松感兴趣的朋友，欢迎大家扫码找到他们⬇️

文字整理 / 编辑：杨炫

审稿策划：郭丽丽

如果您对设计领导力话题感兴趣，也可以阅读或订阅以下回顾：