生成式AI的技术与人文:硅谷101科技大会活动手记与花絮

文摘   2024-11-01 11:44   北京  

过去两年,文字生成图片的扩散模型首先点燃了生成式AI的热度,而ChatGPT的出现成为了科技圈的iPhone moment。每一次OpenAI升级新模型,一边摧毁着一大批刚刚从Y Combinator毕业的创业公司们,另一边却引发科技圈的技术狂欢。

与此同时,OpenAI内乱引发的对人工智能的安全担忧,生成式AI冲击下的失业问题,甚至带来对教育、艺术行业的挑战,都掀起了广泛地讨论。整个科技行业正在发生一场范式转移的技术升级,《硅谷101》在这次技术创新的源头——硅谷,举办了一场线下AI科技大会,一起去讨论技术的积极面、消极面与丑陋面。

座无虚席的首届硅谷101 GenAI 科技大会现场


以下是本次活动的精彩内容总结:

01
 不是每年都有iPhone时刻
大模型距离真正改变世界还需时日

论坛的首场主持人,财富500的Gen首席人工智能及创新官、斯坦福大学客座讲师硅谷徐老师分享了他对大型语言模型的早期见解:“早在四年半前,我和泓君在播客里讨论了GPT-3模型,预言大模型将深远影响人类的未来。 这个预言比ChatGPT爆火要早两年半。”他表示:“今天我们将讨论几个重要的话题,每个问题是个“万亿美元的问题。”


大模型主题论坛:硅谷徐老师,吴佳俊,贾扬清,Jenny Xiao

斯坦福大学助理教授吴佳俊认为,相较于2020年GPT-3的推出带来的颠覆式突破,过去三年文本领域的AI技术的改进更多是渐进式的。而图像方面,Sora的进展比他预想中更快。吴佳俊强调,大模型的输出是毕竟基于概率生成的,因此在执行关键任务时,可能会出现错误,而且没办法提供证明。

Lepton.ai创始人贾扬清认为,过去两年行业难免会有一些泡沫,正如让一个聊天机器人立刻去解决建筑公司面临的问题非常困难——他们希望知道下一批沙子和石料什么时候会运到工地,但是这些信息并没有现成数字化的接口。但是,“LLM的好处在于,它让我们无需花费五年时间念个博士学习理解NLP,就可以用提示词工程开始建设垂直的AI算法。”同时,他也提出,GPU价格高昂以及资源集中在少数大型公司手中,限制了AI生态系统的多样性和活力,但是这是一个短期现象;他预期未来中小企业也能低成本地获取资源,从而开发和部署AI应用。

Leonis Capital合伙人肖文泉(Jenny Xiao)对OpenAI安全团队的离职表达了担忧,认为这可能对AI的负责任发展产生难以预见的后果。对行业乐观的一面是,多模态的出现是近年来最大的突破,因为它能让AI处理多种数据类型,大大拓展了AI的能力。对于未来应用的机会,她看好医疗、金融等专业领域的应用前景:“应用越垂直化,越不容易受到OpenAI或Anthropic的冲击。”

AI基建主题论坛:Simon Suo,李志远,Charles Xie,Lynn Duan

关于大模型和AI基建的第二场讨论由AI+创始人Lynn Duan主持。Lynn非常关注开源社区在AI基础设施发展中的作用,她通过两个维度展开讨论:一是探讨各公司选择开源的原因及影响,二是从更宏观的角度探讨开源与生态系统的关系。通过与三位嘉宾的对话,她帮助听众理解了开源社区如何帮助企业快速获取市场反馈、验证技术方向,以及如何通过开源吸引开发者形成更广泛的产业合作。

LlamaIndex联合创始人兼CTO Simon Suo在谈到模型的发展时指出,大模型的未来在于“推理层和知识层的解耦”,这种结构的调整将提升模型在企业场景中的应用能力,不再仅仅作为“知识库”,而是能够在复杂任务中扮演多样角色,以更合理的逻辑进行决策和规划。此外,Simon提出多智能体系统(multi-agent systems)将会是AI实现更高效自动化的关键,“让多个智能体协作完成更高层次的任务是未来的一个趋势”,并且这种趋势需要更强的推理和规划能力。


Zilliz创始人兼CEO Charles Xie从数据增长的角度出发,他指出,随着多模态(multi-modal)数据的快速增长,向量数据库需要更高的精确度来应对越来越多的非结构化数据,如图像、视频和用户行为数据。“过去用户运行的数据规模可能在百万级别,但现在一些大型企业已达到千亿级别,数据处理能力的提升成为关键。”Charles还提到,随着多模态模型的兴起,未来将可能出现更多基础模型用于如推荐系统和虚拟药物研发等应用领域。

NexaAI的联合创始人兼CTO李志远重点谈到了小模型的趋势,他观察到,“小模型的生态系统变得越来越完善”,这尤其适用于边缘设备(edge devices)上的AI应用场景。他介绍了Nexa AI在推动多模态小模型(例如视频、音频和文本输入)和端侧推理加速框架的研发工作,Nexa AI的下一代模型会具备更强的多模态能力,而且在处理长上下文时的能力更强,更适合在边缘设备上高效运行。同时,团队正在针对不同设备厂商的GPU和NPU推理加速需求提供技术解决方案,并推出适用不同场景的端侧多模态模型,以更好地支持企业用户的复杂需求。

02
 年营收6000亿才能覆盖成本
AI创业者的生死局
红杉资本合伙人戴维·卡恩(David Cahn)在一篇公开发表的报告中称,生成式人工智能的公司一年至少要赚6000亿美元才能够覆盖基础设施比如数据中心的成本。对于绝大多数基于大模型的应用类公司而言,大多数依然处于烧钱阶段。如何找到合适的商业化场景,甚至赚钱,是每一家生成式AI公司的核心痛点。

AI商业化主题论坛:泓君,Queena Qiu,张霄,Keith Zhai


硅谷101创始人兼CEO泓君与三位细分赛道风格迥异的创始人详细讨论了他们的商业化挑战。Queena Qiu是Polyverse的联合创始人兼CGO,它旗下的AI Mirror目前在全球生成式AI移动应用领域中排名第 16 位,是典型的to C类应用的代表。他们的商业模式是用户订阅付费与应用内广告相结合,也是首批采用混合式商业模式的生成式AI的开发者之一,比如美国和日本的用户更倾向订阅或应用内购买付费,而东南亚的用户则更喜欢通过观看广告来使用APP。尽管Queena所在的赛道——照片与图片类应用是Google Play和App Store上收入最高的类别之一,但正如红杉的报告中所写到的那样,他们最大的挑战也依然是生成式AI基础设施成本高企,比如计算成本、大模型成本等。

与Ployverse不同,Collov服务于B端客户,他们为家具与电商提供视觉驱动的解决方案,结合GPT-4与扩散模型,将家具或者产品图片融入到合适的场景中。Collov联合创始人兼CEO张霄博士提到,目前大模型最大的挑战是为客户提供定制化的解决方案时,需要顶尖研发团队参与,但订单价值往往不足以覆盖研发成本,这也是所有垂直AI应用公司的挑战。他的解决办法是将训练过程分为预训练与后训练,预训练团队着重提升模型的空间理解能力与可控生成能力,而后训练阶段主要用于模型的定制化。通过内部开发的系统,后训练部分由不需要任何编程支持的客服团队就可以完成。


Tiny Fish联合创始人翟琦(Keith Zhai)则带来了另一个角度的观察:现在真正用AI赚大钱的公司是咨询公司。“比如埃森哲(Accenture)在第一季度就通过AI赚了6亿美元,而到了第二季度,这个数字达到了9亿美元。埃森哲这个成绩充分反映了当前的市场状况——一切还太早了。”翟琦说道。他们的产品AgentQL可以为企业提供实时结构化的数据抓取方案,而他认为现在最大的挑战依然是,很多大公司还在摸索如何使用AI。


03
当AI遇上艺术:
不是替代,而是表达的新可能

大会还特别安排了两场艺术与科技交融的创新展示。AI艺术家宋婷在主题演讲中分享了她如何将AI技术融入高级珠宝设计。她展示的"Computing Power"珠宝系列探索了AI辅助设计的新可能:从数据集训练到3D建模,再到实体制作,AI参与了整个创作过程。她特别强调,AI时尚的未来不仅在于降低成本,且在于在强烈的个性化指导下创造消费者独特的体验,"如果品牌失去文化独特性和标志性特征,即便应用了AI也会消失"。


AI艺术家宋婷在主题演讲

Meta Music Tech Lead Roger Chen与斯坦福音乐技术专家Kitty Shi带来了一场人机协作的现场演出。Roger介绍了AI音乐生成的技术原理,将其比作音乐领域的ChatGPT,能够理解体裁、乐器和情绪等提示。虽然AI生成的音乐质量已达到"可以媲美人类演奏"的水平,但他也坦承当前AI在精确控制和精细作曲方面仍有局限。对于AI音乐的行业发展,他指出版权问题是最大障碍,大公司只能使用免版税音乐进行训练,这限制了AI创作的范围。两场展示不仅展现了AI在艺术领域的创新应用,也深入探讨了AI艺术创作中人的角色和艺术本质的思考。


Roger和Kitty展示与AI人机合作演出


04

不必在乎激光雷达成本,
运营才是无人驾驶的真正难题
在自动驾驶专场“未来之路:自动驾驶及其未来”的对话中,Bot.auto创始人侯晓迪与Kargo软件负责人刘冰雁展开了观点的交锋。

侯晓迪认为,自动驾驶已经跨越了技术探索的突破期,现在的核心问题是如何让这些技术成果落地,成为可行的产品。他直言:“我们不需要再等待另一个突破或奇迹来实现自动驾驶。”在侯晓迪看来,自动驾驶的未来发展路径不再依赖于某种单一的技术突破,而是要通过各类技术手段的系统性融合来提升工程效率。


自动驾驶主题对话:刘冰雁,侯晓迪

他也指出,整个行业目前享受到“新的技术范式”带来的加速优势,虽然没有出现根本性的科学突破,但多种技术的融合极大地提升了效率。这其中,端到端模型的应用成为一个显著案例。然而侯晓迪提醒道:“很多人在提倡端到端的时候,其实并不真正理解端到端到底是什么。”他认为盲目推崇单一工具可能带来“技术意识形态化”问题,行业发展更需要多元的方法。


在谈到商业化推进,侯晓迪特别强调了每英里运营成本(CPM)的概念,指出它将成为未来衡量自动驾驶商业化可行性的关键标准。过去几年,自动驾驶企业一直专注于技术迭代,关注产品的可用性,但随着技术渐趋成熟,成本控制变得更为紧迫。侯晓迪指出:“如果你的每英里成本高于人类驾驶,那何谈商业化?”他建议行业内建立统一的CPM计算标准,避免数据游戏,推动形成统一的行业标准和合理的成本预期。


“从运营的角度来看,激光雷达的成本其实并不是大头,”侯晓迪说,真正的挑战在于如何控制车辆突发抛锚和紧急救援的成本。这些成本在长期运营中累积起来将极为可观,特别是在Robotaxi运营模式中,需要考虑人工远程操作员的管理成本,这也是制约该领域盈利能力的关键问题。


在谈到自动驾驶的商业模式时,侯晓迪认为,卡车运输相较于Robotaxi在风险与责任上有明显优势。不同于在复杂城市交通环境中的Robotaxi,货运卡车大多行驶在高速公路上,交通规则更明确,有利于责任控制和风险管理。他表示:“最关键的一点,不是减少事故,而是减少责任。”在他看来,事故责任界定的模糊性是自动驾驶Robotaxi在复杂城市环境中面临的挑战之一,而在高速路上的自动驾驶卡车可以较为明确地遵循既定交通规则,降低了发生事故后责任不清的风险。


在对话的最后,侯晓迪建议创业者不要因地缘政治的担忧而裹足不前,而是要迅速学习并适应全球规则,利用变化的环境来增强自身的竞争力。“这对每个人来说都是一场竞争,”侯晓迪说道,“你学得越快,就越能掌握这种环境。”


05

不止于GenAI:
机器人需要软硬件协同突破

机器人技术的主题讨论由Blue River Technology工程师张君武主持。TDK Ventures投资总监黄衡指出,特定的基础模型可以帮助机器人变得更加智能,强化学习可以让机器人更容易编程和控制,从而降低部署成本和时间。同时,人们将可以通过对话交互的方式与机器人沟通,这将开启许多此前不存在的应用场景。不过,他也强调,“我们需要专注于单位成本和安全性,机器人最好能够执行多个任务,而单位成本要低于人工成本。”


机器人主题论坛:张君武,叶天扬,Anand Lalwani,黄衡


目前,专用机器人在工业领域已经得到广泛应用,但通用型人形机器人离大规模商用还有一段距离。Cardinal Robotics 联合创始人兼CEO Anand Lalwani表示,"今天,我们仍然有非常特定的应用需要去攻克,比如擦窗户、清洁浴室等。专门的机器人会很有用。"他认为大型语言模型,尤其是它们容易产生幻觉的特性,目前还无法在商业应用中发挥作用。机器人一旦出现意外行为,后果将不堪设想。


事实上,大规模生产复杂的人形机器人对初创公司来说是一座不容易逾越的大山。制造业巨头如特斯拉在这方面有一定优势。黄衡认为,谷歌、英伟达在人形机器人领域和特斯拉并不存在直接竞争,”它们希望这个市场能够增长,这样它们就可以销售更多的GPU、软件和解决方案。”


从长远来看,机器人的普及最终将取决于成本。一旦机器人的使用成本降到与人力相当,企业就会加快部署的步伐,消费者也会广泛接受。Anand认为,亚洲国家如中国、韩国和日本在机器人应用方面处于领先地位,其次是欧洲,而美国则相对落后。不过,随着人力成本的上升,使用机器人正变得越来越经济。


Axoft 联合创认识兼CTO叶天扬指出,“脑机接口”会在下一代人类和AI交互界面方面起到重要作用。他认为,"如果有一个好的界面能够让我们控制AI,我们会觉得安全很多。”同时他强调脑机接口的发展过程中,现在的瓶颈主要在硬件上。


值得注意的是,机器人并非只能用于替代人工。目前这个行业主要关注带宽以及植入体能在大脑中待多久等基础问题。而在帮助老年人活动,帮助残疾人恢复身体功能等领域,机器人技术可以发挥独特的作用。"我们谈论的是那些目前没有好的解决方案的老年人和残障人士,他们可以通过外骨骼和机械假肢得到帮助。“这些设备不需要那么复杂,如果成本再低一些就更好了。考虑到这些患者的情况,不需要过于关注劳动力成本等因素。他认为这将是一个巨大的市场,也会产生巨大的社会影响。

06
 不要再背单词了,
AI时代的教育重点是培养智慧与远见
在"人工智能教育:如何让孩子为通用人工智能时代做好准备"主题演讲中,7EDU创始人兼CEO刘君指出,当前教育面临前所未有的分化:一部分学生将通过AI资源培养成长型思维和伦理意识,而另一部分则可能仅把AI当作捷径。传统教育模式过于注重知识传授,而AI时代更需要培养学生的智慧和远见,这恰恰是最难教授的部分。通过自己创办的创新学校实践,她观察到了AI教育工具应用的两面性:教师端显著提升了工作效率和个性化教学能力,但学生端却面临着技术使用意愿和判断能力的挑战。
刘君在AI与教育主题的演讲


特别值得注意的是,她发现学生对AI的看法与成年人很不相同,许多学生因对未来就业的担忧而产生不安全感。针对这些挑战,她提出了五点具体建议:培养批判性思维和规则挑战精神、鼓励成长型思维和韧性、加强社交情感能力、培养伦理意识,以及重视健康与幸福感。她总结道,“AI教育的本质不是人类与AI的竞争,而是通过AI赋能来强化人与人之间的联系与成长。”


07
 AI投资的关键矛盾:
技术确定性与估值泡沫并存

大会最后一场论坛"人工智能投资:机遇、炒作还是泡沫?"由硅谷101联合创始人陈茜主持,N-1 Life联合创始人兼首席执行官Janice Zang、Fusion Fund创始人兼管理合伙人张璐和Taihill Venture创始合伙人Tianyi "Sky" Yu就AI投资机遇与风险进行了深入探讨。


AI投资主题论坛:陈茜,Janice Zang,Sky Yu,张璐


在生物科技和医疗保险赛道,三位嘉宾无一例外都认为是最重要的AI投资赛道之一。Janice认为,AI正在全面影响生物科技:从药物发现、开发到生产、监管、临床试验和诊断,所有类型的公司都正受AI影响;接下来,生物科技界真正需要做的是理解“蛋白质在人体体内与其他微环境之间的相互作用”,让AI科学家和工程师找到挑战所在并将其标记(tokenized)、找到合适的数据进行应用,开发新的AI工具来应对这一领域的挑战。Janice希望能在这个方面持续得到VC风险投资的支持。


对于总部在波士顿的Taihill Venture来说,Sky认为大型制药公司尚未拥抱人工智能,至少如今并不认为人工智能将成为制药公司最核心的竞争力。由于GLP-1相关减肥药物的成功,如今大型制药公司比以前更加关注消费者市场。


但对于从2015年就开始投资医疗保健的Fusion Fund和张璐来说,她认为,“现在我们终于迎来了人工智能在医疗保健领域的黄金时代。” 张璐认为,医疗保险是能展示人工智能能力最好的行业之一:在人类社会中,30%的数据与医疗保健有关,而其中只有5%是有价值的分析;这就像一座金矿而人类尚未挖掘其价值。


在生物科技和医疗保险赛道之外,我们也聊到更宏观的AI投资趋势。当论坛主持人陈茜问道OpenAI已经开始在中东融资、是否代表硅谷VC们的资金已经耗尽了?张璐认为,目前硅谷VC手中依然有大量资金,只是如今市场表象较为两极分化:一边是像OpenAI这样的疯狂高估值、使得硅谷资本更集中,但另外一边初创公司们在探索大模型之外的可能性,包括高质量数据访问权限的产品、AI基建、应用层,甚至未来80%的成本将会在推理侧,这个趋势和思路去思考创新的正确方向才会有更多初创企业的机会。


此外,对于目前AI投资是否存在泡沫的问题,张璐认为估值存在泡沫,但AI技术并不是泡沫。这对投资人来说是一个挑战:即使AI的机会比互联网大10倍,60%的机会属于大公司,以及90%的消费端人工智能机会(Consumer AI)将由大型科技公司主导。因此,对于初创公司和VC投资来说,如何识别机会需要异常小心。因此,即便在美联储开启新一轮降息周期、更多低成本资金涌入投资赛道之际,保持谨慎怀疑态度很重要。


“有时候拥有太多资本是不必要的,”张璐补充道。


在AI投资上,Sky和Taihill Venture的看法更为乐观。他认为,AI创业中的B2B SaaS公司将很快完成产品对市场的PMF(市场契合度)周期,很多AI的B2B SaaS公司将实现数亿美元的收入并且成功以数十亿美元的估值退出,届时VC届会对AI行业更抱有信心。我们在等待下一个谷歌和Facebook出现,但目前没人能确定何时、如何发生。


就像不少嘉宾在论坛中提到的,AI带来的社会技术新范式只是一个开始,接下来会有数年时光的技术整合、基础设施研发,甚至不排除泡沫破灭的低潮期,但无论如何,欢迎各位加入我们,和硅谷101共同见证这个技术周期的下一步。



手记一



ChatGPT上线近两年来,硅谷已经有大大小小太多AI的线下论坛了。对于硅谷101的首次线下见面会&AI主题科技大会,我们想尝试点不一样的东西。


首先是主题上,我们设定了GenAI in the Valley: the Good, the Bad, and the Ugly,想让各个环节的主持人和嘉宾犀利地阐述AI产业所面临的挑战:不仅说技术带来的颠覆,更要说技术面对的泡沫,商业化挑战和过于乐观的预期。当主流市场热衷推崇一项新技术时,“泼冷水”的角色是需要勇气的,但这样的声音尤其珍贵。我们很开心看到在这次硅谷101科技大会论坛上,无论是开场的大模型LLM环节中有嘉宾坦率表示“我不觉得过去两年有什么突破”,还是图森创始人、如今Bot Auto创始人侯晓迪对无人驾驶市场的分析,还是机器人专场的嘉宾坦言人型机器人没那么容易做... 这些与众不同的观点是稀缺且重要的,也是硅谷101无论做节目还是做线下大会的初衷:我们想带来平衡、客观、颠覆一些认知的思想。


其次,我们想做一场“好玩”的大会。在硅谷最不缺的是技术探讨,但缺的是好玩有趣、有故事、有表演形式、多元化的线下聚会。所以我们引入了多媒体(Multiemdia)元素:开场的音频,穿梭在不同专场之间的五支视频,AI音乐现场生成表演,AI珠宝展示,AI教育分享... 我们相信,storytelling是能与不同受众产生共鸣的最直接方式,在现场,这样的多媒体元素也确实获得了观众们的喜爱。


最后,我们这次的目标是做一次“准时开场”、所有环节“严格守时”的大会,这其实对我们的前期策划、物料准备、现场执行、嘉宾签到等等环节都提出了很大考验,但很骄傲地,我们做到了。这要感谢硅谷101的工作人员、志愿者、合作伙伴和赞助方的共同努力,以及700多位到现场的观众们的支持(因为现场票提前售罄,不少现场临时来买票的观众只能站在最后,我们深感抱歉;下一次大型活动我们争取让大家的参会体验更舒适)。这次硅谷101线下见面会,不少观众是从亚洲、澳洲、欧洲,还有美国其他城市专程飞来支持我们,真的非常感谢大家、非常感动。We are so grateful.


我们接下来会更努力制作更多高质量、有趣好玩的科技和商业内容,请大家继续支持我们硅谷101,我们下次活动再见啦!

                                                                       ——陈茜,硅谷101联合创始人



手记二



在我们活动当天,我遇见一位来自西雅图的妈妈,她告诉我她听了好几年我们的节目。当天是他老公的生日,因为老公要带3个娃,所以没办法跟她一起来。后来,还遇到了很多特意从深圳、香港、休斯顿、欧洲等诸多城市飞过来的观众,很感动,也很感谢大家对我们活动的支持。


到活动临近的时候,卖出的票已经超过了场地最大限制人数,我们发现后立刻关闭了卖票入口,但依然有很多远道而来的观众希望能现场买票,看见席地而坐或者后面站满的人群我既抱歉又感慨。这也是我们第一次在硅谷筹备一个700人的中型活动,之前我们办过几次小型活动,每次都是通知刚发完人数就超限,所以有了这一次活动——更大的场地、更多的嘉宾、更多的参会者。


这恰恰是最近硅谷的现状——热火朝天。事实上,在我们办活动的当天,同一时间仅仅是在硅谷的华人活动就有六场。我的同事杜秀说,她刚来硅谷真的感受到大家愿意在周末花一个下午的时间,只是单纯地认真地学习,她感受到了一种向上生长的状态,也很惊诧于到活动快结束的时候,台下依然有近80%的观众,大家还是在很专心地听与记笔记。


当大的科技突破与浪潮席卷而来的时候,真正重大的变革,也就发生在两三年间,我们正在成为这段宏大历史的一个小记录者。我也一直在我的论坛上调侃,NotebookLM很快会给播客行业带来翻天覆地的变化,每一个人都不得不应对这些变化,或者主动或者被动。


也很骄傲每一位参与我们活动的小伙伴和我们邀请的每一位嘉宾一起扛起了活动质量,嘉宾也比在节目上更敢畅所欲言。现场也播了很多我们专门为每一个分论坛制作的主题小短片,都是我们同事们在保证正常更新节目之余熬着夜赶出来的。我的合伙人陈茜说:“我以前是做电视的,当电视台告诉你哪一秒要出现哪一秒要把话说完,就必须准时执行”,很庆幸有如此之好的创业伙伴我们真的做到了所有流程的准时。


整个行业正在一个范式转移的大跨越中,当我们再提到2024年,很高兴能在这样一个秋日的下午聚集这么多聪明的头脑,一起碰撞出一些灵感。

                                                                             ——泓君,硅谷101创始人



以下是更多现场花絮:


志愿者给到场的嘉宾验票,有观众提前一个小时就达会场
到了下半场会场仍然是满满的观众
分享结束后被观众围住的侯晓迪
绎不绝的参会者现场询问相关产品
展台区域热烈交流的观众


硅谷101
有趣有用的商业访谈
 最新文章