Bardeen,2020年成立于美国加利福尼亚州旧金山,专注于利用人工智能工具与Google Sheets和Slack等应用程序集成,自动化重复性任务,如数据输入和网络爬取。完成300万美元融资,投资方为Dropbox Ventures、HubSpot Ventures。累计融资2200万美元。其竞品包括 Zapier、UiPath。
Bardeen是少数优秀的“AI代理”初创公司之一,这类公司利用大型语言模型(LLMs)和生成式AI来提升企业的运营效率。目前,已有数千家客户,包括Deel在内,使用Bardeen的Chrome扩展程序进行工作流程自动化。Bardeen在AI代理领域的突出之处在于其独特的方式,结合了确定性和AI驱动的自动化技术。
Pascal W.,Bardeen Inc. 联合创始人兼CEO,曾是一家匿名 AI Company的首席AI官,专注于为企业客户提供实用的增强智能,并在公司早期建立研发团队并领导其工作。自2016年以来,他还担任Weinberger Ventures的天使投资人、导师和顾问,专注于AI、网络安全和开放科学初创公司的投资。此外,担任Alpha Intelligence Capital的顾问和风险合伙人,并自2023年起担任萨姆奥特曼的Worldcoin的董事会成员。他曾就读于法兰克福歌德大学,主修理论与数学物理,但未完成学位。他和Artem Harutyunyan联合创立公司。
在这次访谈中,Pascal和Artem分享了Bardeen的创立初衷、他们独特的AI自动化方法以及Bardeen在AI领域的定位。
首先,能否介绍一下你们的背景,以及是什么促使你们共同创立了Bardeen?
Pascal:大家好!我是Pascal,Bardeen的首席执行官兼联合创始人。我的背景是在计算机视觉领域,我曾与多个团队合作,经营过自己的计算机视觉公司,还曾领导Telefonica的一支大型AI团队。
Artem:我是Artem,我的背景是系统和基础设施工程,之前在Mesosphere(后来更名为D2iQ)担任重要职位,领导工程和产品团队。
有趣的是,Artem和我的故事始于我们都试图通过自动化来“解放”自己。我们尝试了许多不同的自动化软件,但没有一个完全符合我们的需求。因此,我们不约而同地想到了创建一个类似于“mini-me”的项目——这是我们独立想出来的最初项目名称。我们向一位共同的朋友Flo Liebert提出了这个想法,他当时是Mesosphere的卸任CEO,后来成为了我们的第一位种子投资者。
我们第一次讨论时,彼此的想法几乎完全一致,双方一拍即合。经过几个月的探讨和相互了解,我们决定共同创立这家公司,最终打造一个人人都能使用的自动化平台。现在市面上的自动化工具通常是为大型公司设计的,需要庞大的咨询团队来支持,或者是相当技术化的,需要用户具备编程技能。它们主要是为“运营人员”设计的,但对于那些真正从事销售、营销、招聘和管理等日常工作的人员来说,选择其实非常有限。
我们创建Bardeen的目标是打造一个任何人都能使用的自动化工具,尤其是那些每天亲自处理工作的人。我们的愿景是将目前还未实现自动化的90%的市场彻底实现自动化。
您会如何向开发者和潜在客户介绍Bardeen?
Bardeen可以被看作是利用生成式AI,直接在浏览器中为你发现、构建和运行自动化流程的工具。具体来说,我们使用生成式AI,让用户能够非常轻松地创建自动化流程。你只需通过自然语言描述你需要自动化的任务,我们就能为你构建相应的自动化。
我们选择将Bardeen集成到浏览器中,因为我们认为浏览器是未来的运行环境,尤其是考虑到大多数人90%的时间都在浏览器中度过,而且通常打开着50多个标签页。你在工作流程中花费了大量时间在不同平台之间移动和转换数据,无论是销售、招聘、项目管理,还是研究潜在的面试公司。许多这样的工作流程都是高度重复的,涉及在多个浏览器标签页之间转移数据。这正是我们希望通过Bardeen简化的工作流程。
今天,您的目标客户是谁?您认为哪一类客户使用 Bardeen 受益最大?
我们目前的目标用户是一线知识工作者,或者更通俗地说,是那些“真正做事”的人,重点就在于“真正”这两个字。很多现有的自动化工具主要是为销售或营销等运营角色设计的,但那些直接参与工作的人,比如销售开发代表(SDRs)、业务开发代表(BDRs)、招聘人员和营销人员,却没有得到充分的服务。我们发现Bardeen在一些领域非常受欢迎,比如潜在客户线索、外展、跟踪和项目管理,这些工作流程在销售、营销、招聘等领域具有相似的模式。
举个例子,如果你有一个数据来源,比如LinkedIn或Apollo,那么你需要将这些数据转移到某种跟踪系统中,比如电子表格、Notion或客户关系管理系统(CRM),然后再进行筛选和外展。这种模式适用于许多行业,我们看到它在销售人员、房地产专业人士、招聘人员和营销人员中尤其受欢迎。
我们的挑战不仅仅是开发产品,还要改变用户的行为。这既是一个教育问题,也是帮助人们理解他们可以并且应该实现自动化的问题。为此,我们在内容创作上投入了大量资源——撰写指南和制作视频,帮助用户学习这项技能。
能否介绍一下,相对于其他人工智能驱动的自动化平台, Bardeen 对单个工作流程的改进有哪些竞争优势?
Bardeen的优势在于其确定性运行时架构,这意味着在运行时,大多数情况下不需要调用语言模型。我们在“构建时间”解决了用户意图的推理和解释问题,这是一个高延迟、高成本的挑战,但一旦自动化流程被创建后,每次运行时通常不再需要依赖智能代理模型,仅仅需要调用一系列预先编写的API和DOM(文档对象模型)交互。
这带来了显著的性能提升:在执行这些自动化流程时,几乎没有延迟,除了API本身的延迟,这和你手动操作时会遇到的延迟是一样的,甚至还更短。因为不需要等待UI渲染,也不需要等语言模型进行推理或结构化处理。此外,这种方法还避免了语言模型固有的非确定性、幻觉等问题。
因此,在运行时的延迟、可靠性和成本方面,Bardeen比其他自动化平台快了几个数量级。
但在构建时就不一样了。在构建时间,我们充分利用了大型语言模型(LLMs)的强大功能,使用户能够轻松构建和测试与其工作流程相关的自动化。这就是AI的强大之处,因为它解锁了许多以前不可能实现的用例。它不仅帮助用户发现哪些流程可以且应该被自动化,还能够将用户语言表达的意图,转化为可执行的自动化代理方案。
能否回顾一下Bardeen创业历程,生成式人工智能和代理的出现如何影响公司的发展轨迹?
Bardeen的发展历程相当有趣。在早期,尽管当时生成式AI还没有广泛应用,我们就已经设想用户能够像使用搜索引擎一样,描述他们想要自动化的内容,然后系统会自动实现。这种设想在当时引发了不少质疑,大家都在讨论是否真的有可能构建出这样的系统。我们当时已经开始思考如何推出产品、收集大量数据、训练自己的模型,并从头开始构建整个系统。为此,我们设计了一种专门为自动化构建的DSL(领域特定语言),使其代码可以轻松通过语言模型生成。
随着GPT-3.5的发布,对我们的创业方向开始转变。由于GPT-3.5经过大量代码训练,我们从一开始就看到它在语义解析问题上表现出色,这对解决我们产品的核心问题至关重要。
如今,通过我们与集成的API调用和DOM操作,用户可以执行很多确定性的操作。然而,总有一些用户想要执行的操作没有对应的API,这就是下一代AI代理的用武之地,能够填补这些“长尾”需求的空白。对于可以通过API完成的操作,我们仍然建议优先使用API,因为它是最可靠的方式;但对于那些无法通过API完成的操作,现在可以通过Web UI来实现。这也是我们构建Bardeen的AI代理时所采用的方法,使得我们的代理既多功能又可靠。
我们目前的Agent方法,支持实现更复杂的多步骤工作流程。我们坚持认为,自动化、智能代理或协同工具背后需要有某种确定性基础。简单地将DOM交给大型语言模型处理,是无法达到预期效果的。
Artem,您已经公开表达了您对目前人工智能代理框架的不足之处的想法,以及 Bardeen 如何以不同的方式思考这个问题。能否像我们详细介绍下?
当然可以。
首先,我认为现有的网页用户界面(UI)是为人类设计的,而人类在面对复杂的界面时很容易感到不知所措。因此,最优秀的UI设计,如Apple、Linear和Notion,通常都以简单和清晰作为切入点。然而,这种“简单”往往意味着实际功能被隐藏在菜单和层级之下。此外,UI非常动态,时常发生变化。对于AI代理来说,这一开始就带来了巨大劣势——因为应用的设计初衷并不是为了AI代理服务,而是为了满足其他需求,这往往会妨碍代理实现目标。
其次,网络环境本身对AI代理也非常不友好。因为AI代理在网络上很难与其他自动化工具或恶意机器人区分开来,而这些机器人通常会与恶意活动相关联。网页上普遍存在的防机器人措施和各种保护机制,往往无意中会破坏AI代理的正常操作。另外,网页应用的底层结构,即DOM(文档对象模型),也是问题之一。DOM是一个庞大的信息树,设计目的是为了让浏览器高效渲染页面,而不是为AI代理与其交互进行优化的。
最后,值得自动化的任务必须是那些有足够价值和频率的操作,而不仅仅是每隔几个月花5分钟做一次的事情。
我们在Bardeen的做法是尽可能引入确定性,也就是说,尽量避免AI带来的不确定性。例如,如果我要在电子表格中填写100行数据,我不应该依赖AI来完成这个任务,而应该使用API调用。然而,还有许多操作没有对应的API,这是AI真正可以发挥作用的地方,因为人类可以描述这些操作,而AI可以将这些描述转化为自动化流程。
因此,我们的做法与当前市面上的AI代理框架有着根本的不同。我们明确区分了“构建自动化”和“运行自动化”这两个过程。我们相信,在运行自动化时,必须尽量做到确定性,以降低失败的可能性。这也是为什么我们认为,应该依赖那些已经被验证过的API,而将AI用于那些无法通过API完成的任务。
对于人工智能领域的开发者来说,多模态是一个非常令人兴奋的领域。如何将多模态 AI 功能纳入 Bardeen 的路线图?
多模态AI确实是一个令人兴奋的领域。我们最近发表了一篇名为“WILBUR”的论文,详细阐述了我们的方法和基准。我们的研究表明,如果AI代理设计得当,文本输出的效果可以与多模态AI的表现相媲美,而且成本更低,速度更快。当然,模型在不断演进,这是一个非常动态的领域,未来的发展还需要进一步观察。
在产品化方面,我认为那些真正从事实际工作的用户正在期待多模态AI带来的生产力的提升。对我们来说,今年的重点是执行,而不是发布华丽的Twitter演示或做公关宣传。例如,一个来自南非的汽车经销商有20家门店,他们面临严峻的业务问题,而我们正在为他们解决这些问题。
因此,我们的目标是让AI产品更简单、更好、更快、更便宜,并吸引更多的用户。我们每周有数万名用户在使用Bardeen,其中很多人是付费用户。最终,我们希望实现端到端的自动化,让用户不必思考要自动化什么,而是有一个得力助手在旁边观察你的每一个动作,并主动为你提供建议。
最后,分享一些关于您的团队信息。您想建立什么样的公司文化?
我们目前的团队大约有30人,是一个完全远程的团队,主要以工程师为主。我们是一群热衷于解决问题的人,喜欢挑战自我,直到突破重重障碍。我们希望打造一种人人都极具好奇心并且高度坚持不懈的文化。
我们面临的挑战非常艰巨,不仅在市场推广方面,在技术和研究方面也是如此。因此,我们希望找到那些对知识充满好奇,渴望推动市场发展、突破研究界限,并将一切提升到更高水平的人。
AI周报:
AI创投
+
AI行业
+
全球 Gen AI 独角兽大盘点,中国4家大模型上榜 | |
大模型系列:海外 | 数学 | 性价比 | 编程 | 医疗 | 评估 | 训练成本 | 小模型 | |
AI 公司创始人 | 华裔创始人 | 北美科技人才中心地图 | |
AI 公司地理和行业分布 | 以色列 | 德国 | 旧金山湾区 | 欧洲 | |
福布斯AI 50 | 斯坦福AI指数 | 企业科技AI 30 | 高增长AI 50 | C端AI 50 | 工具AI 50 | SVTR AI 100 | 自力更生AI 25 | |
AI+编程 | 医疗 | 企服 | 电商 | 设计 | 勘探 | 教育 | 写作 | 客服 | 法律 | 视频 | 3D | 音乐 | 搜索 | 心理精神 | 消费者科技 | 安全 | 生产力工具 | 浏览器 | 游戏 | 会计 | 数据分析 | 销售 | Scribe | 金融投资 | |
人工智能能做什么? | LLMOps |
AI是否会被垄断 | AI未解之谜 |
开源AI,开发者工具 | AI域名 |
生成式 AI 六大趋势 | 巨头的AI战争 |
AI Agent,自动化 | 具身智能 |
AI专利 | 2023年AI总结和展望 |
AI公司
+