Bardeen,让AI代理更稳更快,让人人都能享用自动化

文摘   财经   2024-08-17 14:30   美国  


Bardeen,2020年成立于美国加利福尼亚州旧金山,专注于利用人工智能工具与Google Sheets和Slack等应用程序集成,自动化重复性任务,如数据输入和网络爬取。完成300万美元融资,投资方为Dropbox Ventures、HubSpot Ventures。累计融资2200万美元。其竞品包括 Zapier、UiPath。


Bardeen是少数优秀的“AI代理”初创公司之一,这类公司利用大型语言模型(LLMs)和生成式AI来提升企业的运营效率。目前,已有数千家客户,包括Deel在内,使用Bardeen的Chrome扩展程序进行工作流程自动化。Bardeen在AI代理领域的突出之处在于其独特的方式,结合了确定性和AI驱动的自动化技术。




Pascal W.,Bardeen Inc. 联合创始人兼CEO,曾是一家匿名 AI Company的首席AI官,专注于为企业客户提供实用的增强智能,并在公司早期建立研发团队并领导其工作。自2016年以来,他还担任Weinberger Ventures的天使投资人、导师和顾问,专注于AI、网络安全和开放科学初创公司的投资。此外,担任Alpha Intelligence Capital的顾问和风险合伙人,并自2023年起担任萨姆奥特曼的Worldcoin的董事会成员。他曾就读于法兰克福歌德大学,主修理论与数学物理,但未完成学位。他和Artem Harutyunyan联合创立公司。



在这次访谈中,Pascal和Artem分享了Bardeen的创立初衷、他们独特的AI自动化方法以及Bardeen在AI领域的定位。


首先,能否介绍一下你们的背景,以及是什么促使你们共同创立了Bardeen?


Pascal:大家好!我是Pascal,Bardeen的首席执行官兼联合创始人。我的背景是在计算机视觉领域,我曾与多个团队合作,经营过自己的计算机视觉公司,还曾领导Telefonica的一支大型AI团队。


Artem:我是Artem,我的背景是系统和基础设施工程,之前在Mesosphere(后来更名为D2iQ)担任重要职位,领导工程和产品团队。


有趣的是,Artem和我的故事始于我们都试图通过自动化来“解放”自己。我们尝试了许多不同的自动化软件,但没有一个完全符合我们的需求。因此,我们不约而同地想到了创建一个类似于“mini-me”的项目——这是我们独立想出来的最初项目名称。我们向一位共同的朋友Flo Liebert提出了这个想法,他当时是Mesosphere的卸任CEO,后来成为了我们的第一位种子投资者。


我们第一次讨论时,彼此的想法几乎完全一致,双方一拍即合。经过几个月的探讨和相互了解,我们决定共同创立这家公司,最终打造一个人人都能使用的自动化平台。现在市面上的自动化工具通常是为大型公司设计的,需要庞大的咨询团队来支持,或者是相当技术化的,需要用户具备编程技能。它们主要是为“运营人员”设计的,但对于那些真正从事销售、营销、招聘和管理等日常工作的人员来说,选择其实非常有限。


我们创建Bardeen的目标是打造一个任何人都能使用的自动化工具,尤其是那些每天亲自处理工作的人。我们的愿景是将目前还未实现自动化的90%的市场彻底实现自动化。


您会如何向开发者和潜在客户介绍Bardeen?


Bardeen可以被看作是利用生成式AI,直接在浏览器中为你发现、构建和运行自动化流程的工具。具体来说,我们使用生成式AI,让用户能够非常轻松地创建自动化流程。你只需通过自然语言描述你需要自动化的任务,我们就能为你构建相应的自动化。



我们选择将Bardeen集成到浏览器中,因为我们认为浏览器是未来的运行环境,尤其是考虑到大多数人90%的时间都在浏览器中度过,而且通常打开着50多个标签页。你在工作流程中花费了大量时间在不同平台之间移动和转换数据,无论是销售、招聘、项目管理,还是研究潜在的面试公司。许多这样的工作流程都是高度重复的,涉及在多个浏览器标签页之间转移数据。这正是我们希望通过Bardeen简化的工作流程。


今天,您的目标客户是谁?您认为哪一类客户使用 Bardeen 受益最大?


我们目前的目标用户是一线知识工作者,或者更通俗地说,是那些“真正做事”的人,重点就在于“真正”这两个字。很多现有的自动化工具主要是为销售或营销等运营角色设计的,但那些直接参与工作的人,比如销售开发代表(SDRs)、业务开发代表(BDRs)、招聘人员和营销人员,却没有得到充分的服务。我们发现Bardeen在一些领域非常受欢迎,比如潜在客户线索、外展、跟踪和项目管理,这些工作流程在销售、营销、招聘等领域具有相似的模式。


举个例子,如果你有一个数据来源,比如LinkedIn或Apollo,那么你需要将这些数据转移到某种跟踪系统中,比如电子表格、Notion或客户关系管理系统(CRM),然后再进行筛选和外展。这种模式适用于许多行业,我们看到它在销售人员、房地产专业人士、招聘人员和营销人员中尤其受欢迎。


我们的挑战不仅仅是开发产品,还要改变用户的行为。这既是一个教育问题,也是帮助人们理解他们可以并且应该实现自动化的问题。为此,我们在内容创作上投入了大量资源——撰写指南和制作视频,帮助用户学习这项技能。


能否介绍一下,相对于其他人工智能驱动的自动化平台, Bardeen 对单个工作流程的改进有哪些竞争优势?


Bardeen的优势在于其确定性运行时架构,这意味着在运行时,大多数情况下不需要调用语言模型。我们在“构建时间”解决了用户意图的推理和解释问题,这是一个高延迟、高成本的挑战,但一旦自动化流程被创建后,每次运行时通常不再需要依赖智能代理模型,仅仅需要调用一系列预先编写的API和DOM(文档对象模型)交互。


这带来了显著的性能提升:在执行这些自动化流程时,几乎没有延迟,除了API本身的延迟,这和你手动操作时会遇到的延迟是一样的,甚至还更短。因为不需要等待UI渲染,也不需要等语言模型进行推理或结构化处理。此外,这种方法还避免了语言模型固有的非确定性、幻觉等问题。


因此,在运行时的延迟、可靠性和成本方面,Bardeen比其他自动化平台快了几个数量级。


但在构建时就不一样了。在构建时间,我们充分利用了大型语言模型(LLMs)的强大功能,使用户能够轻松构建和测试与其工作流程相关的自动化。这就是AI的强大之处,因为它解锁了许多以前不可能实现的用例。它不仅帮助用户发现哪些流程可以且应该被自动化,还能够将用户语言表达的意图,转化为可执行的自动化代理方案。


能否回顾一下Bardeen创业历程,生成式人工智能和代理的出现如何影响公司的发展轨迹?


Bardeen的发展历程相当有趣。在早期,尽管当时生成式AI还没有广泛应用,我们就已经设想用户能够像使用搜索引擎一样,描述他们想要自动化的内容,然后系统会自动实现。这种设想在当时引发了不少质疑,大家都在讨论是否真的有可能构建出这样的系统。我们当时已经开始思考如何推出产品、收集大量数据、训练自己的模型,并从头开始构建整个系统。为此,我们设计了一种专门为自动化构建的DSL(领域特定语言),使其代码可以轻松通过语言模型生成。


随着GPT-3.5的发布,对我们的创业方向开始转变。由于GPT-3.5经过大量代码训练,我们从一开始就看到它在语义解析问题上表现出色,这对解决我们产品的核心问题至关重要。


如今,通过我们与集成的API调用和DOM操作,用户可以执行很多确定性的操作。然而,总有一些用户想要执行的操作没有对应的API,这就是下一代AI代理的用武之地,能够填补这些“长尾”需求的空白。对于可以通过API完成的操作,我们仍然建议优先使用API,因为它是最可靠的方式;但对于那些无法通过API完成的操作,现在可以通过Web UI来实现。这也是我们构建Bardeen的AI代理时所采用的方法,使得我们的代理既多功能又可靠。


我们目前的Agent方法,支持实现更复杂的多步骤工作流程。我们坚持认为,自动化、智能代理或协同工具背后需要有某种确定性基础。简单地将DOM交给大型语言模型处理,是无法达到预期效果的。


Artem,您已经公开表达了您对目前人工智能代理框架的不足之处的想法,以及 Bardeen 如何以不同的方式思考这个问题。能否像我们详细介绍下?


当然可以。


首先,我认为现有的网页用户界面(UI)是为人类设计的,而人类在面对复杂的界面时很容易感到不知所措。因此,最优秀的UI设计,如Apple、Linear和Notion,通常都以简单和清晰作为切入点。然而,这种“简单”往往意味着实际功能被隐藏在菜单和层级之下。此外,UI非常动态,时常发生变化。对于AI代理来说,这一开始就带来了巨大劣势——因为应用的设计初衷并不是为了AI代理服务,而是为了满足其他需求,这往往会妨碍代理实现目标。


其次,网络环境本身对AI代理也非常不友好。因为AI代理在网络上很难与其他自动化工具或恶意机器人区分开来,而这些机器人通常会与恶意活动相关联。网页上普遍存在的防机器人措施和各种保护机制,往往无意中会破坏AI代理的正常操作。另外,网页应用的底层结构,即DOM(文档对象模型),也是问题之一。DOM是一个庞大的信息树,设计目的是为了让浏览器高效渲染页面,而不是为AI代理与其交互进行优化的。


最后,值得自动化的任务必须是那些有足够价值和频率的操作,而不仅仅是每隔几个月花5分钟做一次的事情。



我们在Bardeen的做法是尽可能引入确定性,也就是说,尽量避免AI带来的不确定性。例如,如果我要在电子表格中填写100行数据,我不应该依赖AI来完成这个任务,而应该使用API调用。然而,还有许多操作没有对应的API,这是AI真正可以发挥作用的地方,因为人类可以描述这些操作,而AI可以将这些描述转化为自动化流程。


因此,我们的做法与当前市面上的AI代理框架有着根本的不同。我们明确区分了“构建自动化”和“运行自动化”这两个过程。我们相信,在运行自动化时,必须尽量做到确定性,以降低失败的可能性。这也是为什么我们认为,应该依赖那些已经被验证过的API,而将AI用于那些无法通过API完成的任务。


对于人工智能领域的开发者来说,多模态是一个非常令人兴奋的领域。如何将多模态 AI 功能纳入 Bardeen 的路线图?


多模态AI确实是一个令人兴奋的领域。我们最近发表了一篇名为“WILBUR”的论文,详细阐述了我们的方法和基准。我们的研究表明,如果AI代理设计得当,文本输出的效果可以与多模态AI的表现相媲美,而且成本更低,速度更快。当然,模型在不断演进,这是一个非常动态的领域,未来的发展还需要进一步观察。


在产品化方面,我认为那些真正从事实际工作的用户正在期待多模态AI带来的生产力的提升。对我们来说,今年的重点是执行,而不是发布华丽的Twitter演示或做公关宣传。例如,一个来自南非的汽车经销商有20家门店,他们面临严峻的业务问题,而我们正在为他们解决这些问题。


因此,我们的目标是让AI产品更简单、更好、更快、更便宜,并吸引更多的用户。我们每周有数万名用户在使用Bardeen,其中很多人是付费用户。最终,我们希望实现端到端的自动化,让用户不必思考要自动化什么,而是有一个得力助手在旁边观察你的每一个动作,并主动为你提供建议。


最后,分享一些关于您的团队信息。您想建立什么样的公司文化?


我们目前的团队大约有30人,是一个完全远程的团队,主要以工程师为主。我们是一群热衷于解决问题的人,喜欢挑战自我,直到突破重重障碍。我们希望打造一种人人都极具好奇心并且高度坚持不懈的文化。


我们面临的挑战非常艰巨,不仅在市场推广方面,在技术和研究方面也是如此。因此,我们希望找到那些对知识充满好奇,渴望推动市场发展、突破研究界限,并将一切提升到更高水平的人。



硅谷科技评论(SVTR)AI创投社区覆盖人数超过10W,大都来自全球科技大厂、顶尖投资机构和高潜创业企业。欢迎联系凯瑞(pkcapital2023),加入我们创业工作室,成为导师、顾问创业合伙人。文末阅读原文访问AI创投库

AI周报:


001002003004005006007008 009 010
011012013014015016017018 019020
021022023024025026027028 029030
031032033034035036037038 039040
041042043044045046047048
049
050 
051052 
053
054 
055
056
057
058
059
060
061
062 
063 
064
065





AI创投



+



AI工程师有多强?3天上线全球首个AI数据库
“AI张雪峰”诞生,北大团队用 AI 重塑教育咨询
1人团队,百万营收的AI套壳
独立创始人的崛起:如何独自创办公司
全球七大科技巨头的 4000 亿美元 AI 战略布局
性格决定创业成败顶尖VC投的AI公司
如何寻找创业方向中美AI创投异同
如何聘请CEO
应该关注哪些AI公司
如何确定CEO的薪水如何评估AI初创公司
如何分配股权和头衔海外投资人谈AI新趋势
如何组建和召开董事会做通才还是专才风投人
如何写商业计划书红杉资本如何做投资
初创公司估值如何及早识别独角兽
如何找到创业合伙人如何避免7大投资陷阱
AI初创公司商业模式合伙人是怎么炼成的
选择自己的创业导师 
Souring的艺术
创始人如何做电梯演讲

精品基金VS超级基金

YC给年轻创始人建议

初创工作室

如何成为亿万富翁
颜值如何影响VC决策
如何做出困难的决定
如何快速解读对方性格
如何在海外启动新产品
硅谷投资人的武器库
如何确认真实投资意愿
VC改变世界?
找这种人实现快速裂变
AI 创投七大新趋势
AI原生公司定价策略
微软(M12)投资策略
GTM指南ICONIQ小扎的朋友圈
如何选择VCCowboy:AI大势所趋
YC:如何独立思考
SOSV: 从草根到帝国
如何打造AI驱动的公司
风投界的水晶球
不要像投资人那样思考Coatue:AI革命
创始人与市场契合度
谁是全球创业之都
为什么初创公司会失败
全球AI投资机构Top10
初创公司如何聘请CEO
彼得·泰尔
什么决定创业成败
General Catalyst
AI驱动VC全球AI创投生态


AI行业



+



全球 Gen AI 独角兽大盘点,中国4家大模型上榜
大模型系列:海外 数学 性价比 编程 医疗 评估 训练成本 | 小模型
AI 公司创始人 华裔创始人 北美科技人才中心地图
AI 公司地理和行业分布 以色列 德国 旧金山湾区 欧洲
福布斯AI 50 斯坦福AI指数 企业科技AI 30 高增长AI 50 C端AI 50 | 工具AI 50 | SVTR AI 100 | 自力更生AI 25
AI+编程 医疗 企服 电商 设计 勘探 教育 写作 客服 法律 视频 3D | 音乐 | 搜索 | 心理精神 | 消费者科技 | 安全 | 生产力工具 | 浏览器 | 游戏 | 会计 | 数据分析 | 销售 | Scribe | 金融投资
人工智能能做什么?
LLMOps
AI是否会被垄断AI未解之谜
开源AI开发者工具AI域名
生成式 AI 六大趋势
巨头的AI战争
AI Agent自动化具身智能
AI专利2023年AI总结和展望


AI公司



+



11x.ai,AI虚拟销售员,半年内突破200万美元
Adobe:从Adobe、Figma、Canva 到 OpenAI
Amazon:人工智能战略
Anduril Industries,AI 重新定义现代战争与和平
Anthropic:OpenAI"宫斗"背后的公司
Apple:产品收入变迁 AI 并购之王

Calendly:日程安排助手,AI效率工具鼻祖

Canva:从Adobe、Figma、Canva 到 OpenAI

Cohere:为企业提供大模型

CoreWeave:GPU租赁独角兽,英伟达的好盟友

Databricks,从数据湖到大模型
DeepL,从机器翻译到AI写作的语言沟通利器
DoNotPay:世界首款AI机器人律师

Duolingo:如何改写语言学习

E2B,为 AI 代理构建自动化云平台
Figma从Adobe、Figma、Canva 到 OpenAI

Glean:重塑知识工作的未来

Google:谷歌人工智能战略
Grammarly:从论文查重到AI写作的沟通利器
Hugging Face:开源AI的未来
Jenni AI:如何通过AI写作实现年入千万
Marblism, 一句AI提示词自动生成各类软件
Microsoft:收入拆解M12
Midjourney:0融资,11人,$1亿收入
Mistral,欧洲大模型,性价比之王
MultiOn,用人工智能代理给软件装上大脑
Neuralink:让失明者重见光明,让瘫患者再次行走,让人类与AI融合永生
NVIDIA:收入按产品线拆解AI投资策略
OpenAI:人工智能突破的前沿员工董事会营销GPT Store奥特曼马斯克地产生意微软投资婚礼产品生态Thrive Capital
Pika:AI视频的未来
Rad AI ,如何用 AI 改变医疗保健?
Reddit:奥特曼押注基于兴趣社交的美版“贴吧”
Replicate:1人AI公司背后的幕后英雄
Replite:教马斯克的儿子如何写代码
Perplexity:挑战谷歌,站在AI搜索最前沿
RunwayAI视频的未来
Scale AI:如何成为数字世界的“水源”
Shein:打造下一个“中国首富”

SpaceX:梦想照进现实,人类星际生命的曙光

Stability AI:SD 背后的公司和创始人
Stripe:马斯克和奥特曼押注的支付王者
Substack,美版公众号,为价值付费

Superhuman:邮件超人,拥抱 AI

Vannevar Labs:AI+国防,军事人工智能掘金者
Zapier:ChatGPT最受欢迎插件的过去和未来

硅谷科技评论
全球前沿科技,创业投资孵化
 最新文章