人工智能被誉为21世纪三大尖端技术之一。在安徽,有这样一群人,怀揣“把中文语音技术做到全世界最好”的梦想,勇于探路、矢志创新,从20多年前让机器能听会说,到10多年前让机器能理解会思考,再到现如今大模型赋能千行百业,他们在人工智能领域完成一次次跨越,成为敢打头阵的科技力量。
在这个领域中做到跟国际“比肩”,甚至在部分算法和应用场景中,我们做的在全球领先。
语音是文化的基础和民族的象征。中国的语音技术如果是被外国人做得比我们还好,那就是中国被人掐住“咽喉”。为民族把中文(语音技术)做到全球最好,那时候已经很明确了。
当时的经贸委,安徽省经贸委给了我们60万(元)资金,但那个时候对我们是至关重要的,使我们开始在安徽创立了我们最开始的公司,就是科大讯飞的前身。
讯飞内部做了很多的产品,但那个产品基本上都是“拍脑袋”出来的,没有做过什么市场调研、市场分析,根本就没有销路、没有出路。大家怀疑了,就是说语音技术到底能不能支撑起来一个创业公司。
尤其是我们作为“理工男”,第一个想法就是技术很牛,技术可以改变一切。但实际当中你会发现,技术好不代表你就能挣钱。当时大家内部也会有一些不同的声音,我们要不要去做房地产?我们要不要去做游戏?
每年都亏损,每年都觉得在“流血”,可是我们是感觉到我的技术不断在进步,我在行业中的资源整合越来越强,我的领先优势越来越明显,那我就觉得心中有底,虽然还一直在亏,但是我们能看得见未来。
持续追求更高的技术,我们叫坚守;技术还要找到它的契合点,如果从商业模式的角度来说,把一个研究做成引擎,引擎做成产品,产品做成商品,商品做成商业。
2006年,会说26种语言;2008年,听声就能识人;2010年,可以看懂文字;2012年,学会语义理解;2014年,科大讯飞正式启动“超脑计划”;2016年,吹响了进军人工智能的号角……以技术赋能,智慧政务、智慧教育、智慧医疗、智能制造、智慧交通等等,商业应用也打开了规模化、产业化的“大门”,中文语音市场占有率一度达到70%左右。2019年,企业迎来了大丰收,不仅斩获了10项国内外权威赛事冠军,并且让机器的阅读理解能力全球首次超过人类平均水平,营业收入更是首次突破100亿元大关。
时光飞逝。转眼就到了2022年,以ChatGPT为代表的人工智能大模型开始火爆全球,科大讯飞已经提前感知到了这一趋势。
大模型就是说它的参数很多,它背后训练的这样一些数据更多。从原来的专用模型,到一个通用模型可以完成各种各样类型的任务,在很多任务上,可能比你原来的专用模型效果还要好。大模型的智能涌现,推动了通用人工智能的进步,这是不亚于互联网和PC(个人计算机)的新一场革命。
大模型的风起云涌,让公司上下既兴奋又担忧。兴奋的是,看到了革命性突破现有AI技术的契机,可以大展拳脚;担忧的是,重新配置人力财力,势必会对当前技术和产品的研制造成影响,加上大模型开发特别“烧钱”,经营和资金压力都会很大。
那时候对这些挑战方面的东西都想了,大家讨论以后,反而更多的大家是一种兴奋,我们讲人生能有几回搏,这个事情本身就是一个大的机遇,那就要去抓住它。
就是它对算力的消耗,可能是我们以前的所做的各种技术跟它都不在一个量级上,就没有那么多的资源。别人只要有钱,他就可以买国外成熟的算力,我们那时候花钱有的资源是买不到的。
在构成算力集群来训超大规模的人工智能的模型,比如说1万多亿的参数的模型上,我们要构建系统级优势,这方面是踏踏实实往前走了一步。
自主可控也是一个放开手脚、你去创新创造的机会。下定这个决心,我一定要做,而且我一定要把它做出来。现在我们在国产化的供应链的这种硬件上,实现我们算法自主可控。
无论是从文本生成、知识问答、逻辑推理,还是语言理解、数学能力、代码能力、多模态能力,这七个维度的能力我们都已经达到了实用的门槛,都可以在应用过程中来自主地迭代,不断地去进化。深度地给个人、给行业赋能,给产品赋能,已经看到了越来越清晰的模式,而且已经取得了良好的阶段性成果。我们觉得中国的通用人工智能就已经可以站住了。
往期回顾
1
2
3
4