哈萨克国际通讯社官网地址:
哈萨克语大型语言模型Kaz-LLM正式发布
(哈萨克国际通讯社讯)哈萨克语大型语言模型Kaz-LLM正式发布。
VEON有限公司(纳斯达克代码:VEON)宣布了这一消息。据该公司官网报道,项目由哈萨克斯坦数字创新和航空航天工业部协调推动,开发工作由纳扎尔巴耶夫大学下属的智能系统与人工智能研究所(ISSAI)牵头,并与VEON旗下的QazCode、Beeline Kazakhstan和阿斯塔纳枢纽(Astana Hub)共同合作完成。
据悉,Kaz-LLM项目收集、整理并翻译了超过1500亿个语料单元,能够支持哈萨克语、土耳其语、英语和俄语的交互。目前,该模型推出了80亿和700亿参数两个版本,并已在开发者社区平台Hugging Face发布。作为哈萨克斯坦本土研发的语言模型,Kaz-LLM的发布将显著加速本国人工智能产品与服务的开发与应用。
哈萨克斯坦数字发展、创新和航空航天工业部部长加斯兰·马迪耶夫对此表示说:
- 开放源代码的Kaz-LLM的发布标志着哈萨克斯坦人工智能生态系统建设迈出关键一步。我们始终致力于通过技术创新推动国家科学与经济发展。这一创新模型将帮助消除数字鸿沟,让每一位哈萨克斯坦公民,无论使用何种语言,都能享受到便捷的数字服务。
值得一提的是,Beeline Kazakhstan和QazCode此前已推出多款自主研发的人工智能产品,包括首个哈萨克语开源模型Kaz-RoBERTA-conversational,该模型拥有20亿参数,广泛应用于Beeline Kazakhstan的客户服务互动,并已在Hugging Face平台被下载超过3000次。此外,QazCode还积极参与全球低资源语言模型开发的经验分享,与GSMA Foundry和巴塞罗那超级计算中心合作,推动哈萨克斯坦人工智能领域的国际化发展。
根据此前报道,KAZ-LLM项目于今年年初启动。为支持项目实施,哈萨克斯坦科学和高等教育部推出了总额达39亿坚戈的定向融资计划,并计划今年12月推出首个版本。
背景资料:
关于ISSAI
智能系统与人工智能研究所(ISSAI)成立于2019年9月,旨在推动哈萨克斯坦数字领域的研究与创新。作为国家发展目标的技术支柱,ISSAI积极开展与国内外教育、产业和政府机构的合作,为哈萨克斯坦数字生态系统的建设做出贡献。
关于Beeline Kazakhstan与QazCode
Beeline Kazakhstan是哈萨克斯坦最大的电信运营商之一,为1100万移动用户和200万固定互联网用户提供服务。QazCode是Beeline Kazakhstan的软件开发公司,拥有700名员工,其中包括350名开发人员。
关于VEON
VEON是一家总部位于荷兰阿姆斯特丹的全球领先数字运营商,在六个国家为近1.6亿用户提供服务。
【编译:达娜】