2023年5月19号,又一个大语言模型横空出世,名号BloomChat。这个模型值得我们给与特别关注。主要原因如下:
GPT 3 规模不小:这个模型的参数规模与相当,有1760亿参数(比GPT 3多十个亿)。
中文支持:测试的结果表明,这个模型较好地支持多种语言,其中包括中文。80%的中文响应被各语种的测试人员认为是“正确”或“可接受”。
性能不错:与GPT 4有一定的可比性。在比拼测试中,BloomChat和GPT 4响应的用户喜好度为45比55。BloomChat虽略逊一筹,但已是相当能打了。
开源免费:BloomChat 模型基于阿帕奇2.0协议可免费商用,相对于目前其它开源却不能商用的大模型如LLaMA和ChatGLM等,开源得比较彻底。而OpenAI和谷歌等大模型,则是闭源的。这一点对于重视数据隐私和应用成本的组织而言,其意义不言而喻。
彻底透明:BloomChat微调的程序和数据也是开源的。这进一步解决了企业客户在模型数据“透明”性方面的顾虑。
BloomChat背后的基础大模型Bloom的背景也很有意思。它是由来自60 个国家和 250多个机构的1000 多名研究人员组成Big Science Project,在 28 petaflops 的法国巴黎超级计算机Jean Zay (IDRIS) 上共同创建。
微调BloomChat模型的主要贡献者有两个,一个是SambaNova Systems公司。另外一个,正是我们上周介绍的令人印象深刻的Together公司。
最后,BloomChat可以在线体验,网址是:
https://huggingface.co/spaces/sambanovasystems/BLOOMChat
BloomChat是否真正能够一战,大家可以亲自试试。
主要参考资料
BLOOMChat: a New Open Multilingual Chat LLM
BloomChat – a Hugging Face Space by sambanovasystems
Big Science - A one-year-long research workshop on large multilingual models and datasets