BloomChat:特别关注

文摘   科技   2023-05-30 00:36   美国  

2023519号,又一个大语言模型横空出世,名号BloomChat。这个模型值得我们给与特别关注。主要原因如下:

    • 规模不小:这个模型的参数规模与GPT 3相当,有1760亿参数(比GPT 3多十个亿)。

    • 中文支持:测试的结果表明,这个模型较好地支持多种语言,其中包括中文。80%的中文响应被各语种的测试人员认为是“正确”或“可接受”。

    • 性能不错:GPT 4有一定的可比性。在比拼测试中,BloomChatGPT 4响应的用户喜好度为4555BloomChat虽略逊一筹,但已是相当能打了。

    • 开源免费:BloomChat 模型基于阿帕奇2.0协议可免费商用,相对于目前其它开源却不能商用的大模型如LLaMAChatGLM等,开源得比较彻底。而OpenAI和谷歌等大模型,则是闭源的。这一点对于重视数据隐私和应用成本的组织而言,其意义不言而喻。

    • 彻底透明:BloomChat微调的程序和数据也是开源的。这进一步解决了企业客户在模型数据“透明”性方面的顾虑。

    • BloomChat背后的基础大模型Bloom的背景也很有意思。它是由来自60 个国家和 250多个机构的1000 多名研究人员组成Big Science Project,在 28 petaflops 的法国巴黎超级计算机Jean Zay (IDRIS) 上共同创建。

    • 微调BloomChat模型的主要贡献者有两个,一个是SambaNova Systems公司。另外一个,正是我们上周介绍的令人印象深刻的Together公司

最后,BloomChat可以在线体验,网址是:

https://huggingface.co/spaces/sambanovasystems/BLOOMChat

BloomChat是否真正能够一战,大家可以亲自试试。

主要参考资料

  • BLOOMChat: a New Open Multilingual Chat LLM

  • BloomChat – a Hugging Face Space by sambanovasystems

  • Big Science - A one-year-long research workshop on large multilingual models and datasets

睿类文特
岂能尽得真实,但求更明道理。为睿智的您综合和深入地解读人工智能、互联网和IT领域的事儿,成为您与科技最前沿之间的桥梁。