新潮
星火开源-13B正式发布 深度适配国产算力
共享源代码、开发出更好的软件,是广大开发者、高校、企业自主研发热衷于开源的关键原因,也是共建第一开发者生态的重要途径。会上,首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B正式发布。
本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实用性大幅提升,在处理复杂的自然语言任务时更加得心应手。
基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化,训练效率达A100的 90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
开源只有更多的场景落地,才能更好地增进生态合作。目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。
本文经授权后发布,本文观点不代表立场