科大讯飞发布“星火”大模型 刘庆峰:升级计划将不受算力限制
5月6日,科大讯飞发布了认知大模型“星火”。科大讯飞董事长刘庆峰在发布会上表示,认知大模型正在成为通用人工智能(AGI)的“曙光”。
他在接受媒体采访时告诉第一财经记者:“我们在未来几个月还有明确的升级计划,我可以明确地说,下一阶段的升级计划将不会受到算力的限制。”
实现接近chatGPT的效果
【资料图】
算力是大模型的基础。值得关注的是,此次科大讯飞发布的“星火”大模型是基于昇腾AI打造的,科大讯飞还与华为共同启动了“星火昇腾”联合生态,完善算力生态体系的建设。
刘庆峰对第一财经记者表示:“我们与华为、曙光等国产平台,在算力和操作系统方面都有系统性的对接。中美在算力方面的差距是一个事实,但是我们已经在研究如何在算力落后一代的情况下,如何把大模型的算法做得更好,实现相对接近的效果。”
刘庆峰表示,未来大模型的发展方向将不是增加更大的算力和更大的模型,而是把各个子模型联动起来。
他说道:“虽然我们与ChatGPT相比还有细微的差距,但星火大模型的目标是中文方面能够超越ChatGPT,英文水平可以与ChatGPT相当。”
刘庆峰今年3月在全国两会上建议,应加大力度投资建设公共算力平台,并设立使用平台的揭榜挂帅机制,让更多科研院所和科技创业企业也有机会站到国家公共算力平台上进行模型训练和算法创新;构建国家数据资源平台,汇聚认知智能大模型所需要的基础性数据,搭建数据共享使用机制,支持战略科技力量站在国家数据资源平台上加速认知大模型的研发和进化。
在5月6日发布会上的现场演示中,星火大模型已经能够完成欢迎稿撰写、故事创作等多风格多任务长文本生成,
星火大模型现场解答了泛领域的知识,并展示了多题型步骤级数学能力、多功能多语言代码能力和多模态输入和表达能力。
复现OpenAI的“智慧涌现”
刘庆峰在发布会上表示,在人工智能的重大科技革命浪潮下,认知大模型的“智慧涌现”将带来解决人类刚需的新机遇。“我们相信完全可以复现OpenAI的智慧涌现,中国将成为智慧涌现的第二极。”他表示。
他强调,通用模型要用来解决社会刚需,而不是宣传。“为此,我们需要建立一套科学系统的评测体系。”刘庆峰在发布会上说道,“我们已经建立了7个维度的评价体系。”
星火认知大模型的能力包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面。刘庆峰表示,科学的评测体系是我国大模型快速追赶并有望超越OpenAI的前提。
值得关注的是,科大讯飞没有在发布会上推出备受期待的医疗大模型。对此,刘庆峰表示:“医疗专业领域的模型因为需要相关法规,所以我们应更加谨慎。下一步我们会跟医疗机构合作后,把医疗专业知识放在通用大模型当中。”
他还透露,科大讯飞将会在今年的1024开发者大会上正式对外发布医疗大模型。
过去的一个多月,包括百度、阿里巴巴、商汤在内的中国互联网科技公司都发布了自己的大模型。刘庆峰在接受媒体采访时表示:“我们并不觉得自己发布的时间晚了,我们的自然语言和文本的理解能力要显著优于同行。”
今年以来,科大讯飞股价累计涨幅已经超过70%,市值约1350亿元人民币。
与其他公司的商业模式有所不同,科大讯飞拥有学习机、智慧办公设备、讯飞听见、智慧座舱等众多终端产品,从而能够使得这些大模型更容易落地,并让终端消费者有直接受益。
刘庆峰在发布会上介绍称,科大讯飞已经在讯飞学习机以及办公设备中融入了“星火”大模型的部分功能。
(文章来源:第一财经)
标签: