强强联合背后，国产大模型迎来“WIntel时刻”？-潮起网

强强联合背后，国产大模型迎来“WIntel时刻”？

配图来自Canva可画

在ChatGPT持续引爆行业通用大模型之后，国内诸多互联网巨头、AI企业，也都选择纷纷跟进，参与到国产通用大模型的角力之中。值得注意的是，与上半年“热闹非凡”的行业境遇不同，具备实力且具备满腔“产业抱负”的巨头玩家，正在为大模型的大规模落地创造机会。

其中，以科大讯飞为代表的科技公司，正在积极与包括华为等在内的国内合作伙伴一起通力合作，为构建人工智能时代的中国“Wintel联盟”做准备。而随着越来越多的实力型玩家大踏步入场，“大模型+”的应用拐点正在加速到来。

大模型迈入产业“落地”加速期

从国内大模型的发展状况来看，随着各路技术企业的纷纷参与，无论是通用大模型还是垂直行业大模型，国内企业均有涉足。一波接一波的行业浪潮席卷而来，正在推动整个“大模型+”应用时代的来临。

首先，大模型不再局限于聊天、答题、内容生产等C端应用，而是转向更偏重实体领域的B端应用，以“实用”为导向的大模型日渐成为行业趋势。

在上半年的持续“爆火”之后，进入下半年大模型的风向明显变了。市面上越来越多的“面向B端”的应用开始出现，这种“实用主义”的风向，大大加速了生成式AI产业化的进程。从上半年以来，陆续有京东、携程、网易有道、用友等不同领域的巨头，发布相关的行业大模型应用，包括腾讯、华为等在内的巨头，也将“实用”作为大模型应用的重点，推动大模型渗入产业实体之中。

其次，具备通用能力的大型企业，正在加强与各行业大模型企业的合作，新的大模型生产机制正在成型。

目前来说，业内通用的做法是，通过开放自身的大模型能力，为行业大模型开发提供必要条件。比如，讯飞星火大模型采用了“1+N”的整体布局，即借助讯飞星火大模型平台的7大通用能力，将其文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等赋能给其他行业场景，形成在教育、医疗、汽车、法律等诸多领域的行业大模型应用的生产机制。依托这种生产机制，各行业的大模型厂商，都不再需要“重复造轮子”，只需要专注应用开发，即可推动行业的大模型场景落地，这些条件的具备，为大规模的大模型场景落地奠定了很好的基础。

“实用”大模型并非一蹴而就

如前文所述，随着国内大模型逐步深入产业，以及通用大模型厂商逐步对外开放自身能力，“实用”大模型的难度已经大大降低，但这并不意味着做“实用”大模型可以一蹴而就，甚至可以说与之恰恰相反。

其一，“实用”的大模型，通常需要企业具备很深厚的行业经验和专业数据积累，以确保数据的精准性和专业性，而这通常需要大模型企业对行业有很深的了解。就拿本次1024开发者节上科大讯飞发布的智能编程助手iFlyCode2.0来说，其自发布以来就持续升级，目前已成为行业重要的提效工具（内测数据，在编程的设计阶段提效50%、编码阶段提效37%、测试阶段提效44%）。然而，这样的能力很多企业并不具备，就如同射箭比赛，它们可能还不具备“画靶子”的能力。

以教育行业为例，大模型中关于“小学生英语学习”的版块，首先需要了解小学英语的学习目标，还要定义小学生英语学习的范围，不能超纲（比如词汇量范围、语句类型、语句长度等等），并要找到适合孩子学习习惯和学习阶段的方法——这些标准，都要先定义，这就是“画靶子的能力”。相比之下，从2004年至今，科大讯飞已经在智慧教育领域深耕19年了，多年来其深度参与了中国的教育信息化整个进程，从中小学到高等教育，从教学过程到教学结果诸多场景，系统积累了诸多从0到1的关键性技术，这使其积累了其他厂商难以企及的专业经验和专业数据，而这正是其他厂商短时间难以企及的。

在本次发布会上，搭载了星火大模型V3.0 讯飞AI学习机再度升级，首次发布启发互动式英语AI答疑辅学功能，实现个性化解决、启发引导式提问、互动探究式学习。同时，基于讯飞星火打造的AI心理伙伴正式发布，它具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力，全方位呵护孩子的心理健康。

实际上，科大讯飞在细分行业领域积累的经验不仅限于教育，包括医疗、智慧城市、金融、法律、工业等诸多领域，科大讯飞也均有丰富的经验，而这正是其可以面向诸多垂直行业推出“大模型+”的底气所在。比如，在此次科大讯飞1024开发者节上，科大讯飞推出了医疗大模型和讯飞晓医APP，为每个家庭提供健康助手，正是基于科大讯飞在智慧医疗行业的多年积累，科大讯飞的智医助理在2017年就以456分（合格线360分）通过了国家临床执业医师资格考试，目前已覆盖426个覆盖区县，累计辅助诊断次数6.9亿次。

此外，为了进一步加速大模型行业落地，科大讯飞联合行业龙头共同发布12个行业大模型，包含金融、汽车、运营商、工业、住建、物业、法律等行业，加速产业升级。

其二，行业大模型本身的门槛，使得它对大模型企业提出了很高的战略要求。从大模型技术密集、资金密集、技术迭代快的特点来看，任何不具备超强研发实力的企业，都很难经得起市场的考验。但从国内人工智能行业发展现状来看，目前我国“人工智能+行业”的投入最多不过10来年时间，专业的人工智能人才成长起来，则至少需要5年以上的技术和行业经验，但当下很多行业内的人员，远远达不到这一水平。而作为国内最早做人工智能的科技企业，讯飞在该领域深耕已经25年了，人才基础好、团队信任度高，高中腰部人才梯队完备，这使其具备很强的研发实力，因而在大模型上它更够实现有效转化，对市场风向的预测也更加精准，更容易推陈出新、加速技术迭代。

其三，大模型本身的复杂性，使得大模型的落地并不能仅仅依靠一家企业的能力，而是需要有号召力的科技巨头来发挥牵引作用，推动整个产业生态的完善和壮大。作为一家有影响力的技术巨头，科大讯飞具备强大的产业协作能力，这是其能够实现技术成果“井喷”的重要因素。

比如，在本次科大讯飞1024开发者节上，其不仅展示了为数众多的各种大模型产品，还展示了庞大的产业生态，这里汇集了几十种展品，更有搭载星火认知大模型的开放平台，联合550多万开发者，共同打造技术、场景、服务多元赋能的共创共荣的AI生态。也正是基于以上诸多优势，科大讯飞才能够在推动大模型落地行业方面先人一步。

抢占算力制高点已成破局关键

从行业来看，大模型的复杂性要求厂商必须做到“十项全能”，算力、算法、数据、资金、人才，团队都必须足够优秀，缺一个都不行，可见AI大模型本质上是一场赢家通吃的游戏。而在诸多因素之中，抢占高性能算力，已经成为当下国产厂商突破技术瓶颈的核心关键。

一方面，是中国AI算力需求呈现出高速增长的态势。另一方面，随着国内大模型的蓬勃发展，支撑AI核心算力的高性能算力面临短缺，算力吃紧的局面日益凸显。硬件层面，由于国内高端GPU芯片的缺乏，使得国外发布的高性能算力芯片一经发布就遭到了哄抢，产品价格也水涨船高，还时刻面临“缺货”的风险。软件层面，AI时代大量使用的张量计算也跟传统计算机时代的方式不同，AI算力需求的迅速增长，要求国产大模型厂商不仅要注重算力芯片的硬件建设，还需要注重基础软件的创新。也就是说，想要做好大模型训练，不仅要做到硬件层面的更新换代，还需要软件层面的持续创新。

目前来看，想要发展大模型要么发力自研，要么高价购买外国芯片承担风险，而科大讯飞选择了第三条路，与华为展开合作，共同致力于国产AI大模型的自主创新。作为当前国产自主算力的代表作之一，华为昇腾平台凭借华为自研的达芬奇架构技术，实现了业界最佳性能与能效，支持云边端全栈全场景应用。目前华为昇腾的AI集群已经全面升级，已经从最初的4000卡集群扩展到16000卡集群，是业界首个万卡集群，拥有更快的训练速度和30天以上的稳定训练周期。

早在今年7月份，就有报道介绍，在充分利用昇腾这样的国产化算力平台基础上，讯飞搭建了自研的火石平台。该平台突破了大模型数据的系数化，低精度的量化以及高效适配等问题，加速了AI大模型的落地。同时讯飞星火也实现了训练和数据闭环的全流程设计，大模型训练和推理的一体化设计等等创新工作。在10月24日的开发者节上，科大讯飞更是宣布将联合昇腾AI打造算力底座“飞星一号”，进一步将双方的合作提升到一个新的高度。

自主算力和自研平台的结合，对于国产大模型来说有着深远的意义。

据预计，借助双方不断升级的算力基础设施，科大讯飞将参与到更大规模的参数训练之中去，为赶上乃至超越GPT-4奠定基础。同时，借助高效、稳定、安全可控的国产算力基础设施，更多普惠行业的国产AI应用成果或将迎来“大爆发”。比如，在本次开发者节上，科大讯飞就展示了包含金融、汽车、运营商、工业、住建、物业、法律等诸多行业大模型，这些技术成果的集中涌现，充分说明了底层原生技术的重要性。

国产AI大模型“Wintel时刻”已至

从业内来看，目前业界对于大模型落地的探索，已经初步分化出了不同的路线。具体可分为三种类型：第一种是按照使用量收费模式，就是通过AI公司研发大模型并对外提供应用产品或API；第二种是谷歌模式，即从底层TPU芯片，到云基础设施再到大模型产品全部自研；第三种则是“OpenAI+微软”模式，双方各自发挥自身的优势相互配合，共同助力大模型产业的发展，有点类似PC时代的“Wintel联盟”，这和科大讯飞与华为的合作有异曲同工之妙。

作为个人计算机历史上的一大里程碑，Wintel联盟无疑是史上最成功的产业联盟之一，其成功之处在于，通过将微软Windows操作系统和英特尔硬件融合，使之达到了三个方面的效果：第一，软硬件的兼容性，极大地降低了产业成本提高了行业效率；第二，微软的软件和英特尔的硬件相互配合、优势互补，各自将自身优势发挥到最大；第三，软硬件相互推动，加速产业迭代和创新。比如，微软软件的创新，会推动英特尔加速硬件的性能提升；而英特尔硬件性能的提升，也会加速微软软件的迭代，由此形成不断强化的产业飞轮，同时成就了微软和英特尔两大PC霸主。

如今，同样的事情也在人工智能领域开始上演了。比如，全球云巨头亚马逊就与HuggingFace等开源新势力展开了合作，大数据巨头Databricks豪掷13亿美元收购大模型初创公司MosaicML，微软和OpenAI的合作等都是这一思路的延伸。

而从目前国内大模型企业的发展情况来看，围绕做产业生态的思路，已经有越来越多的产业联盟开始在大模型领域渐次铺开，科大讯飞与华为的牵手，无疑是一个很好的行业示范。作为整个产业链、生态链中的核心企业，它们的牵手可以起到“牵一发而动全身”的作用，带动整个产业生态迅速完善起来，从而为更高质量的大模型发展铺平道路。

科大讯飞董事长刘庆峰在1024开发者节的主论坛演讲中说，2014年上半年，讯飞星火将对标ChatGPT4：“这绝不仅仅是一个简单的技术对标问题，我们要走出自己的技术路线，走出自己的产业方向，形成自己完整的生态。从这个角度来说，大模型时代的序幕才刚刚拉开！”

相信随着更多产业生态的建立和完善，国产AI大模型或将迎来属于自己的“Wintel时刻”，届时作为核心企业的科大讯飞，也将受益于整个产业的进步构建起更强大的生态壁垒。

本文经授权后发布，本文观点不代表立场

强强联合背后，国产大模型迎来“WIntel时刻”？

相关内容

热门文章

标签TAG

#中国

#科技

#公司

#2022年

#AI

#ChatGPT

#汽车

#融资

#市场

#上市

#股份

#银行

#IPO

#苹果

#板块

#发布

#2023年

#集团

#海外

#特斯

#2023