国产大模型，也分「武当」和「少林」

当前位置：首页 > 滚动 > >正文

国产大模型，也分「武当」和「少林」

来源：ZAKER科技时间：2023-07-10 10:34:44

国产大模型，WAIC（世界人工智能大会）来了半壁江山。

这也是 ChatGPT 技惊四座大半年后，30 多个国产大模型第一次在同一个舞台上，接受不同背景参会者的审视。

(资料图片)

能明显感受到，相较于半年前效仿 OpenAI 大炼通用语言模型的热潮，如今 WAIC 呈现出的国产大模型图景，已经大致分为 " 增值派 " 和 " 聚焦派 " 两大路径。

所谓的 " 增值派 "，指的是不仅研发通用大模型基座，还基于基座提供模型 API、算力、训练、部署等配套服务的厂商，典型案例是推出 MaaS（Model as a Service）平台、携 " 通用大模型、行业大模型、云、芯片 " 等全家桶到场的云厂商们。

带着全套模型服务方案入场的大厂们

而 " 聚焦派 " 则恰恰相反，找准少量应用场景深挖，推出垂直领域的大模型，是他们的策略。这些厂商往往是资源能力和服务范围有限的创企，比如聚焦在金融等四个领域的澜舟科技，或者是原有业务的应用场景十分聚焦。

这两天被不少学生和家长围观的网易有道则是后者的典型案例。他们在教育领域推出的 " 子曰 " 大语言模型，参数规模为 200 亿，在一众动辄上千亿的通用大模型中并不算大。

基于网易有道 " 子曰 " 大模型的虚拟人口语教练。

即便派系分化，但对大模型感到 " 脸盲 "，仍是不少观展者给 36 氪的反馈：不同厂商呈现出的大模型能力和服务体系大同小异—— " 增值派 " 厂商将大模型和云、部署等服务打包售卖，" 聚焦派 " 厂商则是两手抓：一边卖行业模型服务，一边卖自身被 AI 升级后的应用。

" 逛了一圈大模型，感觉都差不多，没有留下太深的印象。" 一名 7 月 6 日开幕当天就蹲守在的电器公司销售经理，背着上司 " 改造公司 OA 系统 " 的指标来到 WAIC，但现实与理想仍有差距。

有 ChatGPT 珠玉在前，多数厂商背负了不小压力。即便在部分任务的表现能力能与 GPT-4 掰手腕，但大部分厂商都承认，通用大模型的表现与目前赛道的 " 天花板 "GPT-4，依然存在不小差距。

好与坏，难判断

数十家大模型企业，上百款产品，怎么合作？如何落地？不少参会者迷失在巨大的上海 WAIC 展馆里。

对大模型判断失准，症结首先出在难以统一的模型能力评判标准上。

旷视科技多次在公开采访中表示，会持续在大模型技术方向进行投入。旷视 CTO 唐文斌告诉 36 氪，模型的测评分为学术和业务两个标准，更易证明的是前者，但对落地最有价值的在于后者。

若是让旷视站在客户的角度选模型合作方，一定得在实际业务中长期跑起来后，结合 ROI、效益等指标综合评判，" 应用价值是检验大模型能力的最好标准 "。

" 学术和工程之间隔着鸿沟。" 第四范式联合创始人、首席架构师胡时伟说，模型的算法、参数都是学术 " 肌肉 "，但能不能给客户解决实际问题，需要考验模型厂商本身对具体行业、具体业务的认知。模型的实用价值并非是静态、单维的。

他直言 WAIC 不是一个拉客户的场合：" 这里你怎么在短时间内给客户证明模型的业务价值？"

大模型让人脸盲的另一个现实原因则在于，目前不同厂商的模型能力仍然没有拉开差距，尤其是通用大模型与 GPT-4 存在明显差距。

一个典型的例子是，对于 C 端应用场景明晰且有数据积累的有道而言，在通用大模型的基础上精调是捷径，但有道依然选择了自训 " 子曰 " 大模型的荆棘路。" 国产通用大模型的能力满足不了垂直场景需求 " 就是有道的工作人员给 36 氪列举的其中一个原因。

沿着 Transformer 的训练路径，目前 GPT-4 就是面世模型中的能力天花板，也给国内厂商提供了行之有效的技术路线参考。但在今年 3 月 36 氪的专访中，百度 CEO 李彦宏认为创企做类似 ChatGPT 的大语言模型是 " 重复造轮子 "：" 创业公司重新做一个 ChatGPT 其实没有多大意义。"

" 这个阶段国内大部分厂商只能做重复造轮子的工作。" 面壁智能联合创始人兼 CTO 曾国洋对 36 氪说道，"GPT-4 也被证明与 AGI（通用人工智能）有差距，但国内公司先得追上 GPT-4，才有资格开始造车。"

在他看来，造轮子不等于没意义，而是在模型发展初期需要做的 "Dirty Work"。曾国洋打了个比方，就像学数学，现阶段厂商是洗数据、堆参数、调试代码的小学生，需要打好 10 以内数学运算的基础；等到上了大学，厂商才有可能去碰线性代数、微积分等更高维的东西，跳出造轮子的阶段去做创新。

用 B 端的生意打磨轮子

现阶段，C 端场景的价值并不大——这是不少模型厂商的共识。

真金得用火炼，但不少 C 端场景都不够复杂，对模型能力的打磨效果不显著。" 用模型直接做 toC 应用，满足的基本是生成功能，这是一个交付流程很短的场景。" 商汤的工作人员对 36 氪表示。

再者，即便 C 端能带来大量的用户反馈数据，但企业还需面对 " 多数据、低质量 " 的问题。一名网易有道的工作人员告诉 36 氪，训练 " 子曰 " 最可用的数据来自于试题和标准答案，靠用户反馈的数据依然需要大量的人工清洗和标注。

因此，靠 B 端业务获得营收，并在业务场景中用较高质量数据资源提高工程能力，是不少模型厂商如今的发力点。

极少公开露面的 AI" 当红炸子鸡 "MiniMax，这次特地来为合作方金山办公站了台，顺势推出了自研通用大模型 Abab 的 5.0 版本。这两家公司在今年 5 月携手推出了 " 中国版办公 Copilot" ——自动生成 PPT 大纲和模板、PDF 文档重点提取等热门功能，在 WPS 的展位大屏上循环播放。

WPS AI 的功能。图源：WPS

" 高质量的标注数据，依然是稀缺资源。"MiniMax 技术总监刘启君对 36 氪直言。对 2022 年就储备了一批显卡的 MiniMax 而言，算力还不算卡脖子的问题，但想要让模型能力更上一层，高质量的标注数据必不可少。

为了用最低的成本获取高质量数据，和 B 端的头部厂商合作是 MiniMax 所选的捷径。刘启君分析与 WPS 合作的理由：" 一是 WPS 积累的数据足够高质，可以直接拿来用；二是 WPS 的业务场景涉及图片、文字识别、提取、转换等复杂的场景，可以借此打磨模型能力。"

不过具体到对 B 端场景的选择，" 增值派 " 和 " 聚焦派 " 选择的是截然不同的两条路径。

" 拿着锤子找钉子 "，即场景的横向扩张，多年来是具有丰富客户资源、的 " 增值派 " 大厂的标配。

"（大厂商）最主要的考量是用大模型业务带动大厂的其他业务，比如云、芯片。" 一名参加展会的券商告诉 36 氪。比如，对于 BTA、华为等具有云计算优势的厂商而言，将通用大模型的 API 服务与云计算结合，就能做训练、微调和部署等端到端的好生意。

不过，捆绑销售的策略也意味着 " 增值派 " 的服务对象往往是本身具有雄厚经济实力的政府和国央企——客户只需拿出数据，企业就能提供模型精调、部署等全套服务。36 氪从阿里云工作人员和多个咨询客户的口中了解到，通义千问的私有化部署方案，目前给出的参考价格高达百万、甚至千万元一年。

与之相对的，" 聚焦派 " 则往往从 B 端企业的细分需求切入，除了能在较短时间内创收，也能与相继发布通用模型的 BTA 等云厂商打差异化策略。

比如第四范式和澜舟科技布局的重点，往往都延续了之前就有客户积累和工程经验的 B 端场景。第四范式这次 WAIC 带来了 " 式说 " 大模型的一些行业进展，其中一个行业案例是与一家零售企业的合作，此前，决策类的 AI 技术已经被广泛应用在电子菜单推荐系统的开发，如今基于大模型的生成式 AI，开始逐渐被应用于对门店管理系统的改造。

在谈及周围 " 厂均 " 抛出十多个行业模型方案，胡时伟告诉 36 氪，他并不担心大厂造成的竞争压力，因为先找到钉子比拿着锤子更重要：" 我要再次强调，模型研发和落地之间有鸿沟。"

而企业瞄准 B 端发力的目的，最终是让造轮子和造车两条腿一起走起来。

与大部分厂商一样，MiniMax 仍然有对标 OpenAI 的野心。" 我们只做一个通用大模型基座，不做分开做行业大模型。" 刘启君觉得现阶段 MiniMax 这样资源有限的企业需要集中算力、数据和金钱资源办大事，即提升通用模型的能力。他透露，目前 MiniMax 能够按周迭代模型能力。

7 月 6 日的 WAIC 开幕式上，" 深度学习之父 " 杨立昆重申 "LLM 不会是那条通往人类智能的道路 "。这也让许多厂商尝试跳脱出 Transformer 的框架，去做创新。" 做创新性的研究，包括和学界合作是国内厂商今年开始很重要的命题。" 胡时伟说。

X 关闭

最近更新

国产大模型，也分「武当」和「少林」

2023-07-10 10:34:44

滚动
全国363家铁路直供电厂存煤8076万吨可耗天数30.6天

2023-07-10 10:25:46

滚动
爱无碍向上向善少年的假期从助残开始

2023-07-10 10:02:16

滚动
广州航海学院党委副书记孙光辉接受审查调查

2023-07-10 09:22:44

滚动
俄称摧毁美供乌装备乌称发生多次激战

2023-07-10 09:06:15

滚动
筑牢防汛“安全堤”

2023-07-10 08:03:10

滚动
青海医保局党组书记、局长李永平赴玉树州调研医保经办体系建设工

2023-07-10 07:29:57

滚动
柯城区营商办组织召开营商环境优化提升“一号改革工程”双周工作例会

2023-07-10 05:52:22

滚动
朝阳山站（关于朝阳山站介绍）

2023-07-10 03:11:24

滚动
从老小区的垃圾桶旁，捡到个袋子，里面装有烂包，倒出来一看赚了

2023-07-09 22:51:54

滚动
多地多人确诊如何避免感染猴痘病毒猴痘是什么

2023-07-09 21:59:04

滚动
第三届中国（沈阳）智能网联汽车国际大会闭幕

2023-07-09 20:44:26

滚动
关于汉字特点的古诗哪些体现汉字特点的古诗6首

2023-07-09 19:11:49

滚动
四川新闻联播丨小金：一朵玫瑰花共富千万家

2023-07-09 18:11:46

滚动
ThinkPad X13 13.3英寸笔记本电脑限时特惠

2023-07-09 16:42:51

滚动
环旭电子：6月合并营业收入47.34亿元同比减少17.89%

2023-07-09 15:58:59

滚动
解冬访问安特卫普世界钻石中心，见证上海钻石交易所与比利时钻交所联合会签约

2023-07-09 14:42:39

滚动
桃江成功破获一“帮信”犯罪团伙涉案资金流水2000余万元

2023-07-09 13:01:11

滚动
急救也摆地摊上夜市！东台红会夜间给市民送技能

2023-07-09 12:00:14

滚动
昆明财政收入的负增长：问题的根源

2023-07-09 11:10:28

滚动
重庆市永川区南大街小学数字化背景下教改探索

2023-07-09 10:08:35

滚动
日本市民团体反对核污染水排海：政府的说辞是谎言

2023-07-09 09:11:12

滚动
波波维奇新合同5年超8000万刷新蒙蒂此前6年7850万纪录！

2023-07-09 07:53:46

滚动
“不缺游客缺门票”如何解

2023-07-09 06:49:23

滚动
河南一冰淇淋店突发爆炸，致1死1伤！官方：系冰柜压缩机故障引发

2023-07-09 04:47:01

滚动
NBA：美媒预测排名，掘金不被看好，热火排名提升，湖人下滑明

2023-07-09 01:49:05

滚动
资本论第四卷第一章詹姆斯·斯图亚特爵士区分“让渡利润”和财富的绝对增加

2023-07-08 22:36:42

滚动
美术老师简介排版_美术老师简介

2023-07-08 21:15:45

滚动
强降雨来袭！辽宁省避险转移535人

2023-07-08 19:15:02

滚动
暴雨蓝色预警安徽湖北湖南等局地有大暴雨

2023-07-08 18:21:32

滚动
云南和福建联动讲述一条纬线上的“惊喜”

2023-07-08 17:54:06

滚动
时政现场说丨打造科技创新高地做信息技术的“解锁者”

2023-07-08 17:11:07

滚动
人人讲安全、个个会应急！济南市市中区文景小学举行“安全伴我行”主题升旗礼

2023-07-08 16:11:25

滚动
最新｜“女子上海地铁车厢内宣扬辱华言论”！警方通报

2023-07-08 15:05:28

滚动
证监会：全面优化公募基金费率模式，稳步降低行业综合费率水平

2023-07-08 14:12:57

滚动
荣耀MagicPad曝光：13英寸大屏旗舰

2023-07-08 13:05:45

滚动
陕西：六举措促高校毕业生就业创业

2023-07-08 12:01:00

滚动
艾草的五大用途

2023-07-08 09:18:36

滚动
焦点访谈：“飙车炸街” 伤人害己

2023-07-08 08:48:29

滚动
北京智能网联乘用车“车内无人”商业化试点开启

2023-07-08 07:41:27

滚动
荒野行动攻略_荒野行动新手怎么玩

2023-07-08 06:24:48

滚动
记者：凯恩希望在拜仁赢得欧冠，报价高到一定程度列维肯定会考虑

2023-07-08 04:14:45

滚动
青海天佑德洲际车队再次出征环湖赛七位名将蓄势待发

2023-07-08 02:09:43

滚动
最后的吻别（关于最后的吻别介绍）

2023-07-07 22:45:29

滚动
尘封的铁证｜日本学者发掘史料揭示侵华日军罪行

2023-07-07 21:42:40

滚动
人民论坛网评 | 从“千万工程”中汲取美丽乡村蝶变密码

2023-07-07 21:07:07

滚动
腾讯360大战 360搜狗大战

2023-07-07 20:09:15

滚动
东风汽车：6月汽车销量合计1.32万辆

2023-07-07 19:25:45

滚动
极氪001，定义真正的纯电猎装

2023-07-07 18:52:19

滚动
新机箱来了！Inspire K2 Plus售价396元

2023-07-07 18:13:03

滚动
众安保险600万医疗保险是真的吗？有必要买吗？

2023-07-07 17:40:43

滚动
株洲市渌口区：迎“篮”而上追“球”梦想

2023-07-07 17:10:29

滚动
亳州市谯城区2022年“亩均论英雄”结果公布

2023-07-07 16:58:53

滚动
硫酸锆商品报价动态（2023-07-07）

2023-07-07 16:20:02

滚动
“梅姑娘”今夜带来雷电+暴雨+大风，奉贤周末最高温降至30℃附近

2023-07-07 15:43:29

滚动
2023内蒙古高温补贴能领多少钱 2023年内蒙古高温补贴发放标准是怎样的

2023-07-07 15:08:52

滚动
净化手游礼包码有什么

2023-07-07 14:50:53

滚动
行业白皮书：未来3年中国奥特莱斯行业仍将快速发展

2023-07-07 14:02:29

滚动
预计日本7月至9月季度原钢产量将同比增长2.2%

2023-07-07 13:15:56

滚动
独生子女证有什么补贴和待遇？2023年独生子女领取的金额有多少？

2023-07-07 13:03:07

滚动
交流交流，不是坏事

2023-07-07 11:56:50

滚动
“打防管控”一体化公安机关深入推进网络和数据安全保护工作

2023-07-07 11:49:40

滚动
利用专业优势服务银发生活（推动扩大老年教育资源供给②）

2023-07-07 11:08:45

滚动
每日汇市｜报7.2054！人民币中间价调升44基点本周累计升值204基点

2023-07-07 10:35:26

滚动
云从科技-UW（688327）盘中异动股价振幅达6.82% 上涨7%（07-07）

2023-07-07 10:23:00

滚动
穗莞深城际铁路琶洲支线全线“洞通” 计划9月前通电

2023-07-07 09:58:23

滚动
中国羽毛球协会公示杭州亚运会参赛名单

2023-07-07 09:23:14

滚动
万顺新材(300057.SZ)：纸包装材料业务一季度销量4666吨

2023-07-07 08:52:26

滚动
山东：全年新培育专精特新中小企业1000家以上

2023-07-07 08:17:04

滚动
广西拉响高温蓝色预警开启“暴晒干烤”模式

2023-07-07 07:52:08

滚动
市场宽幅震荡量化指增策略竞争加剧

2023-07-07 06:50:28

滚动
广州白云山医药集团股份有限公司关于全资子公司获得药物临床试验批准通知书的公告

2023-07-07 05:50:19

滚动
公安县公安局“出所必接”照亮戒毒人员回归路

2023-07-07 03:08:42

滚动
国象棋后赛次轮又弈和，雷挺婕：谁赢谁输，冠军都是中国的

2023-07-06 22:56:55

滚动
主流车企签署承诺书：不以非正常价格扰乱市场公平竞争秩序

2023-07-06 21:47:56

滚动
男子酒后丢手机长子民警及时帮找回

2023-07-06 20:55:58

滚动
房企交付报告·企业篇| 中梁控股：上半年交付51400套，多个项目交房即交证

2023-07-06 20:13:10

滚动
翁铁慧会见墨尔本大学校长马斯克尔

2023-07-06 19:43:34

滚动
中原证券：公司高度重视数字化建设，积极提升优质、稳定、高效的线上客户服务水平

2023-07-06 19:04:43

滚动
元江这位校长，把教育当做一件幸福的事来做！

2023-07-06 18:23:37

滚动
2023山东信息职业技术学院中外合作办学学费多少钱一年-各专业收费标准

2023-07-06 17:56:57

滚动
端午档总票房达9.09亿元创历史第二好成绩

2023-07-06 17:08:12

滚动
图片新闻|检察官与学生代表交流法律困惑

2023-07-06 16:52:40

滚动
每日讯息!美国警察将非裔女子按倒在地引众怒民众：厌倦了生活在恐惧中

2023-07-06 16:02:16

滚动
出征世界杯！中国女足23人名单公布，苏州两将入选-热议

2023-07-06 15:58:48

滚动
ndarray的转置(numpy.transpose()与A.T命令对比分析) 全球看热讯

2023-07-06 15:12:20

滚动
全球今日讯！艾可蓝7月6日盘中跌幅达5%

2023-07-06 14:42:30

滚动
“三期叠加” 旅游安全防线要筑牢|世界热头条

2023-07-06 14:04:31

滚动
中国基建“下半场”：要“硬”和“快”，更要“新”和“软”

2023-07-06 13:45:52

滚动
雅艺科技(301113.SZ)：拟以1020万元参投金华御道数维创投

2023-07-06 13:06:19

滚动
目标2000亿元！北京重磅发布！焦点热门

2023-07-06 12:30:42

滚动
中国式现代化100问丨第21问（视频）：如何实现人的现代化？

2023-07-06 11:43:35

滚动
世界热点！夏季梅江车展将开幕这些停车场可以停车

2023-07-06 11:07:06

滚动
重点聚焦!高顿教育：acca是全英文考试吗？难度怎么样？

2023-07-06 11:03:54

滚动
震撼富豪圈！家族后代那么多，香港首富却选她做接班人？

2023-07-06 11:07:29

滚动
翔鹭钨业：公司矿产未涉及镓、锗金属|要闻

2023-07-06 10:56:46

滚动
德昌股份：公司汽车零部件产品覆盖汽车EPS电机、制动电机，目前未涉足无人驾驶技术及相关业务_速递

2023-07-06 10:22:28

滚动
茅台酒瓶盖可以放微波炉加热吗茅台酒瓶盖可以放微波炉加热吗多少度

2023-07-06 08:35:07

滚动
广东开展医保领域打击欺诈骗保专项整治

2023-07-06 07:41:17

滚动
煎灌肠的做法与配料（煎灌肠的做法）

2023-07-06 06:37:22

滚动

国产大模型，也分「武当」和「少林」

推荐内容

最近更新