国内大模型在局部能力上已超ChatGPT?
2023-08-07 18:38:07 来源:钛媒体APP

从GPT3.5彻底出圈后,大模型的影响力开始蜚声国际。一段时间内,国内科技公司可谓被ChatGPT按在地上打,毫无还手之力。

彼时,很多企业还不知大模型为何物,GPT3.5就已够生成诸如营销文案、小说、诗歌等高质量的中文文本。一时间,买课小贩、租号中间商和套壳开发者大行其道。

现如今,在国内厂商严肃对待OpenAI后,情况发生了变化。


(资料图)

在公开资料中,就有360、复旦大学、科大讯飞等企业表达了在中文能力上超越ChatGPT的消息。现在,时间进入2023年8月份,号称超越国外竞品的公司变得越来越多。

01中文模型进击:ChatGPT“不香”了

客观地说,在GPT-3推出后,OpenAI曾经在中文文本输出中占得先机。其一经推出,便可覆盖诸如营销文案、小说和诗歌等领域的文生文需求。几个月前,这种先手优势养活了国内一众卖课达人、租号团队以及套壳聊天机器人产品。

不过,很快,这些功能便被国内众多厂商超越,变成了大模型的“标配”功能。

根据第三方监测机构SimilarWeb的数据显示,ChatGPT从4月开始就呈现出了明显放缓的趋势。以至于在2023年的第二季度,人们的朋友圈内几乎没有了OpenAI的踪影。在科技圈,这被归结为竞争对手大批量涌入、垂直模型兴起和新技术迭代所导致。

8月初,中文大模型的“千模大战”已进入白热化阶段。以数科星球团队所掌握的信息来看,越来越多的企业开始关注下沉市场、并致力于推进具体行业和大模型产品的结合。

这种趋势的结果是,可能会有更多的企业和机构选择使用本土产品,同时也对国外模型的市场份额造成一定影响。在数科星球团队体验二十余款中文大模型后,所得到的观感和上述言论趋同:即中文大模型正在变得越来越好用,并变得越来越聪明。

更为关键的是,政策层面对国内产品的扶植力度正在加强,而出于安全和自主可控等因素,ChatGPT的“没落”(至少在国内)似乎已成板上钉钉。

但国内厂商的野心还远不止“内卷”国内市场——一些公司已然将目光瞄准了海外。

科大讯飞董事长刘庆峰此前表示,其星火大模型中文已超越ChatGPT,在英文中也已接近,虽还有细微差别,但目前在进一步优化中。

02中文大模型变聪明的背后

为了探求国内中文大模型的发展情况,在过去的几个月中,数科星球团队与几十家公司进行了百余次沟通。结果是,科技圈的大佬和创业新星们对待OpenAI的态度严肃且认真。

除了在产品上进行了洗心革面式的改进,还对模型的评价体系进行了优化。

为了弥补中文大模型在评测领域的缺失,日前由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集于不久前推出,该评测名为C-Eval,受到了行业内的广泛关注。

在一些专业人士看来,此评测的初衷是用“锱铢必较”的方式找出中文大模型的比较优势。和以往由第三方咨询公司所主导的、带有倾向性甚至定制化的行业评比所不同的是,无论在过程和结果上,C-Eval更加透明和公开。

据了解,全套测验包含13948道多项选择题,涵盖52个不同学科和四个难度级别。其中前四名包括为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat,APUS的AiLMe-100Bv1。

对比由微软亚洲研究院(Microsoft Research Asia)开发的基准测试AGIEval,C-Eval覆盖的领域更广。APUS技术专家张旭称:“AGIEval只覆盖了中国高考题、公务员考试题等几个类别,而C-Eval覆盖了注册电气工程师、注册计量师……等领域”,覆盖范围的拓宽意味着,除高考、公务员考试等场景外,在其他特定职业领域也可以测定大模型的能力。

从另一个角度说,C-Eval是一个对大模型从人文到社科到理工多个大类的综合知识能力进行测评的竞赛。通常,高阶难度测试是考验大模型性能的关键动作,面对复杂且有挑战性的任务,大多大模型性能会大幅下降。在C-Eval公布的评比结果中,APUS的AiLMe-100Bv1除了在平均分上进入四强,还在难题处理方面超越GPT-4*,排名第一。

据悉,C-Eval Hard(难题)类别是首个提供中文复杂推理能力的测试,“即便是GPT-4来做这个题也会很吃力,”张旭提及,“这是‘闭卷考试’,而以往如AGIEval和MMLU是‘开卷考试’,也就是说,AGIEval和MMLU是各公司自己测试、自己打分、自己公布成绩,而C-Eval Hard的评比显然更加客观、可信。”

的确,C-Eval测评难度比其他测评更高且更严格。在打分流程上,C-Eval更像是学校中为学生准备的大考模式,各个公司参加统一考试并由系统自动打分、C-Eval团队人工审核成绩并公布,所以,就结果上看,其测评所公布的成绩真实性更高。

03国内大模型的未来

放眼行业,大模型对于国内人工智能产业的意义非凡。

在NLP行业出现范式变革后,Transformer为主导的新一代通用大模型产品大行其道,让人们看到了AGI的曙光。甚至可以说,中国版的ChatGPT3.5/4.0的问世是我国正式迈向人工智能时代的重要标志。

在过去,一、二级资本市场对国内大模型产业意见颇多。讨论最多的是,国内公司没有在前沿技术投入太多,反而将精力侧重于“蹭”数字人、AIGC等概念之上。

客观地说,上述评价不无道理,其中不乏因大环境不好,企业对前沿投入审慎和相关技术积累薄弱等问题所导致。

但近期,随着数科星球(ID:digital-planet)对大模型行业认识的深入,以上问题正在得到改变:首先,以智源研究院、百度文心一言、商汤和APUS等企业的持续投入,我国已有多家企业具备大模型制作和运营能力(此前大多为小模型);其次,随着上半年密集的模型发布大会逐渐落幕,新模型开始迭代积累,并向着ChatGPT能力靠拢。

在我们所知的大模型产业上下游企业中,针对数据处理、清洗、标注、模型训练、推理加速等方面的技术也正在加速追赶之中;最后,政策层面已注意到发展大模型和ChatGPT的必要性,开始着手调集更多资源应对,相关生态和创新土壤也正在完备的过程中。

可以肯定的是,本次人工智能革命的核心就是通用大模型。目前,我国众多企业正在加速追赶。

现在,超越ChatGPT已成为国内AI从业者们心中的图腾。想必若假以时日,这个目标将有机会实现。而到那时,一个属于人工智能时代的大幕才彻底拉开。

国内大模型在局部能力上已超ChatGPT?

2023-08-07

「酱酒+时尚」肆拾玖坊跨界秀破圈刷屏、惊艳亮相!

2023-08-07

老楼加梯遇难题,“一墙之隔”伸出援手

2023-08-07

个人养老金账户有必要开通吗 如果不需要是否可以注销

2023-08-07

冰山冷热(000530.SZ):在CCUS、储能热管理等细分市场快速拓展

2023-08-07

美国科学家重现“核聚变点火”突破

2023-08-07

机械恐龙大战怎么下载_机械恐龙大战怎么下载安装

2023-08-07

windows6下载(windows6 1 kb3170455 x64)

2023-08-07

反腐风暴来袭 医药代表“人心惶惶”!恒瑞医药再回应:没有网传情形 经营管理正常

2023-08-07

皖西学院大学生在广德市东亭乡开展社会实践

2023-08-07

外联部是干什么的?(外联部)

2023-08-07

河南:2023年普通高招本科二批录取工作结束

2023-08-07

传媒板块拉升走强,中原传媒2连板,上海电影涨停

2023-08-07

刷屏!TFBOYS演唱会“吸金力”十足,这些平台是大赢家?

2023-08-07

山西交城发生重大刑事案件 警方悬赏5万缉凶

2023-08-07

广西龙州食用菌产业拓宽乡村振兴路

2023-08-07

又一医学院计划更名大学,已完成最新评估

2023-08-07

大运会赛场内外收获多

2023-08-07

宝鹰股份被深圳证监局采取行政监管措施,因财务数据不准确

2023-08-07

IDC:第二季度平板电脑市场下滑,苹果 iPad 出货 1050 万台同比下降 16.8%

2023-08-07

中融新大负债488.15亿元被重整

2023-08-07

风吹草低见牛羊 台胞游敕勒川草原

2023-08-07

病字头的字有哪些跟气有关_病字头的字有哪些

2023-08-06

智造基地一天可满足千万人日饮奶需求!奶业龙头加速数智化升级

2023-08-06

3位年轻人20万开汉堡店日营业额仅为79元当事人:很想落泪 具体是什么情况?

2023-08-06

浙江美大最新公告:股东解除质押1038万股

2023-08-06

东阿阿胶:上半年净利5.31亿元 同比增72.29%

2023-08-06

依顿电子:上半年净利1.85亿元 同比增50.18%

2023-08-06

电影《孤注一掷》点映及预售票房破3亿元

2023-08-06

小米迷你路由器 迷你路由器

2023-08-06

阳澄湖大闸蟹怎么做好吃又简单(阳澄湖大闸蟹怎么做)

2023-08-06

促进交流 书写友谊(大运观澜)

2023-08-06

涿州西杨和庄 被水淹了没 涿州华阳路洪水退去 拖走百辆水淹车 基本情况讲解

2023-08-06

科创100指数将至!“科技赛道”再获新抓手 复盘年内科创牛股 这些板块频出“翻倍牛”

2023-08-06

早安四川丨风华正茂

2023-08-06

天津滨海新区可提供爱普生多功能一体机维修服务地址在哪

2023-08-06

不得囤积居奇 不得串通涨价 市场监管总局发布汛期“七不得”

2023-08-06

良好的饮食习惯(关于良好的饮食习惯的基本详情介绍)

2023-08-06

安人军(关于安人军简述)

2023-08-06

泰州工业企业高质量发展大讲堂 在扬子江药业集团开讲

2023-08-05

每天都能逛 暑期延长看!全国多家文博场馆调整开放时间

2023-08-05

华金证券:给予禾望电气买入评级

2023-08-05

来武汉,要趁热!

2023-08-05

K396三天三夜脱险纪实

2023-08-05

庄世平捐款2000多亿 小杨哥回应捐款2000万为抵税 基本情况讲解

2023-08-05

晶核coa怎么和好友单挑 晶核coa和好友单挑方法

2023-08-05

WNBA前瞻:倒数第一VS倒数第三 水星核心复出力争两连胜

2023-08-05

2023年化学材料相关上市公司一览(8月5日)

2023-08-05

游山玩水!烧烤露营!黄埔「小众出行地」推荐

2023-08-05

2023年8月票房破10亿

2023-08-05

法律允许夫妻一方处分共有财产吗

2023-08-05

人从众!风雨中无言的感动

2023-08-05

飞信是什么软件_飞信是什么

2023-08-05

开封河大附中高中录取分数线2023(开封河大附中)

2023-08-05

广州协和中学高中部地址在哪里(广州协和中学高中部地址在哪里呀)

2023-08-05

青衣江水业公司(青衣江水系地图)

2023-08-05

应急管理部:7月全国洪涝和地质灾害造成142人死亡失踪

2023-08-05

湘伴|一场座谈会,何以唤起天下湘商赤子心

2023-08-04

众志成城,全力以赴

2023-08-04

FM:埃因霍温正在与沃尔夫斯堡就中场弗兰克斯进行...

2023-08-04

菲律宾7月通胀率降至4.7% 连续第六个月放缓

2023-08-04

金融纵览|银行业周报(7.28—8.4)

2023-08-04

东营旅游攻略最佳时间 家门口旅游攻略已生成

2023-08-04

《原神》3.8版风主武器圣遗物推荐 需要哪些武器圣遗物?

2023-08-04

36句清扬婉约的古诗词,柔美动人,格调优美,值得抄录收藏!|古诗词|周邦彦|抄录|晏几道|晏殊|柳永|欧阳修|玉楼春|相思|辛弃疾

2023-08-04

红糖南瓜糯米饭(南瓜糯米饭)

2023-08-04

老夫子戴着假发是许嵩的什么歌_老夫子戴着假发

2023-08-04

2023.8.4铁矿石 | I2309核心观点

2023-08-04

不合格!这些敷贴类产品被国家药监局通报

2023-08-04

从哪些方面评价广告效果?评价广告效果的三个层级

2023-08-04

“中国天眼”有了“刷锅”机器人

2023-08-04

人民银行邹澜:延续实施普惠小微贷款支持工具至2024年末

2023-08-04

对什么的熊出没片尾,我要制作!

2023-08-04

长宁这个暑托班为云南省金平县偏远山区的孩子们捐书

2023-08-04

道森股份: 目前洪田科技公司已获得真空磁控溅射蒸发一体机订单

2023-08-04

什么是公开征集上市公司股东权利?

2023-08-04

便宜还是贵?苹果“全家桶”价格大曝光

2023-08-04

河南省饭冲上热搜!“豆角焖面”申请出战

2023-08-04

2023年二季度中国保险消费者信心指数为67.7 同比上升1.2

2023-08-04

比亚迪降价了 护卫舰07限时促销:88元抵8888元

2023-08-04

金健米业(600127)8月3日主力资金净卖出1221.20万元

2023-08-04

持续干旱叠加过度开发 西班牙土地荒漠化加剧

2023-08-04

碧桂园服务高开涨9%,拟于公开市场购回股份

2023-08-04

小缸和阿灿老张是谁 老张是谁

2023-08-03

psp550游戏玩不了_psp5 50

2023-08-03

晚间公告全知道:海象新材全资子公司越南海欣决定自8月4日起大幅减产,华虹公司股票将于8月7日在科创板上市,发行价为52元/股

2023-08-03

五星体育:中国女足已经启程回国,当地球迷在机场热情相送

2023-08-03

她本可以成为荒天帝的女人,却因家族成为彼此路人!

2023-08-03

地月系直径有多少光年 地月系

2023-08-03

老鹰捉小鸡游戏(关于老鹰捉小鸡游戏的基本详情介绍)

2023-08-03

金十期货8月3日讯,今日棕榈油进口利润为-605.65元/吨,较上个交易日减少123.73元/吨。(理论上而言,进口利润分析逻辑

2023-08-03

封面评论|文旅局长类短视频趋冷,停更止损何尝不可?

2023-08-03

上半年全国消协组织受理投诉超61万件

2023-08-03

未成年诈骗他人多少金额犯法

2023-08-03

八月雨热均沾,继续接受“烤验” 未来三天全省以晴天为主

2023-08-03

港股中资券商股午后持续走强 国联证券涨超13%

2023-08-03

“亚洲一家”共创未来 杭州亚运会推广歌曲《同爱同在》MV发布

2023-08-03

谁在豪掷上亿资金投资银行理财?现金管理类产品被偏爱

2023-08-03

蚌埠:产业链人才链“串珠成链”

2023-08-03

上海医科大学分数线2017?

2023-08-03