APP推广合作
联系“鸟哥笔记小乔”
大模型的“百模”竞争进入淘汰赛,是时候打扫战场了!
2024-02-04 17:47:48

来源:秋水笔弹

在最近的一次活动上,周鸿祎抛出了“去年看大模型像原子弹,今年年初再看大模型就跟茶叶蛋似的”的论调,如其所言,开源大模型、大模型超市层出不穷,行业模型、小参数模型也开始百花齐放,百度也逐渐把重心转移到了应用生态以及付费商业化工作当中。

但是从GPT-3到GPT-4的能力跃升,到GPT-5可能带来的迅猛发展来看,水哥以为,大模型通用能力还在以指数级别的速度进化着,现在打扫战场恐怕为时尚早,对于被围追堵截的中国以及中国企业而言,更是如此。

与GPT深度捆绑的微软创始人比尔·盖茨在年初也发声,强调大模型这款人工智能技术在未来五年内将实现显著的变革。

Sam Altman也透露了GPT-5的最新进展,很可能已经大幅超越了GPT-4的能力范围,他认为,如果 GPT-4 目前解决了人类任务的 10%,GPT-5 应该是 15% 或者 20%。他还用“初代 iPhone 和最新 iPhone15”的对比,来形容AI未来所能实现的进步。

从这种走向来看,大模型还在朝着通用人工智能的道路迅速挺进。

事实上,也是人工智能打开的可能性,让美国铁了心对中国围追堵截,拜登政府已经提议要求美国云服务公司进行自查,以确定外国实体是否正在访问美国数据中心以训练人工智能模型,防止中国利用美国技术进行人工智能的发展。

今天的中国发展通用人工智能,是势在必行的事,“宜将剩勇追穷寇,不可沽名学霸王”。在刘庆峰看来,今天,大模型绝不是像茶叶蛋一样不值钱,通用人工智能的自主可控,既决定了产业链安全,也决定了国家安全。如果中国没有大模型,那么工业、民生、科研以及各个专用领域都会极大地落后于世界。

那么,大模型真的到了打扫战场的时候吗?这个掀起了全球新一轮风险投资热潮的产品创新,到底是茶叶蛋,还是原子弹?

中国第一个基于国产算力的大模型,到底能不能打?“能够真正对标美国最先进技术的大模型,全中国将来没有几个,讯飞星火一定是其中之一”,科大讯飞这种自信的底气来自于何处?

一、通用人工智能时代,中国更需要wintel组合

大模型当然不是茶叶蛋,相反它是通用人工智能的曙光,就好像,互联网发展到今天,是一系列科技创新所促成的,互联协议只是打开了一个技术的潘多拉魔盒。

互联网的发明最早是为了在科学和军事计算机之间共享文件,但是今天它在一系列创新技术的推动下,从根本上改变了娱乐、商业、制造业和个人通信。

大模型打开另一个通用人工智能系列技术创新的潘多拉盒子,与人类第一次使用蒸汽机、电灯泡一样,都是新一轮创新浪潮的开端。

这种可能性,正是美国不择手段围堵中国的根本动机。

美国的围追堵截,也坚定了很多中国企业家通过自主创新实现人工智能产业突围的决心,已经被美国拉入实体黑名单的科大讯飞危机意识就非常强烈,在科大讯飞创始人刘庆峰看来:“当前,发展通用人工智能是我们必须要做的事情,否则工业、科研、民生等各个专用领域都会极大落后于世界,而中国是世界唯一有望成为智慧涌现第二极的国家。”

在前几天科大讯飞发布会的大模型升级效果来看,从智能算力底层开始,实现自主创新的国产替代也并非没有可能的。

2023年10月,科大讯飞携手华为,基于首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练。

虽然训练时间还不到一百天,讯飞星火V3.5的逻辑推理、语言理解、文本生成、数学答题、多模态等核心能力已经实现了显著提升,接近了GPT-4水平,其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

互联网的发展出现了软件与硬件的厂商产业联盟wintel 组合,算力的进步,与软件是相辅相成的,Wintel联盟依靠英特尔摩尔定律的算力升级和微软Windows系统的升级换代,双方彼此支撑推动了个人电脑长达二十多年的迅速进化。

今天华为、讯飞的算力与大模型组合,作为中国大模型产业的产业联盟,一方面为中国解决算力自主问题提供了产业落地空间,另一方面,也为软硬一体化的中国人工智能发展开辟了道路。

除了自主安全这项其他国产大模型没有的优势,事实上,在语音交互这项通用能力上,科大讯飞已经实现了对GPT-4的反超。据刘庆峰介绍,国内首个语音大模型星火语音大模型,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3。

语音大模型的优势,为科大讯飞在未来打开机器人产业的未来空间,也让科大讯飞在语音赛道二十多年的能力优势,在大模型时代,能够进一步放大。

不过,当前讯飞星火V3.5在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,刘庆峰认为,我们要清醒理智看到差距,“一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”

不论国产与美国的差距,还是大模型今天的水平与通用人工智能的差距,都决定了这依然是一场长跑,只有看到远景并坚持下去,才有可能赢得最终的胜利。

二、落地大考:跨越技术与市场的创新鸿沟

大模型打开的通用人工智能道路还有很远的路要走,众所周知,人们往往在短期高估技术的发展,而在长期低估了技术的发展,今天大模型也差不多,短期淘汰赛会非常惨烈,站住脚就已经很难。

根据技术的扩散周期,大模型创业竞赛正进入冲刺淘汰赛段,大模型逐渐形成专门的早期市场,能否赢得早期市场,站稳脚跟,获取下一步的入场券,成为每个公司必须面对的首要问题。

在这个阶段,只有同时拥有远大愿景、与丰富产业数据与经验的公司,才有进一步跑出的希望。

但是这些恰恰是科大讯飞的优势所在,教育、医疗、消费者、智慧城市、运营商、汽车等多个G/B领域是科大讯飞根据地业务,二十多年积累的人工智能行业认知、技术以及数据,都是今天其大模型深度差异化的能力来源。

为什么讯飞大模型能快速进行大规模产业落地?举一个例子:通用技术的比拼,如同射箭比赛,比拼行业大模型,除了技术能力之外,还要拼对行业的“画靶子”能力。以教育为例,有关“小学生英语学习”的大模型,首先需要了解小学英语的学习目标,还要定义小学生英语学习的范围,不能超纲,并要找到适合孩子学习习惯和学习阶段的方法——这些标准,都要先定义,这就是“画靶子的能力”。

每个行业都有着长链条的价值链,复杂的上下游以及复杂的专业领域数据与知识,很多厂商没有做过行业,是不具备画靶子的能力的,没有办法深入行业的本质。但是讯飞在多个领域都深耕多年,不仅能画靶子,也有专业的团队和数据积累——这样才能做出行业真正适用的大模型。

从人才培养角度来说,行业+技术的复合人才很短缺,而讯飞做了人工智能行业25年,能穿透行业的人有很多,头部、腰部力量很强。

在技术顶天、应用落地的战略下,科大讯飞这么多年在行业应用上,已经形成了成熟的“GBC联动”模式。

把大模型技术的创造力,转化为促进产业增长的新质生产力,正在成为千行百业的共同选择。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。星火大模型还与奇瑞汽车、太平洋保险、交通银行、国家能源集团等企业,打造千行百业的大模型应用标杆。

随着数学和推理能力的升级,多模态能力逐步进阶,通用大模型能力的升级,决定了落地生产力的提升级别,放大了科大讯飞“GBC联动”的市场优势。

多年推动行业AI化的努力,为科大讯飞大模型商业模式找到了最好的落地方向,为科大讯飞切取更大份额的GBC端的应用和终端硬件产品市场,打开了空间。

赢得早期市场,也意味着赢得了进入下一轮竞赛的入场券。

三、百模大战的泡沫中,会有伟大的公司从中崛起

通用人工智能这条道路,其实已经经历了多次热潮与漫长的冬季。

大模型的出现,让通用人工智能看到了曙光,也让坚持通用人工智能路线的公司看到了曙光。

人工智能的来路比大模型更久远,其未来也更长远,只有一直深耕这条赛道的人才、公司,才有可能抓住偶然出现的技术创新以及时代机遇。

今天,决定输赢的不是公司体量的大小,这就是为什么OpenAI能够率先跑出,它当然也需要微软的资金加持,但是这不是简单的资金算力问题,更重要的团队多年的积累跟长期的技术研发,带来的技术人类反馈机制的技术新突破,无论大厂、小厂的努力,在这场技术长跑当中,每一个关键技术突破,都会壮大其继续前行的技术底座,凭借这些积累,OpenAI、谷歌、科大讯飞这些持续深耕技术企业也都成为了大模型竞赛的关键角色。

在多次迭代、2023年5月正式发布的认知大模型之后,刘庆峰就很骄傲地说:“这次大模型攻关,90后带队,项目中也大都是90后。”老中青传帮带的扎实人才梯队与技术的厚积薄发相辅相成。

在刘庆峰看来,认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是基础条件,科大讯飞是中国该领域的国家队。

在强大的人才团队努力下,科大讯飞在认知智能领域早已取得一系列全球领先成果。2019年,在斯坦福大学发起的国际著名的SQuAD机器阅读理解比赛中,在英文阅读理解中首次超过了人类平均水平。2022年在艾伦研究院组织的OpenBookQA科学常识推理比赛中,单模型首次超过了人类平均水平。

科大讯飞在过去24年一直专注在人工智能,拥有关键算法创新的两个核心策源地——认知智能全国重点实验室、语音及语言信息处理国家工程研究中心,有充分的技术积累。这次星火大模型的每一行代码、每一个算法模块都是自己做的,而不是拿第三方的开源平台训练的。

科大讯飞通过算力端与华为合作,率先解决了算力国产化的问题,同时在人工智能算法方面二十多年的技术人才积累,以及硬件终端多年的市场积累带来的从教育、医疗到政务优质且独特的细分行业市场数据,让它在互联网巨头的刺刀丛中,依然游刃有余。

更重要的是通用人工智能的信仰,对大模型通用能力持续迭代的坚持,很可能会让这家AI公司走得更远。

随着大模型通用能力的指数级强化,机器人、具身智能以及在千行百业进行深度应用的市场空间,都已经逐渐打开。

今天的大模型特别是人工智能,都还处于早期创业创新阶段,对此,刘庆峰也强调,今天的通用大模型并不一定就代表人工智能的全部未来,还有很多创新要做,比如跟脑科学的互动、跟对抗网络的深度连接,我们要做的工作非常之多,需要一整个创新生态。但是,我们一定要有勇气和信心在底层的大模型上持续对标。

大模型魔力的全部发挥,还有待需要更多的技术突破,比如更强大的通用智能算法,更多的感知算法,譬如具身智能,这需要更多具有通用人工智能信仰的、以及市场嗅觉的人才以及公司去攻关突破。

重复造轮的百模大战,当中肯定有泡沫的成分,但是,如果把时间拉长,这种泡沫式的繁荣就像互联网网页时代的千禧年创业一样,是必经之路,但是泡沫当中,一定会有伟大的公司从中崛起,中国绝对不能缺席。

秋水笔弹
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
秋水笔弹
秋水笔弹
发表文章6
财经自媒体,社交、游戏、电商、新消费、短视频、云计算、智能硬件等科技互联网的趋势与策略思考,上市公司的价值与泡沫分析。公众号:秋水笔弹(qiushuibitan)
确认要消耗 羽毛购买
大模型的“百模”竞争进入淘汰赛,是时候打扫战场了!吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接