APP推广合作
联系“鸟哥笔记小乔”
从现在开始,得像研究DeepSeek一样严肃研究Kimi
2026-03-26 14:29:02

我研究过世界上绝大多数的主流AI大模型公司,试用过它们的产品。我是ChatGPT, Gemini以及Grok的长期付费用户,也经常使用国产的DeepSeek, Qwen, 混元和豆包。虽然我日常较少编程或使用Agent,但是对于文本会话以及图片、视频等多模态功能,我可是不折不扣的重度用户,经常在新版本模型发布之后一口气聊到大半夜。至于编程与应用开发,我在朋友圈密切关注几位程序员朋友的分享,对于Claude Gode和ChatGPT Codex之类的工具应该算不上文盲。

直到上个星期,我还对朋友说:“对于AI行业,我应该没有错过什么值得深入了解的东西吧。”然而接下来的几天,我先是在社交媒体,然后在自己加入的微信群,注意到了一件出乎意料的事情——Kimi的冉冉升起(尽管以前的地位就不低了)。3月16日和20日,马斯克两次赞扬了Kimi,第一次是为了一篇关于大模型注意力残差(Attention Residuals)技术的论文,;第二次则是为了Cursor发布的新模型被证实是基于Kimi K2.5微调的成果。尤其是第二件事情,影响巨大,震动了全球的AI圈子,我们不妨先把此事的来龙去脉回顾一下:

  • Cursor是全球最流行的AI编程IDE,没有之一。不过它主要是一个应用界面和工具箱,通过接入第三方大模型完成任务,例如Claude.

  • 今年3月初,Cursor发布了原生编程模型Composer 2,效果极佳,推理成本极低,立即引发了高度关注;但是一开始,Cursor并未提及外部合作伙伴,很多人都以为是完全自研。

  • 接下来两个星期,很多开发者发现,Composer 2的API和模型ID含有Kimi K2.5的痕迹,很可能是基于K2.5开发的;互联网口碑迅速反转,媒体转而指责Cursor抄袭Kimi。

  • 3月20日,Cursor创始人道歉并承认Composer 2是基于Kimi K2.5二次开发的结果,感谢了Kimi的贡献;Kimi也大度的表示该模型通过合作伙伴获得了授权。至此,这一风波基本圆满解决。

说实话,这件事情给我带来的震动很大。此前我一直认为,Claude Opus 4.6和GPT-5.4是全球最擅长编程的大模型;在国内,我对DeepSeek的新版本寄予厚望,因为梁文锋此前发表的论文明显很关注编程方向。我对Kimi以及月之暗面这家公司的认知,主要还停留在当年“擅长超长文本分析”的阶段。我的那些资深程序员朋友比我还要震动——当Kimi K2.5成为全世界最流行编程工具的最受关注的“原生大模型”的基础时,稍有技术常识的人就该明白其背后的分量。

Kimi K2.5的竞争力,不仅在于其推理能力强、成本低,还在于它是开源的。因此它成为了Cursor二次开发的基础,还驱动了Cloudflare旗下新业务Workers AI的上线。在公告中,Cloudflare特别强调了K2.5的成本优势,称其为“性价比甜区”(Price-Performance Sweet Spot):“我们提供Kimi K2.5服务,一开始是个试验,但是当我们看到它的表现以及性价比之后,这个试验马上就变得十分重要了。”

做个背景解释:Workers AI是一个大模型聚合平台,旨在为企业和个人客户提供统一API,客户不必拥有自己的硬件算力,就能选择不同的大模型完成任务。Workers AI接入的主要是开源模型,包括Meta的LLaMA、阿里的Qwen、谷歌的Gemma以及DeepSeek,等等。然而,直到不久前,它提供的模型几乎全是“小版本”,参数规模从几十亿到一两百亿,一般无法承担深度推理、长文本以及高强度的Agent工作流任务。Kimi K2.5是它接入的第一个大规模(总参数1万亿)前沿模型,从现在开始,它可以骄傲地宣称:“我们能帮助客户完成各种复杂的高强度任务啦!”

这个世界上,有的是能力强、跑分高的大模型,但它们往往不具备推理成本优势;具备成本优势的,往往又不开源。此时此刻,我们遗憾地看到,硅谷的那些最先进的大模型生态,基本建立在闭源基础上:

  • OpenAI的名字就代表着“开源”,但是自从GPT-3开始,前沿大模型就不再开源。2025年,才羞答答地发布了两个GPT-OSS开源模型,显然无法代表其最高水平。

  • 谷歌在2021年之前也秉承开源路线,但是目前的旗舰大模型Gemini从不开源,只有参数规模明显较小的Gemma大模型是开源的。

  • Anthropic从成立之日起就没有发布过任何开源模型,Claude系列是完全闭源的。

  • Grok最初的几个版本曾经开源,但是自从Grok 3以来就不再开源。在连续两次点赞Kimi之后,不知道马斯克会不会重新考虑加入开源生态?

放眼全球,对开源生态最执着、贡献最大的,早已变成了中国厂商。DeepSeek, Kimi, Qwen……各有擅长的领域,都在某个时期成为过人类最前沿的开源模型。我觉得Kimi尤其难得,其融资、估值和消耗的资源只有OpenAI等硅谷大厂的2%左右,而且也远远小于国内互联网大厂的大模型部门。用这么少的资源,这么迅速的开拓AI基础研发的边疆,并毫不吝啬地将前沿成果开源,不禁让我想起了很多很多年以前的OpenAI。

除了中国之外,开源生态的旗手,基本仅剩LLaMA和Mistral了。LLaMA 1-3都是全球领先的开源模型,为生成式AI技术的传播做出了不可磨灭的贡献,奇怪的是LLaMA-4水平远远低于预期,扎克伯格若想重新接过火炬,恐怕得付出更多的努力。Mistral是法国乃至整个欧洲的独苗,成立之初仅以几十人的团队规模就做出了当时世界上“第三先进”的大模型(前两个是GPT和Claude),但是2024年以后其发展速度明显放缓,从基础模型的技术水平看,已经掉入了第二梯队。这其实是AI创业公司的常态,毕竟谁都无法保证在资源有限的情况下一直保持在潮流前列。所以,我反而更加佩服月之暗面——从2024年初因为长文本功能而走红,到现在以Kimi K2.5震惊世界,事实证明它绝不是昙花一现。

附带说一句,Mistral的技术进步放缓,并没有妨碍它在2025年9月完成估值140亿美元的新一轮融资;微软、Salesforce以及ASML(没错,就是荷兰那家光刻机巨头)都是它的重要股东。看到这一幕,你还觉得Kimi的180亿美元估值太高了吗?要知道,短短十几天前,马斯克的xAI刚刚以高达2500亿美元的估值与SpaceX完成了合并。就算我是Grok的深度用户,面对这个估值水平也得吐舌头。马斯克描绘的把数据中心发射到太空中的宏大愿景,让我深感激动;不过我得公允地说,Grok离世界最前沿水平还是略逊一筹。

X平台(原名推特)的著名AI博主、被诸多硅谷大佬关注的Tuki (TukiFromKL)说得好:“两家中国实验室的旗舰模型(注:DeepSeek和Kimi)都开源了,都用更少的资源做了更多的事情,挑战美国公司收费数十亿美元的产品。AI竞赛不再是美国vs中国,而是闭源vs开源,而开源正在迅速跟上。”

Tuki的这段评论或许有点武断,不过我赞成它的精神:在历次计算机技术革命中,开源生态都发挥了举足轻重的作用,AI革命也不例外。硅谷巨头仍然掌握着可观的技术和资源优势,但是拒绝拥抱开源生态只会让路子越走越窄。一个开源的、低成本的、持续更新的大模型,对应用层的意义怎么估计都不过分。就拿Kimi K2.5来说,Cursor用它做出了强大的Composer 2, Workers AI用它迈出了提供前沿大模型服务的第一步,我相信还有更多的应用商正在琢磨如何最大限度地利用它。这样的技术进步会让全人类受益,形成基础研发层与应用层互相促进的良性循环。

或许会有人担忧:“前沿技术开源了,那开发商怎么赚钱呢?”事实上这是最不需要担心的问题。我们不妨看看全球最大的开源软件生态——Linux,它从来不曾闭源,但是其生态系统每年创造着200-300亿美元的收入,近年来还呈现攀升的态势。这个数字还没有包括从Linux基础上生长出来的Android, 后者让智能手机真正走进了千家万户,谷歌在尽力维持开源社区的同时,成功地从附加服务上赚到了很多钱。

生成式AI对人类社会的影响才走出了第一步。所有人最应该关心的话题是如何尽快把蛋糕做大、把门槛做低,AI技术的普惠效应越强,AI基础模型及应用开发商的地位反而会越稳固。在这方面,以DeepSeek、Kimi为代表的中国厂商,反而比很多硅谷巨头想的更清楚一点。我想这就是杨植麟成为在今年英伟达GTC上面唯一受邀演讲的独立大模型公司CEO的原因:老黄的眼光十分精准,一再证明了自己能在纷繁复杂的竞争格局中,看清真正有竞争力的路线。

我迫不及待想看到更多像DeepSeek和Kimi这样的AI创业公司:开放的态度、短小精悍的团队、锐意进取的精神;它们应该与大厂形成你追我赶的长期竞争格局。在这个过程中,谁能获胜、谁受益最大,反而成了不太重要的事情,因为无论怎样,最终受益的都是全人类。

互联网怪盗团
公众号二维码
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
互联网怪盗团
互联网怪盗团
发表文章232
互联网怪盗团
团长,毕业于北京大学,自媒体“互联网怪盗团”主理人,曾在光大
确认要消耗 羽毛购买
从现在开始,得像研究DeepSeek一样严肃研究Kimi吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接