APP推广合作
联系“鸟哥笔记小乔”
云+AI治标不治本,产业需要“一云多芯”的AI原生云
2024-04-19 14:37:48

来源:光子星球

过去一年的云计算市场,冷热交织。价格战、“下云潮”,以及越来越单向度的内卷等因素下,云计算遭遇全球IT疲软,而AIGC领域却是另一番景象。

规模化的云厂商均将AI作为拉动业务的马车,只是诸多尝试还停步在布局AI基础设施与云产品的智能化之上。这种路径尽管对自身业务流程的帮助不小,但在向外输出方面却非常匮乏,这客观造成了产业智能化进程局限于点与线,无法推进到面。此外,大模型的出现将人类知识压缩,云上开发的管理对象也悄然生变。

AI时代用云与云上AI开发需要一个崭新的动能,好比正在逐步替代传统内燃机列车的高铁一般,虽当下的铁路网络中仍有不少普快徐徐慢行,但它们已不再是人们便捷出行的首选。

云+AI是跑在旧铁轨的绿皮车,而AI云则是一条全新的高铁线路。

要AI云,而非云+AI

“传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。”百度集团执行副总裁、百度智能云事业群总裁沈抖近期表示。

过去一年,大模型不断演进,已开始深度重构人机交互。例如,随着NLP的成熟,通过自然语言处理编程不再是无法落地的事情。事实上,由于应用场景、技术发展、语言竞争等因素,编程早已陷入“巴别塔魔咒”之中,单常见的计算机编程语言便有C语言、C++、Java、Python、Go等等。这导致编程不得不面向过程与对象,而无法正视需求。

当编程过程变为开发者表达愿望的过程时,整个操作系统的迭代便是题中之义。例如底层硬件,过去以CPU的算力为主,主要依赖低延迟、高复杂性运算,应用于算数与逻辑运算。而诞生于图形渲染的GPU则依赖于高吞吐量、低复杂性运算,长于处理大规模数据集。

此外,大模型的出现将人类知识压缩,操作系统管理的对象也悄然发生了改变。

AI大模型从最初的框架构建,逐步走到落地阶段。然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但却难以满足个性化需求,导致服务商成为“高科技施工队”,而用户遇到问题处于两眼一抹黑的极端情况。

“上云容易下云难”,过去几年,部分行业在上云与下云之间反复横跳。

南方某医疗机构技术中心负责人此前提到,因为一把手都意识到上云是一种趋势,在一次会后,便拍上云。他们先在业务量不大的分院将影像归档和通信系统上云,等到成本、应用、维护等一系列验证有效后再复刻到总部。然而,当时的云上系统多次出现变慢,也曾受宕机拖累。

“我们排查不出问题,找云服务厂商、影像归档和通信系统厂商、检查本地系统,而且还要在院里协调各部门,简直自找麻烦。”最终,这家医疗机构决定下云,花钱将数据迁移回来,回到此前“膈应”的老系统。

各行各业面临的共性问题,如今似乎看到了答案。

4月16日,Create2024百度AI开发者大会期间,百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布了新一代智能计算操作系统——万源。

万源主要由Kernel(内核)、Shell(外壳)、Toolkit(工具)三层构成。并且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。通过对AI原生时代的智能计算平台进行抽象与封装设计,为用户屏蔽掉云原生系统与异构算力的复杂性,提升AI原生应用开发效率与体验。

这意味着,模型与AI原生开发的操作、算力、语言等门槛的进一步下放。更关键的是,百度凭此“桥接”不同开发深度的生态以及其中的不同角色,一个需求驱动的动态耦合的大系统就此形成。

“一云多芯”发起算力革命

每个时代都有其对应的底层载体作支撑,工业革命的蒸汽机、发动机或是信息时代的CPU均是如此。因循此逻辑,AIGC开启的全面智能化同样需要必须一个核心载体作为支撑,这便是上文提到的智能计算系统。

值得注意的是,智能计算并非既往计算技术的替代或是简单整合。相反,它是一种计算形式,根据任务要求系统地、全面地优化现有的计算方法和资源来解决实际问题。

要知道,算力早在在过去一年多内便被公认为是制约AIGC商业化与进一步发展的卡点,即使中国算力总规模位居全球第二,算力规模近5年更是年均增速近30%,算力卡脖子的焦虑依旧蔓延于行业上空——英伟达GPU一“芯”难求,而向开发者提供GPU托管服务的“算力黄牛”CoreWeave却在短短四年内估值增长至560亿元。

为了弥合算力供需之间的沟壑,也让算力更好用,万源为智能计算打出的“银弹”是百舸·AI异构计算平台。

在万源的内核层,在算力资源管理方面,百度百舸·AI异构计算平台针对大模型训练、推理等任务,对智算集群的设计、调度、容错等环节进行了专项优化。目前,百舸能够实现万卡集群上的模型有效训练时长占比超过98.8%,线性加速比、带宽有效性分别高达95%,算力效能业界领先。

要知道,即使是在国内顶尖的大模型厂商的视域内,模型有效训练时长占比达到90%的智算集群,大多都还局限于千卡集群。此外,百舸更关键的突破在于“一云多芯”在模型训练场景中的优异表现,称得上是从根本上缓解算力焦虑。

目前,百舸能够兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持用户以最小代价完成算力适配。

过去,智算集群中的多个模型训练任务往往是单一厂商芯片服务于单一任务,不论是不同厂商芯片算力切分、芯片间通信效率或是根本的模型训练效率问题,都使得算力焦虑在在硬件差异之下被无限放大。

不过,在百舸的智能调度下,不同厂商芯片在单一任务混合训练已经成为现实,且百卡规模性能损失不超过3%,千卡规模性能损失不超过5%。百度方面表示,百舸平台的应用能最大程度上屏蔽硬件之间差异,帮助用户摆脱单一芯片的依赖,实现更优成本,打造更具弹性的供应链体系。

面对业内领先的重大突破,百度内部狂喜的同时也有些无奈。“以这么小的性能损耗完成混合多种芯片的单任务训练,业界基本没有厂商能做到,甚至我们的一些用户都不敢相信这是真的”。

当硬件差异在计算调度层面被尽可能抹平后,模型训练的成本与使用门槛也将随之降低,甚至直击算力需求与供给的错配也未尝不可。在硬件设施未有根本性变化的情况下,百度的底层技术打响了智能算力革命的发令枪。

授人以渔,重塑开发生态

借由对智能的管理能力,万源得以成为百度“桥接”算力效能与应用创新的桥梁,Kernel(内核)、Shell(外壳)、ToolKit(工具)三层高效互联起来,并形成了端到端的效能优化闭环。

内核层除了百舸·AI异构计算平台之外,还包含不同规格文心模型和第三方模型,外壳层是解决模型的管理、调度与二次开发ModelBuilder,而工具层则是具体应用的开发平台即AgentBuilder、AppBuilder。

行业视域下,大多模型服务商均在2024年前后推出了触达C端的开发工具,面向C端用户的封装应用、面向开发者的AI原生开发工具以及企业侧的精细定制化MaaS不一而足。百度根据基础设施、模型和AI原生应用构建三种不同开发深度而设计的分层于业内并非鲜见。

但难能可贵的是,百度通过万源,更进一步地将相互隔离的小体系整合成为一个大的体系。闭环之内,用户、开发者与企业侧三种角色都能共享生态内的计算资源与模型能力来进行高效开发。

用户或开发者可以通过自然语言的形式,以极少的计算资源进行有针对性的智能体等AI原生应用开发。例如,百度CEO李彦宏在大会上演示的“新加坡旅游局”智能体,只需在直接生成的基础智能体之上添加知识库内容,即可在数分钟内打造一个经验丰富的专属“背包客”。

正如沈抖所言,“随着大模型技术的不断演进,通过自然语言进行编程正在成为现实。编程将不再面向过程或者面向对象,而是面向需求”。百度以万源为基底,向业界提供了一个达到“编辑器”级别的开发工具与分发平台,带动AI原生应用进入下一阶段。

端云协同的飞轮

一个开发生态的初步完善仅是开启下一个想象空间的第一步,我们需要寻找的还有展现开发价值的载体。

对于开启智能手机时代的“iPhone时刻”而言,第一个展现巨大价值的载体是以《愤怒的小鸟》为代表的移动游戏;于AIGC而言,AI原生开发侧的价值落地在于端侧与端云协同。

仅需粗略扫视而今的手机行业,足见智能手机+AI已然成为各大手机厂商的核心战略。IDC预计2024年全球新一代 AI 手机的出货量将超过1.7亿部,约占智能手机整体出货量的15%,Counterpoint预计2027年出货量达到5.22亿部,渗透率达到40%。

另一方面,AI的能力触达同样需要一个距离用户最近的载体,无论是个人数据的安全读取还是进一步对人类行为、指令等进行分析、梳理,手机都无疑是当下的绝佳选择。

事实上,百度早在本次大会前便锚定了万源系统的价值实现标的。2024年1月10日,在荣耀MagicOS 8.0发布会及开发者大会上,荣耀终端有限公司CEO赵明宣布了“百模生态计划”,并与百度集团执行副总裁、百度智能云事业群总裁沈抖共同宣布,百度智能云成为荣耀大模型生态战略合作伙伴。

早在2017年11月,荣耀便发布了搭载AI应用与麒麟970处理器的荣耀view10,在彼时尚未成型的AI手机赛道初露峥嵘,近期更是掏出100亿真金白银与2000余项相关专利,宣告其发力端侧AI的坚定决心。更重要的是,荣耀还是智能手机赛道的头部玩家,据IDC数据,去年第四季度荣耀以16.8%份额占比,排名安卓阵营第一。

以此前披露的合作细节来看,有别于行业普遍的拍照、实时通话翻译、智能搜索等简单升级,两者是通过MagicOS来展开端云协同的范式创新——由端侧的荣耀魔法大模型负责理解用户意图,在后台将用户的简单提示转化为更专业的提示,再由云上的文心大模型提供知识问答、生活建议等专业服务。

例如日常助理需求中的“帮我安排日程表”或“帮我设定运动规划”,魔法大模型会分析用户的出行、健康等使用数据,生成初步提示词,以此调度文心大模型来生成足够全面的规划。在此过程中,魔法大模型将通过端侧防护网,滤掉敏感信息并确保个人隐私不上云,来解决用户对个人数据的隐忧。

然而这仅是AI在这个端云协同范式下的初步应用,更进一步的是依据用户自行上传的端侧数据而形成的个人知识库,以极短的链路提高劳动生产率并延伸脑力的可触达空间。

在安全性、可解释性、易用性等综合指标早已成为AI军备竞赛关键的当下,打开大模型的黑箱从而触达公众认知,无疑是大模型进入“创新扩散”下一周期的胜负手。开发者视角下的黑箱在于算法和训练过程,对于用户而言,不可见的黑箱则是模型能力的易用性与普适性。

面对不同角色的“开箱”需求,客制化产品不断涌现。然而唯有百度率先向底层进军,通过智能计算能力大幅降低开发门槛,将相对隔离的不同开发与反馈体系融为一体。体系的率先建立往往意味着商业壁垒,尤其是对于to B赛道而言。

AI与云的深度融合,端云协同的深度耦合下,我们亦看到了李彦宏在内部讲话中坚持闭源路线的底气所在。“抢滩”智能计算的百度再次在AI军备竞赛中保持了身位的领先。

光子星球
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
光子星球
光子星球
发表文章224
细微之处,看见未来。公众号:光子星球(TMTweb)
确认要消耗 羽毛购买
云+AI治标不治本,产业需要“一云多芯”的AI原生云吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接