APP推广合作
联系“鸟哥笔记小乔”
手机里塞大模型,只是开始
2023-11-07 18:14:27

来源|光子星球

急需找到新飞轮的手机厂商,盯上了大模型。

华为在8月初的开发者大会上宣布将在 HarmonyOS 4中搭载的AI助手小艺接入大模型,并在8月底邀测;小米也差不多同一时间开启了其AI助手小爱接入大模型的邀测。OPPO与vivo紧随其后,两者均在11月开始手机大模型的落地尝试。

“将大模型塞进手机”于业界并不是新鲜事儿,不谈自10月中旬开始密集预热的vivo,荣米O三家均曾在今年召开的发布会上透出过相关消息。业界普遍看法是智能手机赛道的硬件部分几乎卷无可卷,而大多跑在云端的大模型恰是一个游离于硬件之外的变量。

手机里塞大模型,只是开始

需要注意的是,端侧部署对大模型赛道而言同样也是行业趋势。以ChatGPT为例,作为云侧大模型的典型代表,其训练与推理都跑在微软的Azure上,用户则通过浏览器或App获取结果。input-output来回之间,不仅存在影响使用体验的时延,耗能、算力等云端成本也居高不下。

从实际场景与需求来看,不少需求完全可以通过边缘设备来满足,尤其是手机、PC、新能源车等广泛应用的终端。

于是,大模型的端侧部署逐渐成为共识,不仅有手机厂商铆足了劲训练模型,PC赛道联想与芯片赛道的高通等均在前段时间发布了端侧AI的相关解决方案。尤其是刚刚发布的高通骁龙8 Gen3以及联发科天玑9300,其AI性能的提升可以说是手机端大模型的基础。

行业需求与硬件条件都已被满足,大模型终于可以进入手机之内。可令人颇为意外的是,率先掏出“完整产品”的手机厂商竟是vivo。

vivo大模型成色如何?

11月1日,vivo召开开发者大会,于会上发布了自研大模型矩阵"蓝心"(BlueLM),包含十亿、百亿、千亿等不同参数规模。同时还发布了适配其大模型的自研操作系统OriginOS 4。

面对大模型这块“应许之地”,vivo的急切几乎写在脸上。

据10月26日市场调研机构Canalys公布的最新数据,vivo出货量出货量下滑,排名也出现下跌。vivo迫切需要大模型以及OriginOS 4来扭转局势,率先下场“开卷”并不让人意外。

而且与大模型相比,本次vivo推出的OriginOS 4的更新跨度略显寡淡。在公域讨论中,不仅其虚拟显卡、异构计算空间与轻量化等迭代幅度不及预期,vivo用户中声量颇高的原子通知等模块也没有升级。也就是说,大模型才是本次发布会的主角。

从业务模式看,vivo本次发布会展示的路线与此前业内其他玩家相似,以人工智能助手为载体,采取端侧+云侧混合的部署方式,其中作为重头戏的端侧大模型,呈现本地化、轻量化的明显特征。

这么做的目的显而易见,手机这一方小天地所提供的功耗、算力与机房不可同日而语。只是如何将模型能力与手机深度结合成为手机厂商们迫切需要突破的“konw how”。

对此,vivo给出的解决方案是推出多参数规格模型,其中主要面向文本场景的10亿规格与面向自然对话、知识问答长焦的70亿规格为端侧部署的重头戏。在官方介绍中,10亿规格单独面向端侧,70亿规格设为端云两用,自700亿起均为云端部署,这也体现了vivo在端云协同上“让上帝的归上帝,让凯撒的归凯撒”的矩阵思路。

这与谷歌在今年5月的 I/O 开发者大会如出一辙,当时谷歌发布的大模型 PaLM2 有四个参数规格,其中小参数模型可在离线状态下实现每秒处理20 tokens,适配于终端的离线使用。

如果就此认为vivo是“拾人牙慧”则未免过于严苛。实际上,vivo早在2017年便着手组建内部人工智能团队,时至今日,vivo人工智能研究院已有过千研究人员。

纵使其技术沉淀总体上不如阿里、百度等第一梯队,但开源社区的存在也让稍晚入场的玩家们能迅速赶上大部队。而vivo在2018年成立的知识图谱研究院也能在一定程度上补强其作为手机厂商可能遭遇的训练数据不足问题。

至于模型能力方面,vivo在预热时期便交出了一份不错的答卷。据悉,BlueLM在中文大模型第三方测评集C-Eval中获得了“受限访问模型”类目的第一名。其官方通告中称BlueLM是行业内首家7B端侧大模型。

但是在测评中斩获高分却实际表现不如人意的模型不在少数,更是有业内人士称这份榜单已经在过去一段时间被“刷脱皮”了,只能代表模型“做题”的能力而无法体现推理、安全、应变等能力。照此来看,vivo的业务成果显然还需要更多实际检验。

况且,vivo目前展示的云端模型能力如文生图、交互等并未跳出大模型赛道窠臼,新意有限。而且其作为重头戏的端侧模型能力还停留在测试阶段,同时端侧能力的展现也必然受到手机硬件的限制。

我们了解到,多位受邀参与蓝心内测的用户使用的是以X90 Pro为代表的旗舰机,这批机型也是目前vivo释出的大模型应用公测适配时间表中最为靠前的。

手机里塞大模型,只是开始

 

毫无疑问,大模型正在成为手机厂商开辟高端化的第二战场,同时也是盘活用户,激活IoT的重要变量。尽管如此,vivo依靠大模型增加高端产品价值的打算,还存在诸多变量

归根结底,大模型的推出既是vivo高端化的新基石,也是其试图拉动新机与高端产品的一驾马车。

低端机型自然难以胜任这场高端化的战争。以vivo于本次发布会前发布的基础机型Y100为例,这是上述适配计划中最晚上线的机型之一,如此类似“背刺”的举动背后是vivo希望靠高端产品重回王座的“小算盘”。

纵使如此,大模型的推出还是不太能成为vivo高端产品的加分项。

开源社区端侧大模型创业者王阳(化名)告诉光子星球,大模型在端侧的能力表现在于其NPU(专门为深度神经网络计算而设计的处理器)所带来的AI性能。而在vivo既往机型中,并不注重NPU能力,因此老机型大概率难以顺畅地跑大模型。

至于即将发布的,搭载联发科天玑9300旗舰芯片与新一代AI处理器的新机型vivo X100系列或许能顺畅使用模型能力,但在在市面上早已存在文心一言、讯飞星火等大模型应用的情况下,留给手机端的空间没有想象中那么大。相比于能力,或许vivo这次展示的玩法更值得深究。

让手机再智能一些?

力推微软成为 OpenAI 天使投资人的微软CTO Kevin Scott 曾公开表示,模型本身不是产品,而是基础设施。言下之意是在训练精调出模型底座后,产品化的探索才是一众玩家们“二次创业”的核心。

大模型于手机端的“再产品化”水到渠成,但部署于手机端的大模型,还需要进一步产品化探索。从目前曝光的信息看,vivo将通过一款名为小V助手的应用来实现大模型能力,而目前业内主流路线也是将大模型能力嵌入既有的人工智能助手之上。

智能手机使用者存在对大模型理解能力的现实需求,无论是被戏称为“人工智障”的智能助手还是在容量爆炸下日益臃肿的应用与数据,都需要手机能更懂交互,帮助用户梳理信息。而大模型的加入,本质上便是为手机带来自然语言理解能力。

未落地实装的情况下,端侧模型可能出现的功耗、散热、时延等用户体验问题可以暂且不谈。在王阳看来,vivo模型落地面临的首要问题是多款模型配合使用时,如何区分不同模型的能力边界以及如何调用,“这关乎最终的产品形态以及呈现”。

面对场景泛化且需求复杂的C端,不同需求调用的模型各不相同。例如端侧的10亿规格模型与70亿规格模型需要针对用户本地数据学习,试图“更懂用户”。那么能否通过模型能力以及与之适配的OS,在手机上实现复杂指令是重要指标。

目前来看,BlueLM展示的复杂指令功能颇具亮点。在新发布的OriginOS 4之下,小V助手常驻侧边栏的右下角,点击即可弹出。不仅操作逻辑相对云侧模型更短,更适配手机使用,同时也可以理解OS内的一些复杂指令,例如智能搜索相册、初步完成第三方App指令以及OS内设置等。

值得一提的是,小V助手在功能与路径上,和vivo既有的Jovi语音存在隔离,两者相互独立,这是明显有别于此前其他厂商提出的端侧大模型路径。

手机里塞大模型,只是开始

从功能上看,小V助手基本可以做到Jovi语音的全覆盖,那么两者区分的目的很可能是为了便于用户感受两者之间的差别。而且小V助手的产品逻辑形态与微软全家桶中搭载的Copilot相似,两种不同的路径很可能会在未来完成整合。

这也体现出目前的BlueLM还处于试水阶段,产品形态难言成熟。

据参与BlueLM内测人士反馈,以vivo旗舰机型使用模型能力,输入20 tokens以内的纯文本生成需求还存在2s~5s的时延,这对于后续实装而言不算是个好消息——云侧模型的时延并未得到很好的解决。这一点或许会在搭载芯片厂商最新AI芯片的机型中得到改善,只是对于消费者来说,这并不构成换机的理由。

此外,作为行业内首个手机大模型,vivo的云侧模型能力还面临许多云厂商大模型的“围剿”。

例如vivo宣布将上线应用商店的对话机器人蓝心千询,1750亿的参数规格与当下应用商店中的大模型相比并不显眼。云厂商中的百度已经就近日发布的文心4.0专业版试水收费,而蓝心千询看起来更多只是vivo大模型生态中不算亮眼的一员,其道路显然有阻且长。

不得不提的还有vivo作为后来者,技术沉淀的差距也将限制其大模型业务的进一步推进。

软件方面,vivo大模型已经成为阿里云旗下Pai机器学习平台的宣传素材,我们甚至可以从“蓝心千询”的命名中找到“通义千问”的影子。跑在云上的业务意味着长期成本,这一点在OpenAI上体现得淋漓尽致。成本视角下,如果vivo希望将BlueLM发展成为长期生态,自建IDC显然比上云更利于长期发展。

硬件方面,华为与苹果两家头部厂商早已在现有产品线中集成自研的NPU能力,vivo则还需依赖于芯片厂商。即使模型训练与调优方面可以构筑一定壁垒,但作为核心的硬件差距仍导致其与头部厂商拉开了数个身位。

大模型的终端战事

大模型的加入,让我们重新认识到智能手机的本质是一种集成多种能力的智能终端,且同时身兼硬件与OS两大入口。得天独厚的条件使得手机天然需要与大模型相结合。

那么其他终端是否也可以接入大模型,就像重做应用一样重新定义终端的能力边界?

对于这一问题的探寻可以追溯到深度学习网络爆发之时,而对端侧模型可能性探讨也源于业内人“老生常谈”的时延、能耗、隐私等问题,大模型的爆发成功地让手机成为装旧酒的“新瓶”。

实际上,早在本次往手机里塞大模型的热潮正式开启前,新能源车携自动驾驶早已成为大模型的一个终端。业内也不乏智能可穿戴设备搭载大模型的畅想,只是手机似乎即将凭借场景多样性与网络便利而后发先至。

手机里塞大模型,只是开始

更进一步说,当手机厂商密集发布大模型并投入使用后,届时便是端侧模型的一个绝佳的练兵场。我们也可以自手机大模型的落地情况,探讨多种终端搭载大模型的方法论。

毕竟,无论手机上的模型如何出色,短时间内能做到的最佳表现无非是一位用户生活领域的“秘书”。其他智能终端搭载大模型所带来的想象力无疑更大。

例如目前因移动支付而逐渐退出历史舞台的ATM,能否凭借大模型,让用户无需前往银行排队办理深度业务;亦或是同属B端场景的智能摄像头,在医疗领域识别患者基本体征、在工业领域快速质检、在农业领域智能灌溉等。而今凭借云侧模型未能广泛打开的B端市场,也可能将迎来端侧这一变量。

这也是为什么vivo会在其生态尚不及华为、小米完善之时,便在本次发布会上展示了搭载在新款vivo Watch的蓝河操作系统(BlueOS)。作为vivo面向通用人工智能时代研发的跨端系统,其推出旨在通过手机带动一系列IoT产品,无疑具备不错的想象空间。

vivo亦宣布开源其7B规格模型,并推出了蓝心大模型开发套件BlueKit,生态建设的野心昭然欲揭。或许目前vivo只走到了让IoT听得懂指令的阶段,但这对于vivo其后的高端化、生态化等战略相当重要。

手机大模型的能力未知,面临的挑战很多,正式发布与落地之后,势必为业内带来更多“开卷”的方向。更多千奇百怪的落地姿势,正在等待业界的解锁。

光子星球
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
光子星球
光子星球
发表文章233
细微之处,看见未来。公众号:光子星球(TMTweb)
确认要消耗 羽毛购买
手机里塞大模型,只是开始吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接