要聞

手機AI競爭轉(zhuǎn)向：蘋果、vivo等廠商不再“堆參數(shù)”，押注輕量化端側(cè)大模型

2025-10-11 22:33:13

生成式AI浪潮下，端側(cè)AI成智能手機技術(shù)競賽新焦點。vivo等廠商轉(zhuǎn)向開發(fā)體量更輕的端側(cè)模型，提升實用性能和功耗控制。端側(cè)模型小型化漸成行業(yè)共識，為手機消費帶來新增長契機。但安卓廠商落地端側(cè)大模型面臨兼容、內(nèi)存占用和推理能力等挑戰(zhàn)。此外，智能體跨應(yīng)用調(diào)度受限，破局關(guān)鍵在于推動行業(yè)標(biāo)準(zhǔn)建立。

每經(jīng)記者｜王晶每經(jīng)編輯｜張益銘

在生成式AI（人工智能）席卷全球的浪潮中，智能手機正成為AI落地的關(guān)鍵陣地。從蘋果推出Apple Intelligence、三星發(fā)布Gauss（高斯）、榮耀帶來MagicGUI大模型，再到vivo的藍心大模型，端側(cè)AI正成為行業(yè)新一輪技術(shù)競賽的焦點。相比云側(cè)AI，端側(cè)AI既能保護用戶隱私、降低計算與能耗成本，還能提供類似個人助手的交互體驗。

然而，當(dāng)AI從云端遷移到終端，技術(shù)與商業(yè)的難題也隨之而來。過去兩年，廠商們熱衷于將大模型直接嵌入手機操作系統(tǒng)，并將參數(shù)規(guī)模當(dāng)成競逐的焦點。比如，vivo曾在2023年實現(xiàn)130億參數(shù)的“藍心大模型”在端側(cè)跑通，并讓70億參數(shù)模型在端側(cè)落地。

然而在今年10月10日舉辦的vivo開發(fā)者大會上，vivo副總裁、vivo AI全球研究院院長周圍給出了一個新的發(fā)展方向——放棄對“通用人工智能”的追逐，轉(zhuǎn)而推出體量更輕的3B端側(cè)多模態(tài)推理大模型，該模型僅占用手機2GB內(nèi)存、功耗約750毫安，卻能在推理能力上超過此前的7B甚至10B模型，性能接近云端模型。“做千億級模型需要兩萬卡以上的集群，光設(shè)備投入就20多億元，這還不包括每年數(shù)億元的電費?！怼ㄓ萌斯ぶ悄懿惶F(xiàn)實?！?/p>

vivo副總裁周圍企業(yè)供圖

事實上，端側(cè)模型的小型化正逐漸成為行業(yè)共識。蘋果的Apple Intelligence同樣采用30億參數(shù)的設(shè)計，可以在設(shè)備上完成文本摘要、信息提取與跨應(yīng)用操作等任務(wù)。這意味著，廠商們正在從“堆參數(shù)、拼算力”的競爭，轉(zhuǎn)向關(guān)注模型在端側(cè)實用性能、功耗控制的理性階段。

告別模型參數(shù)競賽

端側(cè)大模型落地后，越來越多消費者開始應(yīng)用大模型，這也有望為手機消費帶來新的增長契機。華福證券在研報中稱，端側(cè)大模型將成為消費電子品牌廠商提升個性化用戶體驗，打造產(chǎn)品差異化競爭力的重要方向，具備更強AI能力的終端新品推出或?qū)酉M電子見底復(fù)蘇。

在vivo AI產(chǎn)品總經(jīng)理關(guān)巖冰看來，真正實現(xiàn)個人化智能的核心在于端側(cè)。“只有端側(cè)模型才能實時分析用戶的數(shù)據(jù)、洞察需求，感知屏幕內(nèi)容、理解使用意圖等?！边@也正是蘋果在“Apple Intelligence”中強調(diào)的方向，即在端側(cè)完成敏感數(shù)據(jù)處理，保障隱私，同時提供個性化服務(wù)。然而，與蘋果封閉的體系不同，安卓陣營的廠商在落地端側(cè)大模型時要面臨眾多挑戰(zhàn)。

“云端模型的CPU通?；赬86架構(gòu)，而手機上是ARM的內(nèi)核，此外還要兼容不同芯片廠的NPU指令集，如何把原來生態(tài)里指令集轉(zhuǎn)成手機上的指令集，這里最大的障礙是算子?！敝車f道。據(jù)他介紹，vivo早在2017年便在美國設(shè)立AI研究院，組建專門的算子團隊，目前該團隊已擴展至幾十人，聚焦把模型轉(zhuǎn)成端側(cè)化的過程。

算子之外，內(nèi)存占用同樣是制約端側(cè)大模型落地的關(guān)鍵瓶頸。周圍舉例稱：“以往7B模型需要占用3.5G內(nèi)存，而8G手機是中高端機型的主要配置，一個大模型就占掉4個G內(nèi)存，一下讓高端機變成了低端機。”推理能力則是另一個挑戰(zhàn)。例如，執(zhí)行一個查詢?nèi)蝿?wù)：“幫我找今天下午4點北京到深圳的機票哪一個最便宜”，實際會涉及幾個App比價、分析使用習(xí)慣等復(fù)雜問題?！叭ツ甑?0億參數(shù)模型只能做簡單的任務(wù)拆解，不能做復(fù)雜的推理?！敝車f道。

過去一年vivo針對這些問題進行了優(yōu)化。vivo推出的3B端側(cè)多模態(tài)推理大模型只占2G內(nèi)存，不影響高端機的性能，其次增強了推理能力，可在手機中做意圖中控和任務(wù)拆解的中臺?！敖衲?0億參數(shù)的模型已比去年100億參數(shù)的模型更強，甚至在部分任務(wù)中與云端模型差距僅在2%～3%之間?！敝車f道。這意味著，在文本摘要、多輪對話、意圖識別等場景中，端側(cè)模型已具備實用價值。

智能體跨應(yīng)用調(diào)度受限

隨著端側(cè)算力提升和操作系統(tǒng)AI化，手機中原有的語音助手逐漸向具備執(zhí)行能力的“智能體”演進——它不再局限于回答提問，而是被賦予更強的意圖理解與任務(wù)執(zhí)行能力。廠商希望其能成為真正意義上的個人助理，完成諸如“幫我訂一杯拿鐵，少冰”這類需要調(diào)用外部服務(wù)、理解上下文并執(zhí)行多步操作的實際任務(wù)。

目前AI手機智能助手調(diào)用第三方App，主要有兩條技術(shù)路線：一是通過意圖框架實現(xiàn)。通過API（應(yīng)用程序編程接口）調(diào)用應(yīng)用，實現(xiàn)跨應(yīng)用功能。具體來說，就是手機廠商與App開發(fā)企業(yè)協(xié)商、以合法API的形式接入；二是“純視覺方案”，無需第三方App同意，直接調(diào)用安卓系統(tǒng)的無障礙等系統(tǒng)級權(quán)限。具體做法是，安卓手機廠商以多模態(tài)大模型技術(shù)配合無障礙權(quán)限，先讀取屏幕內(nèi)容，再以模擬用戶點擊的方式代替用戶操作，實現(xiàn)手機智能助手代替用戶接管手機，以達到調(diào)用App功能的目的。

“用戶用手機，手機廠商只占了15%的時長，還有85%的時長是用于開發(fā)者提供服務(wù)，特別是頭部的互聯(lián)網(wǎng)廠商，又在這85%中占了70%～80%，他們的參與度非常高?！敝車f道。這也導(dǎo)致智能體在跨應(yīng)用調(diào)度服務(wù)時處處受限，互聯(lián)網(wǎng)巨頭掌握著絕大多數(shù)用戶服務(wù)接口和數(shù)據(jù)，而手機廠商掌握著操作系統(tǒng)與硬件能力。雙方在安全授權(quán)、用戶隱私和收益分配上的界限尚未明晰。

周圍坦言：“當(dāng)手機的智能體要做任務(wù)的時候，我們只能做自己的功能和應(yīng)用，比如是否流暢、調(diào)亮度、連Wi-Fi等，如果想跨應(yīng)用操作，還需要和對方（互聯(lián)網(wǎng)廠商）討論安全授權(quán)的標(biāo)準(zhǔn)?！?/p>

在他看來，破局的關(guān)鍵在于推動行業(yè)標(biāo)準(zhǔn)的建立?！拔覀儫o法避免地要做用戶習(xí)慣和服務(wù)的分發(fā)，接下來的策略是建好能力，其次，愿意跟我們握手、合作的，就坐下來商量。AI時代到來，是否需要一個新的江湖地位和影響力，就留給時間來回答?！?/p>

封面圖片來源：企業(yè)供圖

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

比特幣閃崩13%，穩(wěn)定幣脫錨，193億美元連環(huán)爆倉！四次“歷史性大跌”暴露加密貨幣內(nèi)在缺陷，德銀報告被“打臉”

返回每經(jīng)網(wǎng)首頁

下一篇文章

浙江，又走到了全國第一

相關(guān)文章