2025-10-11 22:33:13
生成式AI浪潮下,端側(cè)AI成智能手機技術(shù)競賽新焦點。vivo等廠商轉(zhuǎn)向開發(fā)體量更輕的端側(cè)模型,提升實用性能和功耗控制。端側(cè)模型小型化漸成行業(yè)共識,為手機消費帶來新增長契機。但安卓廠商落地端側(cè)大模型面臨兼容、內(nèi)存占用和推理能力等挑戰(zhàn)。此外,智能體跨應(yīng)用調(diào)度受限,破局關(guān)鍵在于推動行業(yè)標(biāo)準(zhǔn)建立。
每經(jīng)記者|王晶 每經(jīng)編輯|張益銘
在生成式AI(人工智能)席卷全球的浪潮中,智能手機正成為AI落地的關(guān)鍵陣地。從蘋果推出Apple Intelligence、三星發(fā)布Gauss(高斯)、榮耀帶來MagicGUI大模型,再到vivo的藍心大模型,端側(cè)AI正成為行業(yè)新一輪技術(shù)競賽的焦點。相比云側(cè)AI,端側(cè)AI既能保護用戶隱私、降低計算與能耗成本,還能提供類似個人助手的交互體驗。
然而,當(dāng)AI從云端遷移到終端,技術(shù)與商業(yè)的難題也隨之而來。過去兩年,廠商們熱衷于將大模型直接嵌入手機操作系統(tǒng),并將參數(shù)規(guī)模當(dāng)成競逐的焦點。比如,vivo曾在2023年實現(xiàn)130億參數(shù)的“藍心大模型”在端側(cè)跑通,并讓70億參數(shù)模型在端側(cè)落地。
然而在今年10月10日舉辦的vivo開發(fā)者大會上,vivo副總裁、vivo AI全球研究院院長周圍給出了一個新的發(fā)展方向——放棄對“通用人工智能”的追逐,轉(zhuǎn)而推出體量更輕的3B端側(cè)多模態(tài)推理大模型,該模型僅占用手機2GB內(nèi)存、功耗約750毫安,卻能在推理能力上超過此前的7B甚至10B模型,性能接近云端模型。“做千億級模型需要兩萬卡以上的集群,光設(shè)備投入就20多億元,這還不包括每年數(shù)億元的電費?!怼ㄓ萌斯ぶ悄懿惶F(xiàn)實?!?/p>
vivo副總裁周圍 企業(yè)供圖
事實上,端側(cè)模型的小型化正逐漸成為行業(yè)共識。蘋果的Apple Intelligence同樣采用30億參數(shù)的設(shè)計,可以在設(shè)備上完成文本摘要、信息提取與跨應(yīng)用操作等任務(wù)。這意味著,廠商們正在從“堆參數(shù)、拼算力”的競爭,轉(zhuǎn)向關(guān)注模型在端側(cè)實用性能、功耗控制的理性階段。
端側(cè)大模型落地后,越來越多消費者開始應(yīng)用大模型,這也有望為手機消費帶來新的增長契機。華福證券在研報中稱,端側(cè)大模型將成為消費電子品牌廠商提升個性化用戶體驗,打造產(chǎn)品差異化競爭力的重要方向,具備更強AI能力的終端新品推出或?qū)酉M電子見底復(fù)蘇。
在vivo AI產(chǎn)品總經(jīng)理關(guān)巖冰看來,真正實現(xiàn)個人化智能的核心在于端側(cè)。“只有端側(cè)模型才能實時分析用戶的數(shù)據(jù)、洞察需求,感知屏幕內(nèi)容、理解使用意圖等?!边@也正是蘋果在“Apple Intelligence”中強調(diào)的方向,即在端側(cè)完成敏感數(shù)據(jù)處理,保障隱私,同時提供個性化服務(wù)。然而,與蘋果封閉的體系不同,安卓陣營的廠商在落地端側(cè)大模型時要面臨眾多挑戰(zhàn)。
“云端模型的CPU通?;赬86架構(gòu),而手機上是ARM的內(nèi)核,此外還要兼容不同芯片廠的NPU指令集,如何把原來生態(tài)里指令集轉(zhuǎn)成手機上的指令集,這里最大的障礙是算子?!敝車f道。據(jù)他介紹,vivo早在2017年便在美國設(shè)立AI研究院,組建專門的算子團隊,目前該團隊已擴展至幾十人,聚焦把模型轉(zhuǎn)成端側(cè)化的過程。
算子之外,內(nèi)存占用同樣是制約端側(cè)大模型落地的關(guān)鍵瓶頸。周圍舉例稱:“以往7B模型需要占用3.5G內(nèi)存,而8G手機是中高端機型的主要配置,一個大模型就占掉4個G內(nèi)存,一下讓高端機變成了低端機。”推理能力則是另一個挑戰(zhàn)。例如,執(zhí)行一個查詢?nèi)蝿?wù):“幫我找今天下午4點北京到深圳的機票哪一個最便宜”,實際會涉及幾個App比價、分析使用習(xí)慣等復(fù)雜問題?!叭ツ甑?0億參數(shù)模型只能做簡單的任務(wù)拆解,不能做復(fù)雜的推理?!敝車f道。
過去一年vivo針對這些問題進行了優(yōu)化。vivo推出的3B端側(cè)多模態(tài)推理大模型只占2G內(nèi)存,不影響高端機的性能,其次增強了推理能力,可在手機中做意圖中控和任務(wù)拆解的中臺?!敖衲?0億參數(shù)的模型已比去年100億參數(shù)的模型更強,甚至在部分任務(wù)中與云端模型差距僅在2%~3%之間?!敝車f道。這意味著,在文本摘要、多輪對話、意圖識別等場景中,端側(cè)模型已具備實用價值。
隨著端側(cè)算力提升和操作系統(tǒng)AI化,手機中原有的語音助手逐漸向具備執(zhí)行能力的“智能體”演進——它不再局限于回答提問,而是被賦予更強的意圖理解與任務(wù)執(zhí)行能力。廠商希望其能成為真正意義上的個人助理,完成諸如“幫我訂一杯拿鐵,少冰”這類需要調(diào)用外部服務(wù)、理解上下文并執(zhí)行多步操作的實際任務(wù)。
目前AI手機智能助手調(diào)用第三方App,主要有兩條技術(shù)路線:一是通過意圖框架實現(xiàn)。通過API(應(yīng)用程序編程接口)調(diào)用應(yīng)用,實現(xiàn)跨應(yīng)用功能。具體來說,就是手機廠商與App開發(fā)企業(yè)協(xié)商、以合法API的形式接入;二是“純視覺方案”,無需第三方App同意,直接調(diào)用安卓系統(tǒng)的無障礙等系統(tǒng)級權(quán)限。具體做法是,安卓手機廠商以多模態(tài)大模型技術(shù)配合無障礙權(quán)限,先讀取屏幕內(nèi)容,再以模擬用戶點擊的方式代替用戶操作,實現(xiàn)手機智能助手代替用戶接管手機,以達到調(diào)用App功能的目的。
“用戶用手機,手機廠商只占了15%的時長,還有85%的時長是用于開發(fā)者提供服務(wù),特別是頭部的互聯(lián)網(wǎng)廠商,又在這85%中占了70%~80%,他們的參與度非常高?!敝車f道。這也導(dǎo)致智能體在跨應(yīng)用調(diào)度服務(wù)時處處受限,互聯(lián)網(wǎng)巨頭掌握著絕大多數(shù)用戶服務(wù)接口和數(shù)據(jù),而手機廠商掌握著操作系統(tǒng)與硬件能力。雙方在安全授權(quán)、用戶隱私和收益分配上的界限尚未明晰。
周圍坦言:“當(dāng)手機的智能體要做任務(wù)的時候,我們只能做自己的功能和應(yīng)用,比如是否流暢、調(diào)亮度、連Wi-Fi等,如果想跨應(yīng)用操作,還需要和對方(互聯(lián)網(wǎng)廠商)討論安全授權(quán)的標(biāo)準(zhǔn)?!?/p>
在他看來,破局的關(guān)鍵在于推動行業(yè)標(biāo)準(zhǔn)的建立?!拔覀儫o法避免地要做用戶習(xí)慣和服務(wù)的分發(fā),接下來的策略是建好能力,其次,愿意跟我們握手、合作的,就坐下來商量。AI時代到來,是否需要一個新的江湖地位和影響力,就留給時間來回答?!?/p>
封面圖片來源:企業(yè)供圖
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP