12月18日上海的暖意,似乎也延伸到了世博中心。五千多人的會(huì)場(chǎng)座無(wú)虛席,但與兩年前的躁動(dòng)不同,今年這里彌漫著一種深思熟慮后的從容。
這種變化,是行業(yè)走向成熟的標(biāo)志。兩年前,大家討論的是“奇點(diǎn)臨近”、“AGI的想象力”。而今年,過(guò)道里、展臺(tái)前,大家高頻交流的關(guān)鍵詞變成了:“商業(yè)落地”、“推理成本”、“業(yè)務(wù)價(jià)值”。
當(dāng)技術(shù)的光環(huán)逐漸融入產(chǎn)業(yè)的肌理,行業(yè)終于從概念的狂歡走向了務(wù)實(shí)的耕耘,核心議題回歸到了兩個(gè)字:價(jià)值。
就在這種務(wù)實(shí)求真的氛圍里,火山引擎公布了一個(gè)極具分量的數(shù)據(jù):日均調(diào)用量50萬(wàn)億Tokens。

外行看熱鬧,看到的是指數(shù)級(jí)的增長(zhǎng)。內(nèi)行看門道,這其實(shí)是技術(shù)紅利釋放后的“普惠”。當(dāng)Tokens變得像自來(lái)水一樣觸手可及且供給充足時(shí),意味著大模型終于完成了從“高科技奢侈品”到“工業(yè)基礎(chǔ)設(shè)施”的華麗轉(zhuǎn)身。它不再是櫥窗里昂貴的展品,它變成了支撐萬(wàn)丈高樓的堅(jiān)實(shí)底座。
但比起這個(gè)宏大的數(shù)字,我在會(huì)場(chǎng)的角落里,看到了另一個(gè)關(guān)于軟件開發(fā)范式變遷的細(xì)節(jié),可能比50萬(wàn)億這個(gè)數(shù)字更具深遠(yuǎn)的意義,那就是代碼量縮減96%。
這不僅僅是效率的飛躍,更是對(duì)開發(fā)者角色的全新賦能。站在2025年的尾巴上,我們觀察到:以APP為中心的移動(dòng)互聯(lián)網(wǎng)范式,正在被以Agent為中心的智能交互范式所補(bǔ)充和拓展。
這場(chǎng)重構(gòu)的主題只有八個(gè)字:大模型普惠,Agent重構(gòu)。
普惠基建:推理經(jīng)濟(jì)學(xué)的勝利
過(guò)去兩年,企業(yè)的目光往往聚焦在“訓(xùn)練”上。那個(gè)時(shí)候,大家更關(guān)注模型參數(shù)的規(guī)模,關(guān)注基座能力的上限,甚至不少企業(yè)投入重金,希望通過(guò)自建模型來(lái)構(gòu)建技術(shù)壁壘。
但到了2025年底,這種觀念開始升級(jí)。隨著基座模型能力的日益強(qiáng)大和標(biāo)準(zhǔn)化,企業(yè)發(fā)現(xiàn):如何以最優(yōu)成本、最高效率讓模型在業(yè)務(wù)中跑起來(lái),才是新的決勝點(diǎn)。
火山引擎智能算法負(fù)責(zé)人吳迪在大會(huì)主論壇的一席話,道出了行業(yè)的風(fēng)向標(biāo)。他指出,對(duì)于大部分團(tuán)隊(duì)來(lái)說(shuō),構(gòu)建低成本、高吞吐的推理服務(wù),其價(jià)值和難度甚至超過(guò)了模型訓(xùn)練本身。
這是一個(gè)非常深刻的產(chǎn)業(yè)洞察。訓(xùn)練是集中式的攻堅(jiān)戰(zhàn),是一次性的高投入。而推理是碎片化的、全天候的長(zhǎng)跑,考驗(yàn)的是耐力和精細(xì)化運(yùn)營(yíng)能力。
當(dāng)豆包大模型的日均調(diào)用量沖到50萬(wàn)億時(shí),它實(shí)際上是在展示一家云廠商的極致調(diào)度能力。企業(yè)如果選擇自建推理集群,往往需要面對(duì)“高吞吐、低延遲、低成本”這個(gè)著名的“不可能三角”。
試想一下,一家電商企業(yè)為了迎接AI浪潮自建了集群。平時(shí)流量平穩(wěn)時(shí),硬件資源可能存在閑置。可一旦遇到大促流量洪峰,系統(tǒng)的彈性擴(kuò)容能力又面臨巨大挑戰(zhàn),稍有不慎就會(huì)影響用戶體驗(yàn)。更不用說(shuō)隨著模型架構(gòu)的快速迭代,維護(hù)這套系統(tǒng)需要投入大量的專業(yè)SRE人才和持續(xù)的軟硬件適配成本。
火山引擎給出的解法極其務(wù)實(shí)且高效,他們選擇做AI時(shí)代的“電力公司”,提供極致的推理服務(wù)。在Force大會(huì)現(xiàn)場(chǎng),我們看到了這種算力經(jīng)濟(jì)學(xué)的具象化展示。通過(guò)vLLM的深度優(yōu)化、異構(gòu)計(jì)算的智能調(diào)度以及軟硬一體化的極致壓榨,火山引擎將推理成本優(yōu)化到了極致。其推出的AI節(jié)省計(jì)劃,更是實(shí)打?qū)嵉貛椭髽I(yè)降低了近一半的成本。

IDC的數(shù)據(jù)顯示,中國(guó)公有云上每?jī)蓚€(gè)Tokens,就有一個(gè)來(lái)自火山引擎。這說(shuō)明算力正在經(jīng)歷“基礎(chǔ)設(shè)施化時(shí)刻”。
未來(lái)的AI行業(yè)格局會(huì)更加清晰:極少數(shù)像火山引擎這樣的超級(jí)節(jié)點(diǎn),通過(guò)底層技術(shù)突破物理極限,提供像水電一樣穩(wěn)定、便宜的基礎(chǔ)設(shè)施。而海量的應(yīng)用開發(fā)者,不再需要被底層架構(gòu)的復(fù)雜性所困擾,不需要精通CUDA編程,只需要專注于業(yè)務(wù)邏輯本身。
這是AI從實(shí)驗(yàn)室走向產(chǎn)業(yè)深處的必經(jīng)之路,也是技術(shù)普惠的最大紅利。
96%代碼縮減:重塑創(chuàng)造力
如果說(shuō)算力基礎(chǔ)設(shè)施化改變了B端的成本結(jié)構(gòu),那么AgentKit的出現(xiàn)則重塑了C端的開發(fā)體驗(yàn),是對(duì)軟件工程的一次“升維賦能”。
火山引擎總裁譚待展示的數(shù)據(jù)非常振奮人心:開發(fā)同一個(gè)具備復(fù)雜功能的Agent,原先可能需要1500行代碼,現(xiàn)在只需要不到70行。

我們要意識(shí)到,這減少的96%代碼,并不是簡(jiǎn)單的省略,而是對(duì)復(fù)雜度的封裝與抽象。在傳統(tǒng)的軟件工程里,開發(fā)者需要花費(fèi)大量精力去處理狀態(tài)管理、記憶存儲(chǔ)、API調(diào)用、鑒權(quán)機(jī)制等中間件邏輯。
現(xiàn)在,AgentKit將這些通用能力內(nèi)化為了模型的“本能”。
首先是記憶能力的自動(dòng)化。過(guò)去,為了讓助手記住用戶的偏好,開發(fā)者需要設(shè)計(jì)復(fù)雜的數(shù)據(jù)庫(kù)結(jié)構(gòu)。現(xiàn)在,AgentKit自帶“海馬體”,模型能自動(dòng)管理長(zhǎng)短期記憶,像人一樣自然地記住交互歷史,讓開發(fā)者從繁瑣的數(shù)據(jù)讀寫中解脫出來(lái)。
其次是工具調(diào)用的智能化。過(guò)去,對(duì)接外部API需要編寫大量的適配代碼。現(xiàn)在,大模型可以像人類使用工具一樣,通過(guò)閱讀標(biāo)準(zhǔn)化的描述文檔,智能地調(diào)用外部系統(tǒng),極大地降低了系統(tǒng)集成的門檻。
最后是交互邏輯的靈動(dòng)化。過(guò)去,業(yè)務(wù)流程往往是固定的。現(xiàn)在,模型通過(guò)意圖識(shí)別能自動(dòng)規(guī)劃路徑,靈活應(yīng)對(duì)用戶的個(gè)性化需求。
這意味著“實(shí)現(xiàn)功能”的門檻降低了,但“創(chuàng)造價(jià)值”的天花板被打開了。
對(duì)于“科技不許冷”的讀者,尤其是技術(shù)人員而言,這是一個(gè)激動(dòng)人心的變化。這并不意味著開發(fā)者角色的弱化,反而是價(jià)值的躍遷。競(jìng)爭(zhēng)的維度將從誰(shuí)的代碼寫得更熟練,轉(zhuǎn)向誰(shuí)對(duì)業(yè)務(wù)場(chǎng)景的理解更深刻、誰(shuí)的架構(gòu)設(shè)計(jì)更精妙。
未來(lái)的軟件開發(fā),將不再是重復(fù)造輪子,而是對(duì)業(yè)務(wù)目標(biāo)與邏輯流程的頂層設(shè)計(jì)。
這種變化帶來(lái)了巨大的機(jī)遇。當(dāng)一個(gè)懂業(yè)務(wù)的銷售主管,能用不到70行的代碼構(gòu)建出一個(gè)具備長(zhǎng)期記憶、能熟練調(diào)用企業(yè)ERP系統(tǒng)的智能體時(shí),企業(yè)的創(chuàng)新活力將被徹底激發(fā)。我們不再局限于一個(gè)個(gè)孤立的APP,而是構(gòu)建起能夠穿梭在各種數(shù)據(jù)孤島之間、高效協(xié)作的Agent網(wǎng)絡(luò)。
根據(jù)火山引擎分享的數(shù)據(jù),2024年一個(gè)企業(yè)內(nèi)部可能只有50多個(gè)簡(jiǎn)單的Agent,但到了2025年,這個(gè)數(shù)字已經(jīng)增長(zhǎng)到了200多個(gè)。它們就像是新時(shí)代的數(shù)字員工,聽得懂人話,且高效專業(yè)。Agent正在成為企業(yè)數(shù)字化轉(zhuǎn)型的核心載體,讓開發(fā)者能夠聚焦于最具創(chuàng)造性的工作。
多模態(tài):從Demo到生產(chǎn)力
多模態(tài)技術(shù)一直是行業(yè)的焦點(diǎn),而直到2025年底,我們欣喜地看到它真正具備了“生產(chǎn)級(jí)”的能力。
之前的多模態(tài)技術(shù)多處于探索期,而這次發(fā)布的Seedance 1.5 pro和豆包1.8,標(biāo)志著技術(shù)開始全面服務(wù)于嚴(yán)肅的商業(yè)流程,解決了“可用性”和“可控性”的關(guān)鍵難題。
Seedance 1.5 pro攻克了視頻生成領(lǐng)域極具挑戰(zhàn)的音畫同步難題。在現(xiàn)場(chǎng)演示中,視頻人物在四川話和西班牙語(yǔ)之間無(wú)縫切換,口型完美匹配。這種流暢自然的表現(xiàn),意味著內(nèi)容生產(chǎn)效率的質(zhì)變。
這對(duì)于企業(yè)來(lái)說(shuō)是巨大的利好。出海企業(yè)不再需要為每個(gè)語(yǔ)種單獨(dú)拍攝素材,只需一段文本,就能生成幾十種語(yǔ)言的本地化營(yíng)銷視頻,極大地提升了全球化營(yíng)銷的效率。泛娛樂(lè)行業(yè)也能更高效地生成高質(zhì)量的虛擬互動(dòng)內(nèi)容,打造出能面對(duì)面聊天、表情生動(dòng)、口型精準(zhǔn)的虛擬伙伴。

豆包1.8則把單次視頻理解幀數(shù)翻倍到了1280幀。這意味著AI擁有了“長(zhǎng)視頻深度理解能力”。
以前的AI只能捕捉片段,而現(xiàn)在的豆包1.8能理解整集電視劇、整場(chǎng)會(huì)議視頻的連貫邏輯。在通用智能體測(cè)評(píng)集BrowserComp上,豆包1.8的表現(xiàn)全球領(lǐng)先。
試想一下,在未來(lái)的產(chǎn)品質(zhì)檢流水線上,AI不再是簡(jiǎn)單比對(duì),而是像經(jīng)驗(yàn)豐富的質(zhì)檢員一樣,關(guān)注長(zhǎng)達(dá)數(shù)小時(shí)的監(jiān)控視頻,精準(zhǔn)識(shí)別出那一秒的操作偏差。這才是多模態(tài)AI真正的產(chǎn)業(yè)價(jià)值——讓AI具備“時(shí)間維度的感知力”和“真實(shí)的表達(dá)力”。
當(dāng)AI能聽懂、能看懂、能表達(dá)時(shí),人機(jī)交互的界面就從屏幕延展到了我們身處的環(huán)境本身。這不僅是體驗(yàn)的升級(jí),更是生產(chǎn)力的全面釋放。
信任閉環(huán):護(hù)航核心業(yè)務(wù)
數(shù)據(jù)規(guī)模炸裂,工具能力進(jìn)化,但企業(yè)在擁抱AI時(shí),依然將安全視為重中之重。
企業(yè)端的理性在于,他們引入AI不是為了趕時(shí)髦,而是為了極其務(wù)實(shí)的降本增效。像比亞迪、中石油、海底撈這些行業(yè)巨頭,都在積極利用AI重構(gòu)業(yè)務(wù)流程。
以中國(guó)石油勘探開發(fā)研究院為例,他們利用火山安全運(yùn)營(yíng)智能體,實(shí)現(xiàn)了對(duì)海量安全告警的AI自動(dòng)化值守。結(jié)果顯示,無(wú)效告警被智能過(guò)濾了八成以上,運(yùn)營(yíng)效率提升了10倍。

這些成功案例的背后,是安全信任機(jī)制的有力支撐。火山引擎此次重點(diǎn)強(qiáng)調(diào)的機(jī)密計(jì)算技術(shù),正是為了打通企業(yè)上云的“信任閉環(huán)”。
機(jī)密計(jì)算建立了一個(gè)高標(biāo)準(zhǔn)的加密環(huán)境,數(shù)據(jù)在傳輸、存儲(chǔ)甚至計(jì)算的全生命周期中都處于加密保護(hù)之下,就像是一個(gè)堅(jiān)不可摧的保險(xiǎn)箱,連云廠商自己都無(wú)法窺探客戶的數(shù)據(jù)內(nèi)容。這實(shí)現(xiàn)了真正的數(shù)據(jù)“可用不可見(jiàn)”。
這道信任基石的建立,讓Agent不再局限于外圍輔助工作,而是有能力進(jìn)入財(cái)務(wù)審批、供應(yīng)鏈調(diào)度等核心生產(chǎn)系統(tǒng)。安全底座的夯實(shí),讓AI從“工具”進(jìn)化為值得信賴的“伙伴”。這種信任機(jī)制的完善,是Agent能夠全面接管核心業(yè)務(wù)的前提。
最后
站在2025年的終點(diǎn),我們看到的是技術(shù)理性的回歸和應(yīng)用深度的拓展。
APP依然繁榮,但它不再是唯一的交互形態(tài)。代碼依然重要,但它的價(jià)值正在向設(shè)計(jì)與創(chuàng)新遷移。對(duì)于真正的創(chuàng)造者來(lái)說(shuō),這場(chǎng)由Agent驅(qū)動(dòng)的變革,為開發(fā)者的能力成長(zhǎng)、企業(yè)的架構(gòu)升級(jí)提供了前所未有的廣闊空間。
AgentKit降低了創(chuàng)新門檻,推理服務(wù)優(yōu)化了運(yùn)營(yíng)成本,多模態(tài)技術(shù)提升了交互體驗(yàn)。我們終于可以從繁瑣的底層實(shí)現(xiàn)中解脫出來(lái),去思考那個(gè)最根本的問(wèn)題:我們?nèi)绾卫肁I為用戶創(chuàng)造更大的價(jià)值?
2026年,行業(yè)將進(jìn)入精耕細(xì)作的新階段,這將是一場(chǎng)潤(rùn)物細(xì)無(wú)聲但波瀾壯闊的Agent遷徙。在這場(chǎng)變革中,保持敏銳,擁抱進(jìn)化,是“科技不許冷”篤定的態(tài)度。
畢竟,當(dāng)你的同行正在用70行代碼構(gòu)建超級(jí)助手,準(zhǔn)備在2026年大展宏圖時(shí),這正是我們通過(guò)技術(shù)創(chuàng)新,重塑競(jìng)爭(zhēng)力的最佳時(shí)刻。
#2025頂端人氣創(chuàng)作者 ##2025財(cái)富新發(fā)現(xiàn)#?


