美團開源1.6兆參數AI模型，採用國產晶片訓練

美團的LongCat-2.0是首個完全在中國國產GPU叢集上訓練的兆級參數模型，這項里程碑挑戰了外界對中國依賴輝達硬體的既定看法，並對西方AI實驗室形成定價壓力。

美團在6月底宣布，已發布並開源LongCat-2.0，這款模型擁有1.6兆個參數、平均啟用參數為480億，且原生支援100萬個token的上下文長度，完全在5萬張國產GPU組成的叢集上從零開始訓練完成。

「這證明了中國AI實驗室現在可以在不依賴輝達硬體的情況下，訓練出前沿規模的模型，」一位知情人士表示。由於細節尚未公開，該人士要求匿名。

LongCat-2.0採用混合專家架構，每個token會啟用330億到560億個參數——這種設計使其推理成本接近一個480億參數的密集型模型，同時保有1.6兆參數系統的容量。其100萬token的上下文視窗與西方前沿實驗室提供的最長規格相當。美團尚未披露基準測試分數、訓練成本或推理定價。

此次開源發布使美團直接與中國AI實驗室智譜AI和月之暗面展開競爭，後兩者的GLM 5.2和Kimi K2.7 Code模型近幾週已在企業領域獲得採用。這也對Anthropic和OpenAI等西方實驗室形成壓力，它們的定價能力取決於能否維持與開源權重替代方案之間的性能差距。

國產GPU的突破

訓練一個兆級參數模型需要數萬張GPU並行運轉數週——這項任務通常需要配備專有NVLink互連技術的輝達H100或B200叢集。美團的5萬張GPU叢集使用的是國產加速器，但該公司未具體說明晶片供應商或架構。華為的昇騰910B和910C是最有可能的候選，因為它們是目前唯一能夠大規模量產的中國產AI晶片。

這項里程碑之所以重要，是因為美國出口管制（最近一次收緊是在2025年1月）限制了輝達H100和B200對中國的銷售。如果美團能在國產晶片上訓練出具競爭力的兆級參數模型，這意味著中國實驗室已找到因應之道——可能加速中國AI發展進程，使其擺脫對西方供應鏈的依賴。

對西方實驗室的定價壓力

LongCat-2.0進入市場之際，中國的開源權重模型已逐漸站穩腳跟。智譜AI於6月13日以MIT授權發布的GLM 5.2，每百萬輸入token收費1.40美元，每百萬輸出token收費4.40美元——約為Anthropic Opus 4.8價格的三分之一到六分之一。月之暗面於6月12日發布的Kimi K2.7 Code也採取類似的定價策略。Coinbase於6月27日披露，其工程師目前已預設使用這兩個模型，AI支出因此減少50%。

美團尚未公布LongCat-2.0的定價或基準測試成績，因此無法進行直接比較。該公司決定以未指定授權方式開源此模型，顯示其將以可及性而非專有優勢參與競爭。對美團自身而言，這款模型代表一項戰略資產：這家外送與本地生活服務巨頭可在內部部署LongCat-20，應用於推薦系統、物流優化和客服自動化，從而減少對第三方AI供應商的依賴。

對投資者的影響

開源權重AI市場正沿著地緣政治界線逐步分化。西方企業如今面臨兩難：是選擇美國實驗室成本較高的前沿模型，還是價格更低但帶有監管和來源風險的中國替代方案。美團的加入提供了另一個選項——這款模型由一家上市公司在國產硬體上訓練，且未直接受到美國出口管制的影響。

美團股票在香港交易所上市。該公司在財務披露中並未單獨列出AI支出，但根據其最新年報，2025年年度研發支出約為211億元人民幣（約29億美元）。LongCat-2.0的訓練成本可能佔其中相當大的一部分，但該公司未披露具體金額。

本文僅供資訊參考，不構成投資建議。