AI 幻覺有了價值 1 億美元的答案——而這來自兩位前微軟研究員。
AI 幻覺有了價值 1 億美元的答案——而這來自兩位前微軟研究員。

AI 幻覺有了價值 1 億美元的答案——而這來自兩位前微軟研究員。
由兩位前微軟研究員創立的 AI 新創 Scaled Cognition 已完成 1 億美元的 A 輪募資,旨在將一種專為消除企業 AI 應用中幻覺問題而設計的模型架構商業化。
「這些前沿模型就像是精神分裂的天才——它們能創造出令人驚嘆的答案,但當你問同一個問題時,卻可能得到一個完全不一樣、甚至不正確的回答,」Scaled Cognition 執行長 Dan Roth 表示。
該公司的 Agentic Pretrained Transformer(APT)在傳統 token 序列之外,還能預測結構化物件(例如程式碼與系統查詢),這與大型語言模型(LLM)追求語言流暢度卻不驗證事實正確性的做法截然不同。Roth 表示,這種方法在最狹義的企業領域中表現最佳,因為在這些領域中,可能的查詢範圍是有限的。
7.5 億美元的估值以及來自 Khosla Ventures(矽谷最知名的 AI 投資機構之一)的支持,顯示市場對以可靠性為核心的 AI 基礎設施需求日益高漲。雲端客服平台 Genesys 已在其 Genesys Cloud 平台中使用 APT 來驅動虛擬代理人功能。
OpenAI、Anthropic 及 Google 的大型語言模型在 MMLU 和 HumanEval 等基準測試中,通用知識任務表現超過 90%。然而,這些模型也可能產出聽起來自信但事實錯誤的答案——在監管嚴格的產業中,處方籤上一個數字的錯誤就可能引發法律責任,這種缺陷是不可接受的。「一個錯誤就可能造成災難性後果,」Roth 描述了一個自動化醫療保健代理人,「它連處方號碼中的一個數字都不能產生幻覺。」
Khosla Ventures 創始合夥人 Vinod Khosla 表示,Scaled Cognition 的架構透過將查詢的不同部分路由到最合適的系統,來因應不同可靠性需求。「對於系統中那些需要真正可靠性、不能產生幻覺的部分,它是一個獨立的模型,」他表示。
大規模驗證 AI 生成內容的正確性,是企業採用的關鍵障礙。加州大學柏克萊分校電腦科學教授、Databricks 聯合創辦人 Ion Stoica 表示,人類可以輕鬆檢查幾行程式碼,但驗證數十萬行程式碼生成的內容幾乎是不可能的。「這使得程式化的可靠性成為企業系統的絕對必要條件,」他表示。
Scaled Cognition 計劃利用這筆資金擴充研究團隊並加速企業部署。這家總部位於加州山景城的初創公司由 Roth 及自然語言處理研究員、加州大學柏克萊分校 AI 教授 Dan Klein 共同創立。兩人曾於 2018 年將他們共同創立的初創公司 Semantic Machines 出售給微軟。該公司將客戶體驗作為首個目標市場,這是一個 AI 代理人每天處理數百萬次互動的領域,準確性直接影響客戶留存率和法規遵循。Genesys 對 APT 的採用為該技術的商業可行性提供了早期證明。
對投資者而言,押注 Scaled Cognition 反映了更廣泛的投資邏輯:隨著企業從生成式 AI 的實驗階段邁向實際應用,能夠信任模型輸出將成為競爭優勢。解決可靠性問題的公司有望在企業 AI 市場中佔據不成比例的份額。Gartner 預測,到 2027 年,企業 AI 支出將達到三千億美元。Scaled Cognition 的狹域領域方法可能使其總可達市場(TAM)比通用模型更小,但企業願意為可驗證的正確輸出支付溢價,這項優勢可望抵消其規模限制。
本文僅供資訊參考,不構成投資建議。