OpenAI 推出 GPT-5.5:重返 AI 工具性能王座

OpenAI 推出 GPT-5.5:重返 AI 工具性能王座

OpenAI 於 2023 年 4 月 23 日正式推出了最新的 GPT-5.5,這款被官方稱為「目前最聰明、最直覺的」旗艦模型,不僅在性能上表現卓越,還在第三方評測中以 60 分的佳績領先主要競爭對手,包括 Anthropic 的 Claude Opus 4.7 和 Google 的 Gemini 3.1 Pro,後者僅獲得 57 分。這次的更新不僅是性能的提升,更顯示出 OpenAI 正在將 ChatGPT、Codex 及 AI 瀏覽器整合為一個統一的入口,明確將戰線延伸至企業生產力的核心。

GPT-5.5 的性能優勢

根據 OpenAI 的數據,GPT-5.5 在多項基準測試中均超越了其前代及主要競爭對手。特別是在 Terminal-Bench 2.0 的複雜命令列工作測試中,GPT-5.5 取得了 82.7% 的高分,遠超過 Claude Opus 4.7 的 69.4% 與 Gemini 3.1 Pro 的 68.5%。此外,在涵蓋 44 項真實職業的 GDPval 知識工作評測中,GPT-5.5 在 84.9% 的情況下達到了與行業專業人員相當的表現。

這些數據顯示,GPT-5.5 在企業應用中具有極大的潛力,能夠提高工作效率,促進生產力。GPT-5.5 Pro 版本在網路搜尋基準 BrowseComp 中也以 90.1% 的成績領先於 Gemini 3.1 Pro 的 85.9%。這些優勢讓 GPT-5.5 成為企業用戶不可或缺的 AI 工具。

新模型的快速迭代與市場影響

OpenAI 的新模型推出頻率明顯加快,從 2025 年 11 月開始的連續更新,到今年 3 月的 GPT-5.4,再到 4 月的 GPT-5.5,短短半年內已經完成了四次重大迭代。OpenAI 的首席科學家 Jakub Pachocki 在記者會上表示,過去兩年的進展相對緩慢,未來將會有顯著的改善,甚至可能會在中期內看到「極其顯著」的進步。

這種快速迭代的趨勢不僅影響了 OpenAI,競爭對手如 Anthropic 也在加速更新其 Claude 系列。這意味著企業客戶在採購決策、整合成本和 API 版本管理上面臨更大的挑戰,同時也對雲端服務商和晶片供應鏈造成新的算力需求壓力。

AI 工具的資安考量

在 GPT-5.5 的發布媒體簡報中,與 Anthropic 的比較成為焦點。有記者詢問 GPT-5.5 是否具備類似 Anthropic 近期公開的資安工具 Mythos 的能力。OpenAI 的研究副總裁 Mia Glaese 回應表示,該公司一直以來都有「穩健的資安策略」,並持續優化模型的部署機制。首席研究官 Mark Chen 也指出,GPT-5.5 在電腦操作、科學與技術研究工作流上都有顯著進步,並預期能在藥物發現等專業研究領域提供協助。

GPT-5.5 的戰略意圖

市場分析認為,GPT-5.5 的真正戰略意圖並不僅僅是追求單一的基準數字領先,而是將「模型能力、企業應用及工作流入口」三者緊密結合。業界觀察人士認為,根據 OpenAI 的新產品推出頻率以及 Anthropic 同步加速的節奏,2026 年整體市場的競爭將會越來越激烈,這將直接影響兩家公司在企業市場的份額分佈。

綜合來看,GPT-5.5 的推出不僅是技術上的進步,更是 OpenAI 在 AI 工具領域中再次奪回性能王座的重要一步。隨著市場競爭的加劇,企業用戶必須密切關注這些新技術的發展,以便在未來的商業環境中保持競爭力。

透過這些新技術,企業可以更有效地利用 AI 工具來提升生產力,並在瞬息萬變的市場中快速應對挑戰。

📰 原文來源

本文彙整自以下 1 篇原始報導。內文中「(來源 N)」可點擊跳到對應條目。

  1. GPT-5.5 重返性能王座,OpenAI 把 ChatGPT 推向「超級 App」 - INSIDE www.inside.com.tw

← 回首頁