初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王-鑫昌軟件園

鑫昌軟件園

游戲下載軟件下載游戲攻略

首頁手游下載鑫昌秘籍鑫昌資訊

鑫昌軟件園 → 鑫昌秘籍 → 初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

2025-04-16 15:51:20 小編：鑫昌軟件園

本站 4 月 16 日消息，科技媒體 bleepingcomputer 昨日（4 月 15 日）發布博文，報道稱 OpenAI 最新發布的 GPT-4.1 系列模型，其性能相比 GPT-4o 雖然實現重大飛躍，但多項跑分未能超越谷歌的 Gemini 系列。

本站昨日報道，OpenAI 公司發布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，官方公布的跑分數據來看，這些模型在編程方面的能力，遠超 GPT-4o 及 GPT-4o mini。

例如在 SWE-bench Verified 跑分中，GPT-4o 的得分為 21.4%，GPT-4.5 的得分為 26.6%，而 GPT-4.1 的得分為 54.6%。

盡管性能有較大提升，不過根據多位專家測試，相比較谷歌的 Gemini 系列，GPT-4.1 對比中卻顯露劣勢。

根據 Stagehand（一款生產級瀏覽器自動化框架）發布的基準數據，Gemini 2.0 Flash 的錯誤率僅為 6.67%，精確匹配率高達 90%，且價格低廉、速度更快。相比之下，GPT-4.1 的錯誤率高達 16.67%，成本更是 Gemini 2.0 Flash 的 10 倍以上。

此外，哈佛大學 RNA 科學家 Pierre Bongrand 提供的數據也指出，GPT-4.1 的性價比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等競品。

在編碼專項測試中，GPT-4.1 同樣未能占據上風。Aider Polyglot 的測試結果顯示，GPT-4.1 的編碼得分僅為 52%，而 Gemini 2.5 則以 73% 的成績遙遙領先。

值得注意的是，GPT-4.1 被歸類為非推理模型（non-reasoning model），但其編碼能力仍屬行業頂尖。

猜你喜歡

城堡攻擊2雙人對戰官方正版91.94MB手游下載
巨型噴氣式飛行模擬器漢化版88.22MB手游下載
全球航空飛行2025全飛機解鎖版1.3GB手游下載
誅神世界火影跑酷0.05折版475.81MB手游下載
全民泡泡超人手游官方版1.8GB手游下載
SD高達G世代永恒國際版670.13MB手游下載
封神開天官方正版681.63MB手游下載
托法斯賽車無限金幣版799.7MB手游下載
沙盒與副本英勇之地官方正版10.57MB手游下載

相關手機游戲

亞刻奧特曼變身器模擬器最新版1.19GB手游下載
超級房車賽傳奇豪華版1.2GB手游下載
塞爾達傳說時之笛手機版153.4MB手游下載
大航海威加九游渠道服50.35MB手游下載
同城游五十K手機版139.23MB手游下載
永夜降臨復蘇0.1折版537.3MB手游下載
三國問鼎山河九游渠道服475.35MB手游下載
這個我在行破解版4.23MB手游下載
極限打擊X國際版275.85MB手游下載

推薦鑫昌秘籍

最新手機精選

櫻桃視頻直播官方版下載2025-01-28手游下載 | 88.51MB
TFS飛行模擬器破解版2025-02-14手游下載 | 86.66MB
Poppy Playtime第五章正版2025-01-15手游下載 | 603MB
花心直播軟件在哪里下載安卓版最新版2025-03-15手游下載 | 85.77MB
月夜直播免費版下載觀看下載官方版2025-02-09手游下載 | 55.74MB
挺好tvbox電視版2025-02-13手游下載 | 39.09MB

九九99久久精品午夜剧场免费