初探 OpenAI GPT-4.1 性能:AI 編程能力大增,但谷歌 Gemini 依然稱王
2025-04-16 15:51:20 小編:鑫昌軟件園
本站 4 月 16 日消息,科技媒體 bleepingcomputer 昨日(4 月 15 日)發布博文,報道稱 OpenAI 最新發布的 GPT-4.1 系列模型,其性能相比 GPT-4o 雖然實現重大飛躍,但多項跑分未能超越谷歌的 Gemini 系列。
本站昨日報道,OpenAI 公司發布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,官方公布的跑分數據來看,這些模型在編程方面的能力,遠超 GPT-4o 及 GPT-4o mini。
例如在 SWE-bench Verified 跑分中,GPT-4o 的得分為 21.4%,GPT-4.5 的得分為 26.6%,而 GPT-4.1 的得分為 54.6%。
盡管性能有較大提升,不過根據多位專家測試,相比較谷歌的 Gemini 系列,GPT-4.1 對比中卻顯露劣勢。
根據 Stagehand(一款生產級瀏覽器自動化框架)發布的基準數據,Gemini 2.0 Flash 的錯誤率僅為 6.67%,精確匹配率高達 90%,且價格低廉、速度更快。相比之下,GPT-4.1 的錯誤率高達 16.67%,成本更是 Gemini 2.0 Flash 的 10 倍以上。
此外,哈佛大學 RNA 科學家 Pierre Bongrand 提供的數據也指出,GPT-4.1 的性價比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等競品。
在編碼專項測試中,GPT-4.1 同樣未能占據上風。Aider Polyglot 的測試結果顯示,GPT-4.1 的編碼得分僅為 52%,而 Gemini 2.5 則以 73% 的成績遙遙領先。
值得注意的是,GPT-4.1 被歸類為非推理模型(non-reasoning model),但其編碼能力仍屬行業頂尖。
- 猜你喜歡
-
城堡攻擊2雙人對戰官方正版91.94MB手游下載
-
巨型噴氣式飛行模擬器漢化版88.22MB手游下載
-
全球航空飛行2025全飛機解鎖版1.3GB手游下載
-
誅神世界火影跑酷0.05折版475.81MB手游下載
-
全民泡泡超人手游官方版1.8GB手游下載
-
SD高達G世代永恒國際版670.13MB手游下載
-
封神開天官方正版681.63MB手游下載
-
托法斯賽車無限金幣版799.7MB手游下載
-
沙盒與副本英勇之地官方正版10.57MB手游下載
- 相關手機游戲
-
亞刻奧特曼變身器模擬器最新版1.19GB手游下載
-
超級房車賽傳奇豪華版1.2GB手游下載
-
塞爾達傳說時之笛手機版153.4MB手游下載
-
大航海威加九游渠道服50.35MB手游下載
-
同城游五十K手機版139.23MB手游下載
-
永夜降臨復蘇0.1折版537.3MB手游下載
-
三國問鼎山河九游渠道服475.35MB手游下載
-
這個我在行破解版4.23MB手游下載
-
極限打擊X國際版275.85MB手游下載
- 推薦鑫昌秘籍
- 初探 OpenAI GPT-4.1 性能:AI 編程能力大增,但谷歌 Gemini 依然稱王
- 廣汽傳祺影豹 R-Style 勁享版轎車上市,補貼后一口價 8.3 萬元
- Meta 自辯非壟斷:蘋果 iMessage 使用率高達 88.39%,斷層式領先 Instagram 等產品
- 國際首個:我國成功構建地月空間三星星座
- 直面 OpenAI,Anthropic 正籌備“最快本月”推出語音交互功能
- 技嘉推出 RTX 5060 OC Low Profile 8G 半高顯卡:面向 SFF 市場,長度僅 182mm
- 銀聯國際與越南國家支付公司等達成合作,推進中越跨境二維碼支付互聯互通
- 英特爾力推筆記本模塊化,維修升級更簡單
- OpenAI 的 GPT - 4.1 無安全報告,AI 安全透明度再遭質疑
- 華碩 TUF Gaming A14 游戲本更新 2025 款:14 英寸緊湊設計,配 RTX 5060
- 最新手機精選
-
櫻桃視頻直播官方版下載2025-01-28手游下載 | 88.51MB
-
TFS飛行模擬器破解版2025-02-14手游下載 | 86.66MB
-
Poppy Playtime第五章正版2025-01-15手游下載 | 603MB
-
花心直播軟件在哪里下載安卓版最新版2025-03-15手游下載 | 85.77MB
-
月夜直播免費版下載觀看下載官方版2025-02-09手游下載 | 55.74MB
-
挺好tvbox電視版2025-02-13手游下載 | 39.09MB