无码内射中文字幕岛国片_国产精品无码一区二区三区四区_福利姬液液酱喷水_人妻无码中文字幕_国产精品无码翘臀在线看_色爱综合激情五月激情_日韩美女人体艺术_男人边做边吃奶头视频_欧美黑人又粗又大高潮喷水_亚洲精品无码高潮喷水在线

登錄

首頁(yè) > 今日新聞 > GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

發(fā)布時(shí)間：2025-09-23 09:39:21

編程大考，全球頂尖LLM奪金，真無(wú)敵了？最難編碼基準(zhǔn)SWE-Bench Pro出世，匯集了平均超100行代碼的難題。沒想到，最能打的LLM紛紛潰敗，GPT-5僅拿下23.3%高分。

繼IMO 2025登頂后，谷歌、OpenAI的模型，再一次拿下了ICPC金牌。

ICPC，被公認(rèn)為全球最具挑戰(zhàn)的大學(xué)生編程競(jìng)賽之一。

OpenAI和谷歌不僅解決了全部12題，還在人類選手中位列第一，難道AI編程真能所向披靡了嗎？

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

最新一項(xiàng)基準(zhǔn)測(cè)試，直接打臉了全世界的頂尖模型。

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

它就是SWE-Bench Pro，專為評(píng)估AI編程智能體而生的新一代基準(zhǔn)測(cè)試，直面真實(shí)企業(yè)級(jí)工程任務(wù)。

相較于前代SWE-Bench，Pro版本升級(jí)帶來(lái)了三大突破：

任務(wù)難度全面提升
抗數(shù)據(jù)污染能力更強(qiáng)
無(wú)限逼近真實(shí)代碼庫(kù)

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

這一版，堪稱編碼中的「最后人類考試」。在實(shí)際測(cè)試（公開集）中，頂尖模型幾乎潰敗。

GPT-5雖拿下了第一，但成績(jī)僅有23.3%，Claude Opus 4.1以22.7%得分位居第二。

其他模型更是沒有一個(gè)能打的，得分全部低于15%。

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

這意味著，在更貼近真實(shí)世界的編程任務(wù)中，LLM的長(zhǎng)程編碼能力仍是短板。

最新21頁(yè)技術(shù)論文，詳細(xì)公開了SWE-Bench Pro設(shè)計(jì)細(xì)節(jié)。

GPT-5僅23.3%，全球AI集體掛科！地獄級(jí)編程考試，奪金神話破滅

【返回列表】

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為“觀經(jīng)濟(jì)用戶上傳并發(fā)布"，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

下一篇:重磅！英偉達(dá)1000億美元投資OpenAI，奧特曼爆買500萬(wàn)塊GPU

上一篇:阿里速賣通轉(zhuǎn)移戰(zhàn)略重心，要和亞馬遜在全球搶奪頭部品牌

今日新聞更多>>

上新！17元高鐵盒飯，門店現(xiàn)炒，送餐到座李佳琦雙11賣的電動(dòng)牙刷竟然是兩年前生產(chǎn)？冬天室溫多少最合適？記住這個(gè)數(shù)字 NBA超級(jí)星期六,12場(chǎng)連播!10:00湖人戰(zhàn)森林狼!CCTV5播開拓者戰(zhàn)勇士＂吃苦幼兒園＂為何能走紅 87歲大爺騎三輪送桶裝水，網(wǎng)友捐款送推車，當(dāng)?shù)鼗貞?yīng)→ 新疆一汽修工因撞臉成龍走紅，追求顏值容易陷入誤區(qū)與偏見萬(wàn)元衣物被88歲老人9元賣掉，法院判賠800元引熱議

房產(chǎn)家居更多>>

敦泰電子：引領(lǐng)車用顯示觸控技術(shù)發(fā)展，助力智能座艙時(shí)代當(dāng)汽車“卷”向天空：小鵬匯天、峰飛、廣汽等攜eVTOL首次亮相上海車展 | 車展新勢(shì)力國(guó)補(bǔ)倒計(jì)時(shí)！軒逸家族年末大促，幸福座駕觸手可及！家用MPV選TA，長(zhǎng)超5.2m，油耗5.27L，純電能跑200km，比傳祺M8省解放/陜汽/徐工斬千輛大單東風(fēng)/宇通訂單火爆重卡市場(chǎng)12月誰(shuí)稱霸宇通/中車斬千輛大單海格/金龍頻現(xiàn)超百輛訂單客車市場(chǎng)12月爆了？新能源車分體式大燈設(shè)計(jì)，投射出了行業(yè)變革的陰影車企“沖量戰(zhàn)”打響，車是現(xiàn)在買還是等年后？

汽車頻道更多>>

2025年上海市第二社會(huì)福利院招聘工作人員公告（10人） 2025年成都市大邑縣“蓉漂人才薈”招聘事業(yè)單位工作人員上海站相關(guān)事宜公告 2025年樂山高新區(qū)管委會(huì)直屬事業(yè)單位招聘工作人員公告年檢又有“新規(guī)定”？交警：6到15年內(nèi)的車主注意，車友們知道嗎 smart易寒：三個(gè)核心關(guān)鍵詞既是品牌基石又啟示未來(lái)走向 2025年春運(yùn)拉開大幕高德地圖同步啟動(dòng)“溫暖回家路”春運(yùn)出行服務(wù) 以變革應(yīng)對(duì)變革！2025年的吉利將變成什么樣？捷豹XEL官降至18.98萬(wàn)，和前驅(qū)奧迪A4L相比值得選嗎？

讀書樂趣更多>>

2025年中國(guó)福利會(huì)發(fā)展研究中心（宋慶齡兒童發(fā)展中心、中國(guó)福利會(huì)教師教育發(fā)展中心）招聘公告（2人）國(guó)內(nèi)車企開始不宣傳智能駕駛：比誰(shuí)的車更安全銀河星耀8加推基礎(chǔ)駕駛輔助版型預(yù)售價(jià)13.38萬(wàn)元起！ 12月MPV銷量排行榜！五菱征程躍升第一，別克GL8位居第七福田汽車：瞅準(zhǔn)新能源“大蛋糕”，能否獨(dú)占鰲頭？文能勝出武亦不輸奧迪A7L力壓寶馬5系有法寶 70 萬(wàn)用戶成為 “忠實(shí)粉絲團(tuán)”，傳祺的魅力遠(yuǎn)超想象 10.99萬(wàn)就能買新能源中型SUV？?jī)煞N動(dòng)力，奇瑞全新SUV將上市

電子產(chǎn)品更多>>

9月開啟旗艦大戰(zhàn)！高通驍龍8 Elite 2/聯(lián)發(fā)科天璣9500提前發(fā)：硬剛蘋果 2025年上海市第二輕工業(yè)學(xué)校招聘公告（11人） 2025年上海歌劇院第二季度工作人員招聘公告（14人） 2025年四川中醫(yī)藥高等專科學(xué)校后勤工作人員招聘公告 2025年宜賓市醫(yī)療保障局招聘編外工作人員公告尊界S800內(nèi)飾官圖，完全就是超豪華的“老錢風(fēng)” 新能源真的省錢嗎？聽我一句勸，1年開不到10000km，燃油車更劃算上海車展觀察：智駕進(jìn)入“冷靜期”，安全重回第一性

財(cái)經(jīng)播報(bào)更多>>

華為WATCH 5評(píng)測(cè)：首款鴻蒙AI+麒麟+5G智能手表 2025必入之選 2025年上海市氣功研究所工作人員招聘公告（4人） 2025年中國(guó)科學(xué)院成都山地災(zāi)害與環(huán)境研究所特別研究助理（博士后）招聘啟事 2025年南充文化旅游職業(yè)學(xué)院招聘員額人員公告自動(dòng)落鎖這么好的功能，卻讓部分車主頭疼不已，買車時(shí)要注意福特夠“野”！新F-150猛禽、烈馬復(fù)古特別版首秀銷量增長(zhǎng)被指含水分，長(zhǎng)安福特前景真有那么不堪？ 2024以高增長(zhǎng)收官，2025喜迎開門紅，一汽奔騰“火力全開”！

Copyright 2014-2025 觀經(jīng)濟(jì) 版權(quán)所有京ICP備20151973號(hào)-1

商洛市| 治县。| 周至县| 开封市| 西盟| 汝城县| 华蓥市| 桐乡市| 永善县| 潼关县| 胶南市| 和田县| 江口县| 石台县| 庆云县| 图片| 葫芦岛市| 化德县| 江安县| 嘉峪关市| 团风县| 阿鲁科尔沁旗| 辉南县| 北川| 出国| 黑山县| 庆安县| 衡山县| 乌恰县| 阿鲁科尔沁旗| 资源县| 敦煌市| 任丘市| 公安县| 涟水县| 榕江县| 六盘水市| 应用必备| 平度市| 张家港市| 宾川县|