潮新聞客戶端 記者 張云山
5月9日,全球權威AI基準測試平臺Artificial Analysis公布了最新一期大模型榜單,阿里通義千問Qwen3(簡稱千問3)智能水平位列全球前五,開源第一;同時千問3是所有頂尖模型中價格最低的,推理成本不到DeepSeek-R1 的三分之一,是Claude 3.7 的二十分之一。據悉,千問3開源一周以來,全球下載量超過330萬次,是近期最火熱的開源大模型之一。
大模型評測數據(采訪對象供圖)
據了解,Artificial Analysis是由著名AI科學家吳恩達領銜的獨立AI基準測試和分析平臺。該平臺整合了多個權威測試集,覆蓋推理與知識、科學推理、競賽數學、代碼生成等核心智能評估領域,是業界公認的最權威、最有影響力的AI大模型測評之一。Artificial Analysis的最新測評顯示,千問3智能水平比肩o3、Grok3-mini-Reasoning(high)等頂級閉源模型,超過英偉達Llama3.1-Nemotron-Ultra、DeepSeek-R1、DeepSeek-V3-0324,斬獲全球開源模型冠軍。
大模型評測數據(采訪對象供圖)
除了性能,Artificial Analysis還對頂級大模型的API平均價格進行了分析排名,結果顯示,千問3在各平臺上的平均推理成本為0.3美元/百萬Tokens,而DeepSeek R1為1美元,Claude 3.7 Sonnet 則高達6美元,千問3是所有頂級大模型中推理價格最便宜的。行業曾測算,千問3的部署成本也極低,僅為同等性能模型的1/3。
自4月29日開源以來,千問3全球下載量已超330萬次,產業鏈上下游紛紛適配及接入千問3 ,包括英偉達、英特爾、高通、聯發科、AMD、ARM、壁仞科技等多家頭部芯片廠商,北上津杭等十余地算力平臺,以及華為昇騰、百度千帆、中科曙光等多家AI公司及大模型服務平臺。
截至目前,千問3已斬獲Artificial Analysis、LiveBench、LiveCodeBench、SuperClue等國內外多個榜單的全球開源冠軍、國產模型冠軍。據了解,阿里通義已開源200多個模型,全球下載量超過3億次,千問的衍生模型數量逾10萬,遠超美國Llama,是全球第一開源模型。
“轉載請注明出處”
全部評論 (0)