據(jù)通義千問Qwen微信公眾號(hào)消息,1月29日凌晨,阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max正式上線。
據(jù)悉,Qwen2.5-Max模型是阿里云通義團(tuán)隊(duì)對(duì)MoE模型的最新成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬(wàn)億tokens。Qwen2.5-Max在知識(shí)(測(cè)試大學(xué)水平知識(shí)的MMLU-Pro)、編程(LiveCodeBench)、全面評(píng)估綜合能力的(LiveBench)以及人類偏好對(duì)齊(Arena-Hard)等主流權(quán)威基準(zhǔn)測(cè)試上,展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領(lǐng)先的性能。
值得一提的是,Qwen2.5-Max的發(fā)布,是繼DeepSeek之后中國(guó)AI陣營(yíng)在高性能、低成本技術(shù)路線上的又一重要突破。
通義團(tuán)隊(duì)分別對(duì)Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進(jìn)行了評(píng)估測(cè)試。指令模型是所有人可直接對(duì)話體驗(yàn)到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準(zhǔn)測(cè)試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
在基座模型的對(duì)比中,由于無(wú)法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里云將 Qwen2.5-Max 與目前領(lǐng)先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進(jìn)行了對(duì)比。對(duì)比結(jié)果如下圖所示:
Qwen2.5-Max的基座模型在大多數(shù)基準(zhǔn)測(cè)試中都展現(xiàn)出了顯著的優(yōu)勢(shì)。
市場(chǎng)人士分析稱,此前過度聚焦DeepSeek,卻忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕。行業(yè)媒體《信息平權(quán)》表示,若阿里Qwen-2.5-max這次的確性能超過V3,可以對(duì)其RL推理模型給予更大期待。
農(nóng)歷除夕夜,阿里巴巴股價(jià)在收盤前出現(xiàn)顯著異動(dòng)——從漲幅1%快速拉升至6.71%,收盤報(bào)96.03美元,總市值2284億美元。
據(jù)悉,今年阿里云作為總臺(tái)春晚云計(jì)算AI獨(dú)家合作伙伴,首次亮相中央廣播電視總臺(tái)蛇年春晚,為春晚直播提供了強(qiáng)大的全球云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持。
今年春晚主舞臺(tái)部署了阿里云通義大模型AI技術(shù)來(lái)呈現(xiàn)科幻電影中的“子彈時(shí)間”經(jīng)典畫面。該系統(tǒng)以“天空環(huán)繞視角”對(duì)甄子丹領(lǐng)銜的《筆走龍蛇》武術(shù)表演進(jìn)行云上多視角拍攝,為觀眾呈現(xiàn)“空中環(huán)繞、時(shí)空凝結(jié)”等創(chuàng)新觀看體驗(yàn)。技術(shù)人員采用先進(jìn)的AI技術(shù)對(duì)畫面進(jìn)行3D模型重建,將拍攝畫面融合渲染,形成一個(gè)完整立體的3D視頻圖像,為觀眾呈現(xiàn)物理攝像機(jī)無(wú)法拍攝的影像。
阿里云通義AIGC技術(shù)成果也首次大規(guī)模應(yīng)用在節(jié)目畫面中。在《在歲月里的花》節(jié)目尾聲,阿里云通義萬(wàn)相將舞臺(tái)畫面瞬間轉(zhuǎn)化靜態(tài)油畫,為觀眾帶來(lái)一場(chǎng)虛實(shí)交融的視覺盛宴。在后續(xù)節(jié)目中,阿里云大模型AI技術(shù)還將為舞臺(tái)設(shè)計(jì)提供風(fēng)格遷移、參考圖生成、風(fēng)格化處理等技術(shù)能力,為節(jié)目創(chuàng)新提供技術(shù)支持。
來(lái)源:讀創(chuàng)財(cái)經(jīng)綜合
阿里巴巴續(xù)漲2.9% 發(fā)布新版通義千問Qwen 2.5-Max AI模型
中國(guó)電信正式發(fā)布“天翼”AI手機(jī):內(nèi)置3B星辰大模型
官宣!052D型Pro Max版正式亮相,中國(guó)海軍下一代驅(qū)逐艦何時(shí)亮相?
多模賦能開啟Galaxy AI新時(shí)代 三星Galaxy S25系列中國(guó)發(fā)布
科創(chuàng)板又一重要核心指數(shù)入局 南方基金等首批科創(chuàng)綜指ETF正式獲批
英偉達(dá)CEO黃仁勛:DeepSeek-R1的發(fā)布本質(zhì)上利好AI市場(chǎng)
中國(guó)模型崛起!阿里Qwen2.5-Max數(shù)學(xué)及編程能力全球第一
據(jù)稱將與蘋果合作為中國(guó)iPhone用戶開發(fā)AI功能 阿里巴巴(BABA.US)漲超2%
看好DeepSeek刺激AI需求,SAP預(yù)計(jì)今年云收入加速增長(zhǎng),若滿足要求或用中國(guó)模型 | 財(cái)報(bào)見聞
還沒有評(píng)論,來(lái)說兩句吧...