【財新網(wǎng)】
小米首個推理大模型開源
4月30日,小米開源首個推理大模型“Xiaomi MiMo”,由預訓練和后訓練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動提升推理能力,小米方面介紹,在數(shù)學推理(AIME 24-25)和 代碼競賽(LiveCodeBench v5)公開測評集上,MiMo 用 7B 的參數(shù)規(guī)模,超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規(guī)模的開源推理模型 QwQ-32B-Preview。
4月29日,騰訊宣布成立大語言模型部和多模態(tài)模型部,分別負責大語言模型和多模態(tài)模型的前沿技術(shù)研發(fā),同時騰訊大模型團隊原有的數(shù)據(jù)平臺部將專注于大模型數(shù)據(jù)的建設,原有的機器學習平臺部聚焦機器學習和大數(shù)據(jù)融合平臺建設,這兩個部門為AI模型的訓練、推理提供底座。騰訊向財新稱,此次調(diào)整有利于整合資源,優(yōu)化研發(fā)流程,提升騰訊在AI領域的長期技術(shù)作戰(zhàn)能力。



















京公網(wǎng)安備 11010502034662號 