面壁智能宣布 MiniCPM

IT之家 1 月 16 日新闻,面壁智能大众号本日发布推出“小钢炮”MiniCPM-o 2.6 端侧全模态模子,参数为 8B,号称机能比肩 GPT-4o、Claude-3.5-Sonnet。其采取了端到端多模态架构,可同时处置文本、图像、音频跟视频等多品种型的数据,天生高品质文本跟语音输出。官方表现,其总参数目 8B,视觉、语音跟多模态流式才能到达了 GPT-4o-202405 级别,是开源社区中模态支撑最丰盛、机能最佳的模子之一。MiniCPM-o 2.6 支撑可设置声响的中英双语语音对话,还具有感情 / 语速 / 作风把持、端到端声响克隆、脚色表演等进阶才能。据官方先容,MiniCPM-o 2.6 也是首个支撑在 iPad 等端侧装备长进行多模态及时流式交互的多模态年夜模子。其在 OpenCompass 榜单上(综合 8 个主流多模态评测基准)均匀得分 70.2,以 8B 量级的巨细在单图懂得方面超出了 GPT-4o-202405、Gemini 1.5 Pro 跟 Claude 3.5 Sonnet 等主流商用闭源多模态年夜模子。IT之家附开源地点:GitHub:https://github.com/OpenBMB/MiniCPM-ohuggingface:https://huggingface.co/openbmb/MiniCPM-o-2_6