MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数和150亿激活参数。专为智能体AI设计,采用混合注意力架构,结合滑动窗口注意力(SWA)和全局注意力(GA),窗口大小为128个token,通过可学习的注意力下沉偏置(sink bias)技术,在保持长文本性能的同时显著降低KV缓存存储量。此外,配备了轻量级多Token预测(MTP)模块,每个模块仅包含0.33亿参数,使用...详情>>
12月中旬,小米正式发布并开源自研大模型MiMo-V2-Flash。今日,MiMo&小米大模型Cor
MiMo-V2-Flash是什么MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数
12月中旬,小米正式发布并开源自研大模型MiMo-V2-Flash。今日,MiMo&小米大模型Core团队宣布,原定于2025年12月底结束的免费试用期,将延后至2026年1月20日14:00
MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数和150亿激活参数。专为智能体AI设计,采用混合注意力架构,结合滑动窗口注意力(SWA)和全局注意力(GA),窗口大小为12