小米开源首个原生端到端语音大模型

TMGM分析师
阅读量:
黄金交易
小米开源首个原生端到端语音大模型

XM外汇官网讯——

【小米开源首个原生端到端语音模型】

9月19日,小米小米推出了其首个原生端到端语音模型——Xiaomi-MiMo-Audio。开源该模型基于创新的原生音预训练架构和超过亿小时的训练数据,实现了在语音领域的端到端语少样本泛化,并展现出显著的模型“涌现”行为。根据介绍,小米MiMo-Audio在通用语音理解和对话等多个标准评测基准上表现出色,开源性能远超同等参数的原生音开源模型,达到了7B的端到端语最佳表现;在音频理解基准MMAU的标准测试集上,其表现超过了Google的模型闭源模型Gemini-2.5-Flash;在面向复杂音频推理的基准Big Bench Audio S2T任务中,MiMo-Audio同样优于OpenAI的小米闭源语音模型GPT-4o-Audio-Preview。

开源
相关标签: 黄金交易 市场分析 投资策略

分享这篇文章

准备开始交易了吗?

立即开户TMGM,享受超低点差0.12的黄金交易服务
24小时实时行情 · 最高1:500杠杆 · 专业技术分析工具
新用户开户即送$20交易金 + 免费交易信号30天

立即开户交易 了解更多
0.12
超低点差
24/7
全天候交易
1:500
最高杠杆
$100
最低入金

相关文章推荐

查看所有文章