您正在访问亚汇网香港分站,本站所提供的内容均遵守中华人民共和国香港特别行政区法律法规。

蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0

文 / 风致 2026-02-11 12:17:26 来源:亚汇网

【蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0】蚂蚁集团开源发布全模态大模型Ming-Flash-Omni2.0,是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户用自然语言下指令,可对音色、语速、语调、音量、情绪与方言等进行控制。模型在推理阶段实现了3.1Hz的极低推理帧率,实现了分钟级长音频的实时高保真生成。

相关新闻

加载更多...

排行榜 日排行 | 周排行