华为将发布AI推理创新技术UCM 实现高吞吐、低时延体验
文 / 风致
2025-08-12 13:25:53
来源:亚汇网
【华为将发布AI推理创新技术UCM 实现高吞吐、低时延体验】8月12日,在2025金融AI推理应用落地与发展论坛上,华为将发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大了推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Tokenr的推理成本。
更多行情分析及广告投放合作加微信: hollowandy
请用微信扫一扫
本文地址: https://www.yahuicj.com/stock/zhibo/3970113-1.htm,转载请注明出处。
【免责声明】本文仅代表作者本人观点,与亚汇网无关,且不构成任何投资建议,仅供参考,并自行承担全部风险与责任。本站部分文章信息来源于自由投稿人或网络转载,出于传递更多信息之目的,如对文章内容有疑议或侵权,请及时与我们联系处理。























































