我国自研推理引擎开源首次支持国产卡原生运行FP8模型
来源:新华网-北京 发布时间:2025-03-15 22:27 作者:新华网-北京 阅读量:5843
我国人工智能基础设施企业清程极智联合清华大学翟季冬团队14日开源我国自研大模型推理引擎——“赤兔”(Chitu),首次实现国产AI芯片对新一代FP8模型(8位浮点数)的原生支持,为构建自主可控的国产AI算力生态提供了又一支撑。
随着DeepSeek引燃市场对大模型私有化部署的热情,模型部署的效率与成本成为企业AI落地的关键。当前,以FP8数据类型为代表的新一代AI模型成为行业主流。国产芯片多大程度上支持FP8数据类型,关系到新一代AI模型能否发挥出更优性能。
“过去,如果采用国产芯片支持FP8模型,传统技术方案需将FP8模型提前转换为FP16或BF16格式才能运行,这将导致性能损失,而推理引擎‘赤兔’通过硬件适配优化,无需提前转换模型,即可实现‘无痛’‘无损’支持FP8数据类型。”清华大学计算机系长聘教授翟季冬介绍。
为突破这一瓶颈,我国人工智能基础设施企业清程极智与清华大学翟季冬教授团队联合攻关,自主创新研发推理引擎“赤兔”并将其开源。推理引擎“赤兔”采用国际领先的全栈性能调优方案,可“四两拨千斤”地挖掘国产芯片潜力,实现国产芯片对FP8模型的原生支持。
“赤兔”的最大优势是实现对国产芯片的降本增效:不仅显著提升推理效率,也将降低部署成本。研发人员告诉记者,部署DeepSeek-R1等FP8模型时,基于“赤兔”的国产芯片方案将降低算力消耗,硬件成本与运维门槛也会同步下降。这为我国人工智能基础设施自主化开辟新路径的同时,也将为金融、工业、医疗等领域的智能化转型提供高性价比的支撑。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
站点精选
- 声明
- 安然纳米发光体—胡感:我们也许改变不了这个世
- 神舟十四号航天员乘组进行首次出舱活动,预计约
- 2022服贸会开幕 京东企业业务分享大中小
- 农业农村部:抓好农业防灾减灾突出实效用足用好
- 博闻科技上半年净利增长77.17%水泥粉磨站
- 特斯拉在北京建成100座超级充电站,车主平均
- 苹果AppleWatchSeries8将有新
- 和讯曝财报丨泛海控股2022上半年总营收39
- 华为PC应用引擎开启尝鲜招募:号称“电脑上的
- 柯利达:2022年半年度净利润约-2906万
- 东宝生物:“胶原+”战略实现突破营收净利双双
- 威尔士健身房刚办卡就关店?上海阿姨无语:故意
- 天风证券给予立讯精密买入评级
- 圣农发展获开源证券买入维持评级:近期获8份券
- PVC改性剂行业迎重要机遇期日科化学上半年净