首页 -> 新闻中心 -> 业界动态 -> 正文
浪潮信息携手腾讯云联合发布数据中心故障运维白皮书
2021-08-13

近年来,全球云计算市场不断扩张,数据中心服务器数量开始爆发式增长,服务器运维管理复杂度和难度越来越大。在此背景下,浪潮信息和腾讯云联合发布《数据中心服务器智能故障诊断TIFDS(Tencent & Inspur Fault Diagnosis System)系统技术白皮书》,为大规模数据中心提升服务器运维效率,保障数据中心稳定运行提供了重要参考。

白皮书指出传统的海量服务器故障运营面临着高昂的成本,从最初的脚本运维、工具运维到平台运维演进至今,人力已接近极限,越来越无法满足快速修复故障和恢复业务运行的要求。为高效管理十万甚至百万级服务器,智能化的监控诊断系统成为大规模数据中心必不可少的工具。

TIFDS(Tencent & Inspur Fault Diagnosis System)是腾讯云与浪潮信息联合研发的故障诊断系统,旨在实现运维工作由人工离线分析向自动智能在线识别的方向发展,建立一套以带外BMC为中心的故障诊断系统。TIFDS以腾讯云数百万服务器运营数据和浪潮信息深厚的固件研发专家经验库为基础,可利用AI技术对海量服务器运行数据实时分析,对各类部件故障实时预警,故障诊断“火眼金睛”,故障自动明确化率提升至95%以上,远超业界平均水平。 据白皮书介绍,TIFDS系统还具有风险实时预警,故障精准诊断和日志定制化透明安全等特点,对提升大规模数据中心运维效率具有重要意义。

对此,浪潮信息研发项目管理部总经理宋晓锋表示:“TIFDS是数据中心服务器运维技术的重要创新,是腾讯云与浪潮双方基于JDM模式,打破原有产业链上下游合作模式,进行联合研发的又一成果。此次,浪潮与腾讯云将TIFDS架构进行梳理,联合发布了业界首个数据中心故障运维白皮书,为提升数据中心运维效率和云计算稳定性具有重要的借鉴意义。”

目前,中国云计算市场增长动能正逐渐从泛互联网向产业化快速渗透。浪潮作为全球领先的算力基础设施供应商,将不断创新升级,进行技术研发,以迎接未来的云计算挑战。

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点