您现在的位置:首页 >> 产品 >> BDIG 大数据易用操作平台 >> BDIG 平台运维管理

BDIG平台运维管理

35222.com

BDIG能够实现Hadoop环境一键布署,传统行列数据转化和管理。通过图形化界面,监控服务器节点状态、网络环境、系统性能(CPU、内存、存储)、服务状态等平台相关运行情况,对大数据操作系统平台进行实时运维管理。

在运维管理中,可以对各节点的运行状态进行监控,系统会根据设定的规则发送报警,帮助及时发现和控制生产中的风险。

支持Apache Hadoop集群的供应、管理和监控。同时集成了Ganglia用来收集度量指标,集成了Nagios用来支持系统报警。此外,提供了基于角色的用户认证、授权和审计功能,并为用户管理集成了LDAP。

几大优势

  • 一键式自动安装部署,部署过程简单、高效,非技术人员可轻松操作,能够降低使用人员技术要求,节约人力、时间成本;最短2小时完成大数据平台的搭建工作。
     
  • 支持作业与任务执行的可视化与分析,能够更好地查看依赖和性能;
     
  • 通过一个完整的 RESTful API 把监控信息显示出来,实现对系统的实时运维管理;
     
  • 用户界面非常直观,用户可以轻松有效地查看信息并控制集群。
     
  • 低运维性:
    简单操作(包括权限设置、参数设置、作业配置、预警设置等)的响应时间不超过1秒,99%响应时间在500毫秒内。
    平台的所有应用软件系统都具有自动恢复功能,任何故障都可以在1分钟内自动发现并自动恢复;30秒内自动发现操作系统和硬件设备故障,及时通知运维人员,降低风险。

     
  • 可视化监控所有组件的运行情况并实时上报告警,快速定位问题,解决故障。
    对上层应用进行监控。
    计算任务在线监控管理。
    可视化实时监控所有组件的运行情况并实时上报告警,快速定位问题,解决故障。
    对上层应用进行监控。
    计算任务在线监控管理。

     
  • 平台组件在线升级

 

核心指标

1、简单的操作(包括权限设置、参数设置、作业配置、预警设置等),响应时间不超过1秒,99%响应时间在500毫秒内。

2、大数据平台全年对外正常服务运行时间超过99.99%,即每年无法提供服务的时间小于1小时;

3、大数据平台的所有应用软件系统都具有自动恢复功能,任何故障都可以在1分钟内自动发现并自动恢复。当应用软件系统出现故障时,允许有1分钟的服务降级;

4、对于操作系统和硬件设备故障,大数据平台的能够在 30 秒内自动发现,并通知系统运维人员。出现操作系统和硬件设备故障时,大数据平台允许有1小时的系统服务降级。

版权所有:北京阿普兰软件服务有限公司  京ICP备号
联系我们:010-86462396  在线技术支持qq群:90272984 

90272984
90272984