Disaster Recovery是强大的游戏平台基础架构的关键要素。任何高负载系统都必须有准备好的脚本,以从严重故障,事故或基础设施损失中恢复。

游戏平台可以处理大量的交易,游戏会话和用户数据。系统的任何停机都可能导致财务损失,用户信任和技术问题。

Disaster Recovery包括备份服务器战略,数据库复制,自动基础架构切换,服务恢复以及事件发生后数据完整性检查。

JackCode实施了Disaster Recovery体系结构,使游戏平台能够快速恢复服务,最大限度地减少低时段并保护业务免受基础设施风险的影响。

灾难恢复系统的主要任务是:
  • 从故障中恢复服务
  • 切换到备用基础架构
  • 恢复数据库
  • 控制数据完整性
  • 重启关键服务
  • 恢复API和游戏集成
  • 恢复后稳定性检查

Disaster Recovery系统中包含哪些组件

构成部分指定
Backup Databases数据库备份
Replication Systems服务器间数据复制
Failover Infrastructure自动切换服务
Backup Servers冗余服务器环境
Cloud Storage备份数据存储
Monitoring Systems基础架构状态控制
Recovery Scripts恢复自动化

什么是Disaster Recovery团队控制的

构成部分指定
Replication Status数据同步控制
Backup Availability验证备份的可用性
Failover Readiness基础架构切换就绪
Infrastructure Health服务器环境状态
Recovery Procedures控制恢复脚本
System Logs事件原因分析

典型的紧急情况

一个问题说明说明
Server Failure服务器基础架构故障
Database Crash数据库损坏或丢失
Network Failure网络基础架构问题
Data Corruption系统数据损坏
Provider Outage无法使用外部服务
Infrastructure Attack攻击服务器基础架构

典型的灾难恢复过程

阶段说明说明
事件检测修复严重故障
规模评估定义受影响的服务
切换基础架构备份环境正在激活
数据恢复使用备份和复制
系统验证控制工作的正确性
平台稳定恢复正常运行模式
A.报告事件分析和报告准备

灾难恢复体系结构的好处

优势实际价值
最小化downtime减少停机时间
保护用户数据防止信息丢失
快速恢复服务平台连续性
提高基础架构的可靠性系统稳定运行
降低业务风险金融交易保护

谁参与了Disaster Recovery过程

参与者二.角色
DevOps Engineers控制基础架构和故障转移
Database Administrators恢复数据库
Backend Developers检查服务的运行情况
Infrastructure Engineers支持备份环境
Technical Support协调恢复和监测

Disaster Recovery使游戏平台能够在发生严重故障后快速恢复工作,保护基础架构并保持服务稳定性,即使在紧急情况下也是如此。

联系我们

系统基础设施和负载情况 — 我们将组织监控、维护和24/7技术支持

为了获得更快的回复,请使用表单