意外擦除命令导致关键生产数据库服务器停机。

2021年1月21日,上午10:00
客户端:
一家位于韩国的托管服务提供商尝试对其客户端进行配置更改’工程师错误启动的NetApp系统‘dd’在某些LUN上执行命令,以有效清除最终用户的数据’的生产Sybase服务器

如果无法访问数据,则托管服务提供商可能会面临与客户的合同损失以及潜在的责任成本。

该客户端具有一个NetApp FAS8060系统,该系统包含161 x 900GB SAS硬盘,并分为两个单独的聚合(68个驱动器+ 93个驱动器)。该客户将每个聚合中的3 x 468GB FC LUN提供给Sybase服务器。总共6个LUN合并为一个磁盘池,其中三个逻辑卷从该池中划出。不正确的‘dd’该命令已将零写入大约45GB的逻辑卷之一,并且Sybase服务器不再可见该卷。
在最初的咨询过程中,我们的工程师指示客户使聚合体脱机,以避免进一步覆盖损坏。从原始数据丢失事件发生后的12个小时内,聚合已脱机。客户端将来自这两个聚合的所有161个HDD都展示到了一台Windows计算机上,并将其连接到Ontrack’s RDR(远程数据乐橙客户端)服务器。初步检查显示两种骨料均已命名“aggrO,”淘汰了我们的工程师’自动重建聚合的能力。将驱动器分类为聚合组,然后手动重建聚合。然后,我们的工程师能够将聚合体重建到尽可能近的时间点,但要在‘dd’发生损坏,将单独的聚合重新构建到彼此之间两分钟内的某个时间点。
我们的工程师无法提取或检查内部数据,因为Sybase服务器将逻辑卷用作RAW存储。然后将所有六个LUN作为平面文件提取到外部存储。 NetApp支持人员可以协助将这些LUN提供回Sybase服务器。乐橙客户端的逻辑卷在Sybase服务器上通过了完整性检查,并且客户端确认一切正常。最终用户’发生故障后的几天之内,数据库服务器就可以乐橙客户端联机,而不会丢失数据。
载入更多评论
感谢您的评论!您的评论必须先获得批准


新密码