拯救SQL Server数据库事务日志文件损坏的终极大招

文摘 2024-10-08 10:01 广东

数据库损坏难题

在数据库的日常管理中，我们不可避免的会遇到服务器突然断电（没有进行电源冗余），服务器故障或者 SQL Server 服务突然停掉，

头大的是ldf事务日志文件也损毁了，SQL Server服务器起来之后，发现数据库处于"Recovery Pending" 状态。

更麻烦的是该数据库没有任何备份或者备份已经比较久远；

当然这些都不是最难的，最难的是连资深DBA使出ATTACH_REBUILD_LOG和 DBCC CEHECKDB 的 REPAIR_ALLOW_DATA_LOSS 选项等招数时候，

即使已经做好了最坏打算，做了丢失部分数据的准备，数据库还是无法上线。

本文将分享终极处理方法，帮助您成功恢复数据库。

测试环境：SQL Server 2022，Windows Server 2016

注意：奇技淫巧有风险，做任何操作之前注意先做备份！

模拟环境

首先，在数据库 testdb 中创建 testObject 表，并不停插入所有对象数据。

在窗口一我们运行插入数据脚本，使用多次 CROSS JOIN，以获得足够多的数据，插入数据脚本实际是一个模拟的大事务。


--窗口1

CREATE DATABASE testdb
GO
USE testdb
GO        


SELECT * INTO testObject FROM sys.all_objects


--前面脚本执行完成再执行下面的插入语句
INSERT INTO dbo.testObject
SELECT o.* FROM sys.all_objects o
 CROSS JOIN sys.all_objects o1
 CROSS JOIN sys.all_objects o2
 CROSS JOIN sys.all_objects o3
 CROSS JOIN sys.all_objects o4

返回信息如下

-- Msg 109, Level 20, State 0, Line 0
--A transport-level error has occurred when receiving results from the server. (provider: Shared Memory Provider, error: 0 - 管道已结束。)

在窗口二我们在关闭测试实例时，窗口一的插入事务仍然在运行。

这将使得数据库处于不一致状态，在数据库启动时，执行数据库恢复。

--窗口2
--执行完下面语句之后，移走ldf文件，模拟ldf文件损坏


SHUTDOWN WITH NOWAIT

数据库停服后，将testdb数据库的ldf事务日志文件改名或者移到其他路径，重新启动SQL Server 服务，可以看到，testdb 数据库处于“恢复挂起”状态。

因为在停服时候，还有未提交的插入事务保存在ldf事务日志文件，需要在数据库启动时候把事务日志捞出来做crash recovery。

数据库启动之前，已经把ldf事务日志文件移动到别的地方

此时，我们已经有一个孤立的，不一致的数据库文件。

现在我们必须先离线数据库，把mdf文件复制到别的地方作为备份，然后删除数据库，为后续的附加ldf事务日志文件做准备

--窗口3

USE master
GO     
ALTER DATABASE [testdb] SET OFFLINE;

把mdf文件复制到别的地方作为备份，因为数据库离线了，并不会删除物理数据文件

--窗口4

USE master
GO     
DROP  DATABASE [testdb] ;

传统方法

使用 ATTACH_REBUILD_LOG 来重建ldf事务日志文件

--窗口5

USE master
GO    
CREATE DATABASE [testdb] ON
(FILENAME='E:\DataBase\testdb.mdf')
FOR ATTACH_REBUILD_LOG


GO

报错信息如下


--文件激活失败。物理文件名称'E:\DataBase\testdb_log.ldf'可能不正确。
--无法重新生成日志，原因是数据库关闭时存在打开的事务/用户，该数据库没有检查点或者该数据库是只读的。如果事务日志文件被手动删除或者由于硬件或环境问题而丢失，则可能出现此错误。
--Msg 1813, Level 16, State 2, Line 8
--无法打开新数据库 'testdb'。CREATE DATABASE 中止。

到此为止，我们很可能只有去找备份文件还原了（如果有的话），否则可能就是一场灾难了。

就算资深DBA老司机也会在这里翻车

新方法

接下来将介绍终极恢复数据库的方法，以帮助您度过劫难。

使用 CREATE DATABASE 语句中非官方文档记载（undocument）的命令，这个命令就是ATTACH_FORCE_REBUILD_LOG

这个命令会强制重建ldf事务日志文件，即使数据库检测到ldf事务日志文件和mdf数据文件之间有不一致的情况。


--窗口6

USE master
GO    
CREATE DATABASE [testdb] ON
(FILENAME='E:\DataBase\testdb.mdf')
FOR ATTACH_FORCE_REBUILD_LOG
GO

返回信息如下


--文件激活失败。物理文件名称'E:\DataBase\testdb_log.ldf'可能不正确。
--新的日志文件 'E:\DataBase\testdb_log.ldf' 已创建。

数据库虽然恢复正常，但数据表依然无法访问

--窗口7

USE [testdb]
GO

SELECT TOP 10 *  FROM [dbo].[testObject]

SELECT COUNT(*)  FROM [dbo].[testObject]

报错信息如下

--Msg 824, Level 24, State 2, Line 18
--SQL Server 检测到基于逻辑一致性的 I/O 错误: pageid 不正确(应为 1:69856，但实际为 0:0)。在文件“E:\DataBase\testdb.mdf”中的偏移 0x000000221c0000 处，在数据库 ID 9 中的页面 (1:69856) 的 读取 期间发生。SQL Server 错误日志或操作系统错误日志中的其他消息可能会提供更多详细信息。这是一个威胁数据库完整性的严重错误条件，必须立即更正。请执行完整的数据库一致性检查(DBCC CHECKDB)。此错误可以由许多因素导致；有关详细信息，请参阅 https://go.microsoft.com/fwlink/?linkid=2252374。

使用最小数据丢失的方式，修复数据库

头两个命令将数据库分别置于紧急模式和单用户模式，这是我们执行 DBCC CHECKDB 的 REPAIR_ALLOW_DATA_LOSS 选项的前提。

最后一句命令是将数据库恢复多用户模式。

--窗口8
--使用最小数据丢失的方式，修复数据库

USE [master]
GO 
ALTER DATABASE [testdb] SET EMERGENCY
GO  
ALTER DATABASE [testdb] SET SINGLE_USER WITH NO_WAIT
GO  
DBCC CHECKDB([testdb],REPAIR_ALLOW_DATA_LOSS) WITH ALL_ERRORMSGS



--dbcc checkdb执行完毕之后执行下面语句，让数据库可以重新访问
ALTER DATABASE [testdb] SET MULTI_USER WITH NO_WAIT

DBCC CHECKDB返回信息如下，很多信息这里做了省略

可以看到有5924 个一致性错误，修复了 5924 个一致性错误，也就是全部修复了


--sys.filetable_updates_2105058535的 DBCC 结果。
--对象“sys.filetable_updates_2105058535”在 0 页中找到 0 行。
--CHECKDB 在数据库 'testdb' 中发现 0 个分配错误和 5924 个一致性错误。
--CHECKDB 在数据库 'testdb' 中修复了 0 个分配错误和 5924 个一致性错误。
--DBCC 执行完毕。如果 DBCC 输出了错误信息，请与系统管理员联系。

数据库处于单用户模式

设置回多用户模式之后，尝试查询数据

--窗口9

--从数据行数来看,具体你是不知道丢失多少数据的，只能说能挽救多少是多少吧



USE [testdb]
GO


SELECT TOP 10 *  FROM [dbo].[testObject]

SELECT COUNT(*) AS'rowcount' FROM [dbo].[testObject]

数据是查询出来了，但是具体丢失多少数据，我们无法掌握

至少数据库最后一次checkpoint点之后的所有数据将会丢失。

总结

在传统的方法里面，还有一个方法就是新建一个同名的空数据库作为傀儡数据库，然后替换傀儡数据库的数据文件

再对傀儡数据库执行DBCC CEHECKDB 的 REPAIR_ALLOW_DATA_LOSS 选项，但是实际上也不能保证100%有效

这个方法网上已经有相关文章，这里就不展开叙述了。

加入我们的微信群，与我们一起探讨数据库技术，以及SQL Server、 MySQL、PostgreSQL、MongoDB 、Oracle、Redis的相关话题。

微信群仅供学习交流使用，没有任何广告或商业活动。

数据库实战派

泰莱大学人工智能专业硕士，专注数据库技术解析，涵盖主流数据库的优化、运维与开发技巧。分享最新技术趋势、实用工具和最佳实践，助力从业者提升专业能力。

最新文章

低成本高可用方案！Linux系统下SQL Server数据库镜像配置全流程详解

DBA的出路在哪里？快来群里涨芝士

docker部署mssql2017

一步步教你在CentOS 7.9上安装SQL Server 2019

从 $PGDATA 到文件组：深入解析 PostgreSQL 与 SQL Server 的存储策略

数据库管理进入AI新时代，SSMS + Copilot助你轻松写SQL代码！

全新向量数据库SQL Server 2025：带你迈入AI驱动的数据未来

从架构到成本，SQL Server 和 PostgreSQL 四大区别全方位解析！

从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019

微软“爱”上PostgreSQL，PG“嫁给”微软

AlwaysOn集群不稳？两小时内业务神速恢复的秘密！

巴黎奥运背后的黑科技，揭秘阿里云数据库的高可用容灾策略

微软憋大招：SQL Server + Copilot = 地表最强AI数据库！

重庆客户数据库异地机房容灾切换项目：挑战10分钟极限切换

表数据对比终极指南：7种方法助你快速找出不同表数据之间的差异！

深度揭秘SQL Server IO统计背后秘密：你真的读懂物理读和逻辑读了吗？

解决北京某医院数据库危机：从磁盘告急到2小时内完美解决！

HTAP数据库革命：SQL Server如何引领实时交易与分析双引擎新时代！

FIO工具-企业级磁盘性能测试实战指南

实现SQL Server登录用户实例间无缝同步：AlwaysOn下的高效解决方案

别再忽视！PostgreSQL Public 模式的风险以及安全迁移

老司机带你聊聊向量数据库

Descending Indexes降序索引终极揭秘：10年DBA教你如何玩转SQL查询优化！

阿里云专家也翻车？实测揭露删除事务锁范围扩大的真相

SQL Server的一个不显眼的功能备份文件分割

西雅图微软总部MVP峰会记录

国产数据库的崛起与挑战：谁将在激烈市场洗牌中脱颖而出？

数据库中查询含有某个emoji表情的行数据

性能暴增100倍！MySQL执行计划全方位深度解析

从SQL Server过渡到PostgreSQL：理解模式的差异

如何让SQL Server像MySQL一样拥有慢查询日志（Slow Query Log慢日志）

拯救SQL Server数据库事务日志文件损坏的终极大招

分享积攒了多年的祖传SQL Server脚本

一键自动化部署工具 SQL Server的AlwaysOn集群和WSFC集群

SQL Server 内存优化表的使用场景

闲聊redis数据库设计实现

PostgreSQL 17正式发布！全面提升性能与开发体验

技术问题背后的思考：上交所系统为何出现故障？

解锁 SQL Server 2022的时间序列数据功能

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉