重复数据删除是如何进行的?¶
通过 TreeSize 移除冗余文件并用 NTFS 硬链接替换这些文件的过程称为 去重。这将减少被重复文件占用的磁盘空间。
TreeSize 不占用硬盘空间,而是删除所有重复文件,只保留其中一个。
被移除的文件将被硬链接取代,硬链接将指向剩余的数据(参见:关于 NTFS 的说明 )。
现在,该文件的所有硬链接都共享数据,如下图所示。
这些硬链接可以像普通文件一样使用。除了数据在其他链接之间共享外,你不会注意到任何不同之处。事实上,除了不占用自己的空间外,它们与任何普通文件都没有区别。
了解硬链接¶
硬链接是现有 file的附加名称。你在 Windows 资源管理器中看到的每个 file 都已经有一个名字——这个名字本身就是一个硬链接。当你创建第二个硬链接时,你会给同一个 file 赋予第二个名字,甚至可能存在另一个文件夹。在幕后,NTFS维护着一个名为 主 File 表(MFT)的中央索引,所有文件。把MFT想象成一本电话簿:每个硬连接就像一个不同的房源,拨打同一个号码。
硬链接不是副本¶
硬链接 不 创建 file副本。磁盘上仍然只有一组数据。所有指向同一重的硬链接 file 共享所有内容: file的内容、时间戳、属性和访问权限。如果你通过任何硬链接打开 file 并做更改,你编辑的数据是一样的——每隔一个硬链接都会立即反映这些更改。
重复数据删除是如何进行的?¶
NTFS 会记录有多少个硬链接指向每个文件。删除硬链接只会删除特定名称。它不会删除底层数据。只有当最后一个硬链接被删除且名称不复存在时,实际文件数据才会被释放。
通知¶
Note
硬链接只能在同一块硬盘或分区 内。你无法创建跨越两个不同卷的硬链接。
硬链接只能指向 文件,不能指向文件夹。
单个 file 最多只能有 1023个硬链路,。
所有指向同一 file 的硬链接都共享相同的 安全描述符 (访问权限)。更改一个硬链路的权限会让所有人都变。
要创建硬链接,用户必须对相应文件夹分支和共享(如果驱动器不是本地驱动器)上的文件属性拥有写权限。
硬链接 vs. 符号链接 vs. 快捷方式¶
硬链接常被误认为 符号链接 (符号链接)和 Windows快捷方式。它们的不同之处如下:
硬链接 是对文件数据的直接引用。它与 "原始 "文件名没有区别--两者都是指向相同数据的平等条目。由于硬链接不依赖于文件路径,因此即使原始文件名被重命名或移动(在同一卷内),硬链接也能继续存在。
符号链接 (symlink) 是一种特殊文件,其中包含指向另一个文件或文件夹的路径。如果目标文件被移动、重命名或删除,符号链接就会中断("悬空")。与硬链接不同,符号链接可以指向不同的驱动器,也可以指向文件夹。操作系统对符号链接的解析是透明的,因此大多数应用程序都会像对待普通文件或文件夹一样对待它们。
Windows 快捷方式 (.lnk 文件)是一个普通文件,Windows Shell 将其解释为指向目标的指针。快捷方式不在文件系统级别上解析--它们只在资源管理器和可理解 .lnk 格式的应用程序中起作用。快捷方式总是有自己的文件大小(通常为几百字节)和自己的安全描述符,与目标无关。
哪些重复文件将被替换?¶
如果选中重复文件组中的所有文件,TreeSize 将选择 "最后修改 "日期最新的文件作为该组的 "主文件"。所有其他文件都将被移除,取而代之的是指向主文件的硬链接。
如果要手动选择一个主文件,可以不选中重复文件组中的一个文件。这样,该文件就不会被替换,而是被用作主文件。
Note
不幸的是,Windows 资源管理器不会显示去重文件或其所在文件夹的大小差异。阅读我们的知识库 以获取更多信息。
Note
不能使用硬链接替换位于不同硬盘驱动器上的文件。
Note
指向同一文件的所有硬链接共享相同的 "安全描述"(访问权限)。重复数据消除将对剩余的一个物理文件应用统一的权限集。