哪些与Windows相关的文件对* nix用户没有价值?


10

自从使用Windows以来,我已经积累了大量的保留的文件系统副本以及系统和数据驱动器的存档。我试图将它们提炼成可用的部分,同时丢弃一切可能毫无价值的东西。

从观看一堆说的文件在复制时滚动查看,再一次,从保持驱动器到工作驱动器,我认为我已经开始了一个“好”和“无用”文件的入门列表,但是我想知道是否存在有什么权威的文件列表(来自以前的Windows环境)应立即视为无用而丢弃?

优胜者:(我知道,如果做出任何努力使其全面,此列表可能会变得一团糟,因此这些不是我想要的,除非它们可能被胡扯所包围,可能会无意中将其销毁) (编辑:如果唯一的方法是基于超级白名单的方法,那就这样吧。我宁愿不是这种情况,但乞be不能成为选择者……大多数时候。

*.tar.*, *.rar, *.zip
*.mp(e)g, *.avi, *.mkv, *.wmv, *.asf

失败者:( 这些是我真正想要的)

*.exe, *.bat, *.dll, *.com, *.lnk

我也知道会有例外。类似于installer .exe文件,用于在Wine中安装某些文件。出于这个问题的目的,这不是一个问题。所有有问题的文件都是副本(可能是副本,也可能是更多副本),因此我真正想保留的安装程序不错,安全且受写保护。


6
你为什么要这样做呢?是否应该保留用户文件夹中的几乎所有内容,而不保留其中的所有内容?
Michael Mrozek

我已经有一段时间没有使用过Windows了,我不知道哪些目录是毫无价值的,此外,使用非标准目录来存储内容(例如将文件放在Program Files中或隐藏在Windows目录中),我不知道不要低估那些可能藏有宝石的地方。我知道某些文件通常比其他文件具有更多先天的价值,这就是为什么我试图从“漫长的道路”中解决这个问题。
killermist 2012年

我向SU询问了有关迁移的信息,但他们对此并不感兴趣。我不确定有人会列出这样的清单吗?我一直只保留某些文件夹,而不是某些文件类型
Michael Mrozek

@MichaelMrozek我很感谢这个要求。如果我仍然交叉张贴,他们会感到沮丧吗?还是那只会让事情沮丧?还是会(可能另外)被标记/关闭为“不在主题范围内”和/或“不合适”?
killermist 2012年

大概; 如果他们不希望它迁移,那是因为它不适合
Michael Mrozek

Answers:


3

清除垃圾的最简单方法可能是在创建日期或最后修改日期之前(您可能需要尝试确定哪个日期更好)-仅以系统安装的日期为起点。

根据帕累托原理,简单的滤镜可能会为您带来80%的效果。

(当然,您可能甚至应该将这一列表与已开始组装的黑白列表结合起来。)


这似乎是一个好主意的基础。大多数OS文件从首次存储到CD或打包到升级档案中起保留其修改/创建日期。
killermist 2012年

您是否有推荐的find命令来执行此操作?我发现似乎是一个不错的开始,那就是find . -type f -mtime +572w -exec ls -l {} \; 查看输出并可能拨入目标截止时间,然后使用-delete而不是-exec来批量删除不需要的内容。后面跟一个find . -empty -delete以清除空目录和文件。然后使用选择性的文件名/扩展名清理。还有更好的主意吗?
killermist 2012年

find这里-newer使用了一个有用的标志,例如:find /mnt/windowsfs \! -newer "/mnt/windowsfs/reference/filename" | xargs rm -f
Alexander Shcheblikin 2012年

8

只有您知道您需要/想要保留什么。但是,您可以在某种程度上识别Windows系统文件和其他已安装的程序文件。

在虚拟机中重新安装Windows和这些程序,然后列出VM 中所有文件名的两个列表。

  1. 在虚拟机中,列出新安装的系统的第一个列表

      dir /S /B /A-D C:\ >vmlist.1

  2. 在VM中,在更新后制作系统的第二个列表

      dir /S /B /A-D C:\ >vmlist.2  

  3. 返回* nix,合并这两个文件并删除重复的行。

      sort -u vmlist.1 vmlist.2 >vmlist  

  4. 现在,该列表将如下所示(但更长):

      C:\name with 6 special chars [$.^|]
      C:\Windows\System32\asr_fmt.exe
      C:\Windows\System32\asr_ldm.exe
      C:\Windows\System32\asr_pfu.exe
     

  5. 现在将列表转换成regex适合grep

    sed -r 's/\\/\//g; s/[]$.^|[]/\\&/g; s/^[[:alpha:]]:/^.*/; s/$/$/' vmlist >vmlist.rex

  6. 正则表达式列表如下所示。

      ^.*/name with 6 special chars \[\$\.\^\|\]$
      ^.*/Windows/System32/asr_fmt\.exe$
      ^.*/Windows/System32/asr_ldm\.exe$
      ^.*/Windows/System32/asr_pfu\.exe$

  7. 列出目标归档目录中包含的文件的列表

      find '/my/archive/dir' -type f >arclist

  8. 现在,从与正则表达式模式匹配的文件中创建一个子列表arclisl

      <arclist grep -f vmlist.rex >arcmatches  

  9. arcmatches包含匹配的Windows文件。如果对看到的内容满意,请选中它们并删除它们。这是删除(删除)命令。

      <arcmatches xargs -d'\n' rm -v



虽然这在“从归档文件中删除窗口”中显示出很好的技巧,但在这种情况下(最多)是不切实际的,因为其中一些已经有十多年的历史了,使用的窗口版本将很难确定(如果可用)完全没有 Finesse会很好,如果有可能的话,但我认为当我经历这些过程时,它将成为蛮横的力量,最终统治了这一天。
killermist 2012年

是否有可能某个勇敢的人(或复数的人)坐下来为Win95创建了vmlist的发布版本到最新版本(也许可以在WinXP上停止,不确定...)?
killermist 2012年

如果你希望走这条路,这里是一个虚拟机的名单由微软,包括XP,Vista和7提供的
phunehehe

3

thumbs.db据我所知,该文件在类似Unix的系统上没有用。

它是一个(可能是隐藏的)文件,用于在Windows系统上缓存图像的缩略图。由于每个图像文件夹thumbs.db在查看文件夹的图像时都有其自身的位置,因此硬盘上可能有很多东西,具体取决于图像文件夹的数量。

我不知道每个* nix如何处理缩略图,但是至少就我而言(Ubuntu / GNOME),所有缩略图默认情况下都放在一个位置:.thumbnails/主目录中的文件夹(以及子文件夹,如.thumbnails/normal.thumbnails/large) 。从Windows迁移到Linux时,我摆脱了所有这些thumbs.db文件。


1

对于Unix无效的Windows文件列表

  • Thumbs.db,ehthumbs.db,ehthumbs_vista.db
  • * .ini示例,desktop.ini
  • * .dll –代表动态链接库。每个软件都使用并需要此文件才能运行。这些文件可能会引起很多问题,特别是如果您卸载了防病毒软件然后又安装了另一种文件。
  • * .sys示例,C:/pagefile.sys
  • * .old —具有此扩展名的文件通常由防病毒软件遗留,专门用于旧的定义等。
  • * .bak –在检查硬盘时由防病毒软件或系统软件生成的备份文件。
  • 还有这些扩展名* .tmp,*。temp,*。chk,*。gid,*。nch,*。wbk,*。fts,*。ftg,*。$$$,*。err,* .— 、. 〜,〜,*。?? $,*。_,*。〜mp,* ._ mp,* .prv,* .sik,CHKLIST.MS,* .ilk,* .aps,* .mcp,* .pch,*。$ db,*。?$ ?, *。??〜,*。?〜?,*。db $,*。^,* ._ dd,* ._ detmp,0 * .nch,chklist。*,mscreate.dir,*。diz,*。syd, * .grp,*。cnt,*。〜mp
  • 损坏的快捷方式-有时在使用默认添加/删除功能卸载程序时,会留下该程序的快捷方式。
  • 旧的小型转储-小型转储是系统蓝屏时Windows记录的文件。

脚步

  • 如果已经在Windows上(运行碎片整理工具和cleanmgr工具)。它将删除许多不必要的文件。
  • 删除那些在Unix上不需要的文件。

0
C:/pagefile.sys

在C:/的根目录中,pagefile.sys应该是一个非常大的文件,您不再需要。

在大多数情况下,整个Windows-Dir都不有用-除非带有仿真器,虚拟机。

字体可以是一个例外(至少* .ttf / * .TTF)。


页面文件是第一个目标。Windows目录通常是一个不错的目标,除非用户使用它在...中隐藏文件,但这有时是一种情况,并且不能打折。字体是保存的好对象,但可能会带来许可证负担。
killermist 2012年

1
@killermist:好的-如果您拥有Windows许可证,则可以使用这些字体。如果没有,那就没有。
用户未知
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.