如何仅从git存储库中稀疏签出单个文件?


443

如何从git仓库中检出一个文件?


7
结帐是什么意思?从远程存储库仅获取一个文件的副本?
卡斯卡贝尔

2
如果有问题的存储库使用的是gitweb,则可以直接从那里下载文件。正如我在下面尝试解释的那样,您要问的实际上不是标准的git操作。
卡斯卡贝尔


您可以使用chrome扩展名GitHub Mate,使您可以单击文件图标进行下载。
Cam Song

Answers:


251

最初,我在2012年提到git archive(请参阅Jared Forsyth回答Robert Knight回答),从git1.7.9.5(2012年3月)开始Paul Brannan回答是

git archive --format=tar --remote=origin HEAD:path/to/directory -- filename | tar -O -xf -

但是:在2013年,远程https://github.com URL不再可能。
参见旧页“ 我可以归档存储库吗?

当前(2018年)的页面“ 关于在GitHub上归档内容和数据 ”建议使用第三方服务,例如GHTorrentGH Archive


因此,您还可以处理本地副本/克隆:

你可以交替做到以下几点,如果你有裸库的本地副本中提到的这个答案

git --no-pager --git-dir /path/to/bar/repo.git show branch:path/to/file >file

或者,您必须先克隆存储库,这意味着您可以获得完整的历史记录:-在.git存储库中-在工作树中。

  • 但是然后您可以进行稀疏签出(如果使用的是Git1.7 +),请执行以下操作:
    • 启用稀疏签出选项(git config core.sparsecheckout true
    • 添加您想要在.git/info/sparse-checkout文件中看到的内容
    • 重新阅读工作树以仅显示您需要的内容

要重新阅读工作树:

$ git read-tree -m -u HEAD

这样,您最终得到一棵工作树,其中包括您想要的内容(即使它只是一个文件)


Richard Gomes指出(在评论中)“ 如何从git存储库中克隆,获取或稀疏检出单个目录或目录列表?

一个bash函数,避免下载历史记录,该函数检索单个分支,并检索所需文件或目录的列表。


您可以在稀疏签出中提交更改吗?
提洛2012年

2
@Tilo:不确定,但考虑到克隆已完整,应该可以。
VonC 2012年

3
这比其他答案中提到的“ git checkout HASH路径到文件”更好吗?当时不可用吗?
0x6A75616E 2012年

2
@juand的想法是在执行git checkout之前不必加载所有工作树。
VonC 2012年

2
顺便说一句,我们git archive现在可以使用。
贾里德·福赛斯

197

首先使用-n选项克隆该存储库,该选项将禁止所有文件的默认检出,而使用--depth 1选项表示该存储库仅获取每个文件的最新修订版。

git clone -n git://path/to/the_repo.git --depth 1

然后只检查您想要的文件,如下所示:

cd the_repo
git checkout HEAD name_of_file

6
尽管从字面上看确实可以检出单个文件,但几乎可以肯定这不是OP想要执行的操作,因为它们将拥有所有文件(检出仍然是无操作的)。
卡斯卡贝尔

5
我认为这甚至-n行不通- 工作树和索引最终会同步。也就是说,所有内容都显示为已删除。您必须选择git reset HEADgit checkout HEAD file。除非您真的了解git的工作原理,否则现在很难使用存储库。
卡斯卡贝尔

2
而且,如果像DanielElliott这样的OP和OOP真的只想要该文件(而不是回购协议),则rm -rf .git在NickMoore的脚本中添加另一个文件将清除克隆回购协议的所有痕迹,也许可以缓解Jefromi对难以使用的回购协议的担忧。这对我对几个应用程序非常有用,例如我今天面临的挑战,即建立一个接收后挂钩以自动更新另一个接收后挂钩的版本。
滚刀

6
这是一个比公认的更好的答案。很高兴我一直在读书。
埃里克·乌尔多

6
这个答案是最好的(但git对于这种工作不是最好的)。该答案也适用于该问题其他热门问题以及其他许多问题:更改name_of_filename_of_folder。如今(2014年代)的Git 为回购所有者提供了子模块,为回购用户提供了一些友好的支持。
彼得·克劳斯

108

如果您已经有了git repo的副本,则可以始终使用a签出文件的版本git log以找出哈希ID(例如3cdc61015724f9965575ba954c8cd4232c8b42e4),然后只需键入:

git checkout hash-id path-to-file

这是一个实际的示例:

git checkout 3cdc61015724f9965575ba954c8cd4232c8b42e4 /var/www/css/page.css

12
您也可以使用标签或分支名称,而不仅仅是哈希。这些通常更容易。
罗伯·肯尼迪

4
好的解决方案。但是,如果path-to-file是目录,并且当前目录中HEAD包含某些文件,而当前目录target中不包含某些文件(反之亦然),则这将无法正确更新文件。有没有办法处理?
MasterMind

2
更简单,更好。谢谢!
Kerem atam

错误:pathspec。路径是本地PC上的路径还是远程PC上的路径?
Paul McCarthy

1
@PaulMcCarthy -地方
techexpert

60

通常,如果不git按照第一个答案的建议下载整个存储库,则无法仅下载一个文件。这是因为Git不会像您想的那样存储文件(就像CVS / SVN一样),但是它会基于项目的整个历史记录来生成它们。

但是有一些针对特定情况的解决方法。下面占位符的例子userprojectbranchfilename

的GitHub

wget https://raw.githubusercontent.com/user/project/branch/filename

亚搏体育app

wget https://gitlab.com/user/project/raw/branch/filename

GitWeb

如果您在服务器-GitWeb上使用Git,则可以尝试使用示例(将其更改为正确的路径):

wget "http://example.com/gitweb/?p=example;a=blob_plain;f=README.txt;hb=HEAD"

GitWeb位于drupalcode.org

例:

wget "http://drupalcode.org/project/ads.git/blob_plain/refs/heads/master:/README.md"

googlesource.com

有一个未记录的功能,可让您下载原始文件的base64编码版本:

curl "https://chromium.googlesource.com/chromium/src/net/+/master/http/transport_security_state_static.json?format=TEXT" | base64 --decode

在其他情况下,请检查您的Git存储库是否正在使用任何Web界面。

如果它不使用任何网络界面,你可以考虑在你的代码推到外部服务,例如GitHub的到位桶等等。并用作镜子。

如果尚未wget安装,请尝试curl -O (url)其他方法。


2
如果我不使用github?
Zulu

59
然后不要使用此方法。
艾伦

4
我反对git“根据项目的整个历史生成[文件]”的说法。说git以散列树的形式存储文件状态的快照更正确。当然,没有发电正在进行。
杰伊·沙利文

3
这个答案对我来说最有用,因为我试图简单地还原一个我打算与几个其他文件一起在本地删除的文件(不提交删除),但后来却确定需要,而其他文件则不需要
rshdev

8
您知道那种想用Git做一些简单的事情时的那种下沉的感觉,来吧,看看它是如何完成的,并在回答的一半时,您的大脑停下来,一切变得模糊和悲伤。然后向下滚动,找到这个绝妙的wget答案,简单的回报以及幸福。谢啦。
pgr



29

现在可以了!由于这是google上的第一个结果,所以我想将其更新为最新状态。随着git 1.7.9.5的出现,我们有了git archive命令,该命令将允许您从远程主机检索单个文件。

git archive --remote=git://git.foo.com/project.git HEAD:path/in/repo filename | tar -x

在此处查看完整答案https://stackoverflow.com/a/5324532/290784


@Benubird,它是您的仓库的主机名。对于github(如果github支持archive命令,而我最后一次检查它不支持),则为github.com
Jared Forsyth

这为我工作,但前提是我指定的分支机构(或refname)独自一人,如刚HEADmaster没有HEAD:directory
stormbeta

3
这在bitbucket上对我有用:git archive --remote=git@bitbucket.org:user/repo branch:path/to file | tar -x
Dave

24

在GIT 1.7.2.2中工作

例如你有一个远程some_remote设有分公司BRANCH1branch32

因此,要检出特定文件,请调用以下命令:

git checkout remote/branch path/to/file

作为一个例子,它将是这样的

git checkout some_remote/branch32 conf/en/myscript.conf
git checkout some_remote/branch1 conf/fr/load.wav

此checkout命令会将整个文件结构conf / en和conf / fr复制到您调用这些命令的当前目录中(当然,我假设您之前曾在git init上运行过)


5
但是您需要先跑步git fetch some_remote,不是吗?
phihag 2013年

15

很简单:

git checkout from-branch-name -- path/to/the/file/you/want

这不会签出from-branch-name分支。您将停留在所处的任何分支上,并且只会从指定的分支中检出单个文件。

这是手册的相关部分 git-checkout

git checkout [-p|--patch] [<tree-ish>] [--] <pathspec>...
       When <paths> or --patch are given, git checkout does not switch
       branches. It updates the named paths in the working tree from the
       index file or from a named <tree-ish> (most often a commit). In
       this case, the -b and --track options are meaningless and giving
       either of them results in an error. The <tree-ish> argument can be
       used to specify a specific tree-ish (i.e. commit, tag or tree) to
       update the index for the given paths before updating the working
       tree.

向Ariejan de Vroom致谢,他从这篇博客文章中教了我这一点。


4
太酷了,如果不是事实,您必须先克隆。
Antoniossss

8

git clone --filter 从Git 2.19

该选项实际上将跳过从服务器获取大多数不需要的对象的操作:

git clone --depth 1 --no-checkout --filter=blob:none \
  "file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/myfile

服务器应配置为:

git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

从v2.19.0开始,没有服务器支持,但是已经在本地进行了测试。

TODO:--filter=blob:none跳过所有blob,但仍获取所有树对象。但是在普通的仓库中,与文件本身相比,它应该很小,所以已经足够了。在以下位置进行询问:https: //www.spinics.net/lists/git/msg342006.html开发人员回答说,--filter=tree:0正在这样做。

请记住,这--depth 1已经暗示了--single-branch,另请参见:如何在Git中克隆单个分支?

file://$(path)需要克服git clone协议诡计:如何使用相对路径浅克隆本地git存储库?

的格式--filter记录在上man git-rev-list

对Git远程协议进行了扩展以支持此功能。

Git树上的文档:

测试一下

#!/usr/bin/env bash
set -eu

list-objects() (
  git rev-list --all --objects
  echo "master commit SHA: $(git log -1 --format="%H")"
  echo "mybranch commit SHA: $(git log -1 --format="%H")"
  git ls-tree master
  git ls-tree mybranch | grep mybranch
  git ls-tree master~ | grep root
)

# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'

rm -rf server_repo local_repo
mkdir server_repo
cd server_repo

# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet

# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet

# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet

echo "# List and identify all objects"
list-objects
echo

# Restore master.
git checkout --quiet master
cd ..

# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo

# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo

echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo

echo "# Git checkout fetches the missing file from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/a
echo

echo "# Missing objects after checking out d1/a"
git rev-list --all --quiet --objects --missing=print

GitHub上游

Git v2.19.0中的输出:

# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75    d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a    d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3    master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043    mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f    root

# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63

# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.

Please make sure you have the correct access rights
and the repository exists.

# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.

# Missing objects after checking out d1
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb

结论:除所有斑点外d1/a均缺失。例如f70a17f51b7b30fec48a32e4f19ac15e261fd1a4d1/b结帐后不存在d1/

请注意,root/root并且mybranch/mybranch也丢失了,但是--depth 1将其从丢失的文件列表中隐藏了。如果删除--depth 1,则它们将显示在丢失文件的列表中。


2
很好,我一定错过了这个选择。+1
VonC

7

你可以做到

git archive --format=tar --remote=origin HEAD | tar xf -
git archive --format=tar --remote=origin HEAD <file> | tar xf -

6

已经给出的两种变体:

git archive --format=tar --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | tar -O -xf -

和:

git archive --format=zip --remote=git://git.foo.com/project.git HEAD:path/to/directory filename | funzip

这些将文件写入标准输出。


6

说文件名是123.txt,这对我有用:

git checkout --theirs  123.txt

如果文件在目录A中,请确保正确指定它:

git checkout --theirs  "A/123.txt"

4

在git中,在更新文件之前不要“检出”文件 -看来这就是您要执行的操作。

许多系统(例如clearcase,csv等)都要求您先“检出”文件,然后才能对其进行更改。Git不需要这个。您克隆存储库,然后在存储库的本地副本中进行更改。

更新文件后,您可以执行以下操作:

git status

查看哪些文件已被修改。您首先添加要提交的内容indexindex就像要签入的列表一样):

git add .

要么

git add blah.c

然后do git status会向您显示哪些文件已修改,哪些文件已index准备好提交或签入。

要将文件提交到存储库副本中,请执行以下操作:

git commit -a -m "commit message here"

请参阅git网站以获取手册和指南的链接。


1
而且,如果您的目标是修补此单个文件并提交回去,则需要推送(但可能对此项目没有推送访问权限?)或用于git format-patch创建要提交的补丁(git format-patch -1会创建补丁)仅用于您最近一次的提交)。
卡斯卡贝尔

谢谢,这是从Clearcase到Git的一个很好的解释
Kolob峡谷

4

这是仅在git存储库中拉入和推入特定文件的完整解决方案:

  1. 首先,您需要克隆带有特殊提示的git存储库–无需签出
git clone --no-checkout <git url>
  1. 下一步是使用以下命令删除索引中未暂存的文件:
git reset
  1. 现在,您可以使用以下命令开始提取要更改的文件:
git checkout origin/master <path to file>
  1. 现在,存储库文件夹包含您可以立即开始编辑的文件。编辑后,您需要执行简单和熟悉的命令序列。
git add <path to file>
git commit -m <message text>
git push

另请参阅链接以获取一些其他信息。


1

听起来您正在尝试从集中版本控制中继承一个想法,而git本质上不是,它是分布式的。如果要使用git存储库,请克隆它。然后,您将拥有工作树的所有内容以及所有的历史记录(至少,直到当前分支尖端的所有内容),而不仅仅是单个文件或单个提交的快照。

 git clone /path/to/repo
 git clone git://url/of/repo
 git clone http://url/of/repo

1

如果您需要远程Git存储库中特定分支的特定文件则命令为:

git archive --remote=git://git.example.com/project.git refs/heads/mybranch path/to/myfile |tar xf -

其余的可以从@VonC的答案中得出:

如果您需要master分支中的特定文件,则为:

git archive --remote=git://git.example.com/project.git HEAD path/to/myfile |tar xf -

如果您需要标签中的特定文件,则为:

git archive --remote=git://git.example.com/project.git mytag path/to/myfile |tar xf -

Mother Corp.决定现在可以自动进行HTTP / S访问!这项技术使我可以自动从存储库中获取单个文件,而无需检出Whole Thing。谢谢大家!
JS。

0

我没有在这里列出对我有用的内容,因此,如果有人遇到我,我将把它包括在内。

我的情况是,我有一个可能包含10,000个文件的远程存储库,并且需要为我的Linux系统构建一个RPM文件。RPM的构建包括所有内容的git克隆。我只需要一个文件即可开始RPM构建。我可以克隆整个源代码树,这可以完成我需要的工作,但是当我只需要一个文件时,就需要花两分钟的时间来下载所有这些文件。我尝试使用所讨论的git archive选项,但发现“致命:协议不支持该操作”。看来我必须在服务器上启用某种存档选项,并且我的服务器是由官僚恶棍维护的,这些恶棍喜欢使事情很难完成。

最后我要做的是进入Web界面的bitbucket,并查看了我需要的一个文件。我右键单击链接以下载文件的原始副本,然后从出现的弹出窗口中选择“复制快捷方式”。我不能只下载原始文件,因为我需要使事情自动化,并且我的Linux服务器上没有浏览器界面。

为了便于讨论,生成了以下URL:

https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest

我无法直接从bitbucket存储库下载此文件,因为我需要先登录。经过一番挖掘后,我发现这可行:在Linux上:

echo "myUser:myPass123"| base64
bXlVc2VyOm15UGFzczEyMwo=

curl -H 'Authorization: Basic bXlVc2VyOm15UGFzczEyMwo=' 'https://ourArchive.ourCompany.com/projects/ThisProject/repos/data/raw/foo/bar.spec?at=refs%2Fheads%2FTheBranchOfInterest' > bar.spec

这种组合使我可以下载构建其他文件所需的一个文件。


0

我正在添加此答案,以代替进行正式结帐或其他类似的本地操作。假设您有权访问Git提供程序的Web界面,则可以在给定的所需提交下直接查看任何文件。例如,在GitHub上,您可以使用以下代码:

https://github.com/hubotio/hubot/blob/ed25584f/src/adapter.coffee

ed25584f是感兴趣提交的SHA-1哈希中的前8个字符,其后是源文件的路径。

类似地,在Bitbucket上,我们可以尝试:

https://bitbucket.org/cofarrell/stash-browse-code-plugin/src/06befe08

在这种情况下,我们将提交哈希放在源URL的末尾。


-1

如果您只需要下载文件,则无需使用Git签出。

GitHub Mate更容易实现,它是一个Chrome扩展程序,可让您单击文件图标进行下载。也开源


7
git!=github
jan groth

-3

如果您已经编辑了文件的本地版本,并希望恢复到中央服务器上维护的原始版本,则可以使用Git Extensions轻松实现。

  • 最初,由于文件已被修改,因此将被标记为提交
  • 在文件树菜单中选择(双击)文件
  • 列出了单个文件的修订树。
  • 选择树的顶部/ HEAD,然后右键单击另存为
  • 保存文件以覆盖文件的修改后的本地版本
  • 该文件现在具有正确的版本,将不再标记为提交!

简单!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.