我有我的Git存储库,它的根目录有两个子目录:
/finisht
/static
在SVN中时,/finisht
在一个地方/static
签出,而在其他地方签出,就像这样:
svn co svn+ssh://admin@domain.com/home/admin/repos/finisht/static static
有没有办法用Git做到这一点?
git clone
最简单的命令是什么?我用这个简单的答案。如果有更简单的事情,请评论
我有我的Git存储库,它的根目录有两个子目录:
/finisht
/static
在SVN中时,/finisht
在一个地方/static
签出,而在其他地方签出,就像这样:
svn co svn+ssh://admin@domain.com/home/admin/repos/finisht/static static
有没有办法用Git做到这一点?
git clone
最简单的命令是什么?我用这个简单的答案。如果有更简单的事情,请评论
Answers:
编辑:从Git 2.19开始,这最终是可能的,如在此答案中可以看到的。
考虑提高答案。
注意:在Git 2.19中,仅实现了客户端支持,仍然缺少服务器端支持,因此仅在克隆本地存储库时有效。还要注意,大型GitHub托管者(例如GitHub)实际上并不使用Git服务器,而是使用自己的实现,因此即使在Git服务器中显示了支持,也并不意味着它可以自动在Git托管者上使用。(OTOH,因为他们不使用Git服务器,所以可以在自己的实现中更快地实现它,然后再将其显示在Git服务器中。)
不,这在Git中是不可能的。
在Git中实现这样的工作将是一项巨大的工作,这将意味着不再能够保证客户端存储库的完整性。如果您有兴趣,请在git邮件列表上搜索有关“稀疏克隆”和“稀疏访存”的讨论。
通常,Git社区的共识是,如果您有几个始终独立检出的目录,则它们实际上是两个不同的项目,应该位于两个不同的存储库中。您可以使用Git子模块将它们重新粘合在一起。
git-read-tree
,很久之后get-fetch
。问题不在于只检出一个子目录,而在于仅克隆一个子目录。我看不到稀疏检出怎么可能做到这一点,因为git-read-tree
在克隆完成后才运行。
您尝试执行的操作称为稀疏签出,该功能已在git 1.7.0中添加(2012年2月)。进行稀疏克隆的步骤如下:
mkdir <repo>
cd <repo>
git init
git remote add -f origin <url>
这将使用您的遥控器创建一个空的存储库,并获取所有对象,但不将其检出。然后做:
git config core.sparseCheckout true
现在,您需要定义要实际检出的文件/文件夹。通过在中列出它们来完成此操作.git/info/sparse-checkout
,例如:
echo "some/dir/" >> .git/info/sparse-checkout
echo "another/sub/tree" >> .git/info/sparse-checkout
最后但并非最不重要的一点是,使用远程状态更新空仓库:
git pull origin master
现在,您将在文件系统上some/dir
和another/sub/tree
在文件系统上“检出” 文件(这些路径仍然存在),并且不存在其他路径。
作为功能:
function git_sparse_clone() (
rurl="$1" localdir="$2" && shift 2
mkdir -p "$localdir"
cd "$localdir"
git init
git remote add -f origin "$rurl"
git config core.sparseCheckout true
# Loops over remaining args
for i; do
echo "$i" >> .git/info/sparse-checkout
done
git pull origin master
)
用法:
git_sparse_clone "http://github.com/tj/n" "./local/location" "/bin"
请注意,这仍将从服务器下载整个存储库-仅减少结帐的大小。目前,无法仅克隆单个目录。但是,如果您不需要存储库的历史记录,则至少可以通过创建浅表克隆来节省带宽。有关如何组合浅表克隆和稀疏校验的信息,请参见下面的udondan答案。
从git 2.25.0(2020年1月)开始,在git中添加了一个实验性的sparse-checkout命令:
git sparse-checkout init
# same as:
git config core.sparseCheckout true
git sparse-checkout set "A/B"
# same as:
echo "A/B" >> .git/info/sparse-checkout
git sparse-checkout list
# same as:
cat .git/info/sparse-checkout
https://github.com/Umkus/nginx-boilerplate/tree/master/src
正确的内容克隆到/etc/nginx
git remote add
命令并没有意味着获取,但git remote add -f
,这里所用,不!那就是-f
手段。
--depth=1
我克隆了338 MB的Chromium Devtools,而不是4.9 GB的完整Blink源+历史记录。优秀的。
git clone --filter
从Git 2.19
该选项实际上将跳过从服务器获取不需要的对象的操作。还包括--filter=tree:0
来自Git 2.20和--filter=combine
Git 2.24中添加的复合过滤器,我们最终得到:
git clone \
--depth 1 \
--filter=combine:blob:none+tree:0 \
--no-checkout \
"file://$(pwd)/server_repo" \
local_repo \
;
cd local_repo
git checkout master -- mydir/
服务器应配置为:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
对Git远程协议进行了扩展,以支持此功能,v2.19.0
并实际上跳过了提取不需要的对象的操作,但是当时没有服务器支持。但是它已经可以在本地测试。
命令细目:
--filter=blob:none
跳过所有Blob,但仍获取所有树对象--filter=tree:0
跳过不需要的树:https : //www.spinics.net/lists/git/msg342006.html--depth 1
已经暗示--single-branch
,另请参见:如何在Git中克隆单个分支?file://$(path)
需要克服git clone
协议诡计:如何使用相对路径浅克隆本地git存储库?--filter=combine:FILTER1+FILTER2
是一次使用多个过滤器的语法,--filter
由于某种原因尝试通过失败,并显示:“多个过滤器规格无法合并”。它是在Git 2.24中的e987df5fe62b8b29be4cdcdeb3704681ada2b29e“列表对象过滤器:实现复合过滤器”中添加的的格式--filter
记录在上man git-rev-list
。
Git树上的文档:
测试一下
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing directory from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/
echo
echo "# Missing objects after checking out d1"
git rev-list --all --quiet --objects --missing=print
Git v2.19.0中的输出:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
结论:d1/
缺少来自外部的所有斑点。例如0975df9b39e23c15f63db194df7f45c76528bccb
,d2/b
退房后不存在d1/a
。
请注意,root/root
并且mybranch/mybranch
也丢失了,但是--depth 1
将其从丢失的文件列表中隐藏了。如果删除--depth 1
,则它们将显示在丢失文件的列表中。
我有一个梦想
此功能可能会彻底改变Git。
想象一下,将您企业的所有代码库都放在一个存储库中,而没有诸如丑陋的第三方工具repo
。
想象一下,将巨大的Blob直接存储在仓库中,而无需任何丑陋的第三方扩展。
想象一下,如果GitHub允许每个文件/目录的元数据(例如星号和权限),那么您可以将所有个人内容存储在一个存储库中。
想象一下子模块是否与常规目录完全一样:仅请求树状SHA,类似DNS的机制可解决您的请求,首先在本地~/.git
上查找,然后在更近的服务器(您企业的镜像/缓存)上查找并最终在GitHub上进行。
fatal: invalid filter-spec 'combine:blob:none+tree:0'
不管怎么说,还是要谢谢你!也许它将与更新的版本一起使用。
您可以结合使用稀疏签出和浅表克隆功能。在浅克隆切断历史和稀疏结帐只翻出符合模式的文件。
git init <repo>
cd <repo>
git remote add origin <url>
git config core.sparsecheckout true
echo "finisht/*" >> .git/info/sparse-checkout
git pull --depth=1 origin master
您需要最低git 1.9才能运行。我自己仅使用2.2.0和2.2.2进行了测试。
这样,您仍然可以进行推送,而使用则无法实现git archive
。
git pull --depth=1 origin master
而是对我不起作用git pull --depth=1 origin <any-other-branch>
。这太奇怪了,在这里看到我的问题:stackoverflow.com/questions/35820630/…–
对于只想从github 下载文件/文件夹的其他用户,只需使用:
svn export <repo>/trunk/<folder>
例如
svn export https://github.com/lodash/lodash.com/trunk/docs
(是的,这里是svn。显然在2016年,您仍然需要svn来简单下载一些github文件)
重要 -确保更新github URL并替换/tree/master/
为'/ trunk /'。
作为bash脚本:
git-download(){
folder=${@/tree\/master/trunk}
folder=${folder/blob\/master/trunk}
svn export $folder
}
注意 此方法下载一个文件夹,不克隆/签出它。您不能将更改推回存储库。另一方面-与稀疏结帐或浅结帐相比,下载量较小。
https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/trunk/udacity
但出现svn: E170000: URL 'https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/trunk/udacity' doesn't exist
错误:(
如果您从未打算与要克隆的存储库进行交互,则可以执行完整的git克隆,并使用git filter-branch --subdirectory-filter重写存储库。这样,至少将保留历史。
git filter-branch --subdirectory-filter <subdirectory>
git clone https://github.com/your/repo_xx.git && cd repo_xx && git filter-branch --subdirectory-filter repo_xx_subdir
这看起来要简单得多:
git archive --remote=<repo_url> <branch> <path> | tar xvf -
svn export
改用
Git 1.7.0具有“稀疏签出”功能。请参见git config联机帮助页中的“ core.sparseCheckout”,git读取树联机帮助页中的“ Sparse checkout” 和git update-index联机帮助页中的“ Skip-worktree位” 。
该接口不如SVN方便(例如,在初始克隆时无法进行稀疏签出),但是现在可以使用可用于构建更简单接口的基本功能。
无法仅使用Git克隆子目录,但以下是一些解决方法。
您可能想要重写存储库,使其看起来好像trunk/public_html/
是其项目根目录,并丢弃所有其他历史记录(使用filter-branch
),尝试使用已经签出的分支:
git filter-branch --subdirectory-filter trunk/public_html -- --all
注意:--
可以将筛选器分支选项与修订选项分开,并且--all
可以重写所有分支和标记。将保留所有信息,包括原始提交时间或合并信息。该命令支持名称空间.git/info/grafts
中的文件和引用refs/replace/
,因此,如果refs
定义了任何嫁接或替换,运行此命令将使它们永久化。
警告!重写的历史记录将为所有对象使用不同的对象名称,并且不会与原始分支收敛。您将无法轻松地将重写的分支推送并分发到原始分支的顶部。如果您不了解全部含义,请不要使用此命令;如果简单的一次提交就足以解决问题,请不要使用此命令。
这是使用稀疏签出方法的简单步骤,该方法将稀疏地填充工作目录,因此您可以告诉Git工作目录中哪些文件夹或文件值得签出。
照常克隆存储库(--no-checkout
是可选的):
git clone --no-checkout git@foo/bar.git
cd bar
如果您的存储库已经克隆,则可以跳过此步骤。
提示:对于大型存储库,请考虑使用浅表克隆(--depth 1
)仅检出最新版本或/和/或--single-branch
仅检出最新版本。
启用sparseCheckout
选项:
git config core.sparseCheckout true
指定用于稀疏签出的文件夹(末尾没有空格):
echo "trunk/public_html/*"> .git/info/sparse-checkout
或编辑.git/info/sparse-checkout
。
检出分支(例如master
):
git checkout master
现在,您应该已经在当前目录中选择了文件夹。
如果目录或过滤分支的级别过多,则可以考虑使用符号链接。
pull
?
filter-branch
会重写父提交,因此它们将具有不同的SHA1 ID,因此,经过过滤的树将没有与远程树相同的提交。 git pull
不知道从哪里尝试合并。
这将克隆特定的文件夹,并删除所有与此文件夹不相关的历史记录。
git clone --single-branch -b {branch} git@github.com:{user}/{repo}.git
git filter-branch --subdirectory-filter {path/to/folder} HEAD
git remote remove origin
git remote add origin git@github.com:{user}/{new-repo}.git
git push -u origin master
这是我为单个子目录稀疏签出的用例编写的shell脚本
localRepo=$1
remoteRepo=$2
subDir=$3
# Create local repository for subdirectory checkout, make it hidden to avoid having to drill down to the subfolder
mkdir ./.$localRepo
cd ./.$localRepo
git init
git remote add -f origin $remoteRepo
git config core.sparseCheckout true
# Add the subdirectory of interest to the sparse checkout.
echo $subDir >> .git/info/sparse-checkout
git pull origin master
# Create convenience symlink to the subdirectory of interest
cd ..
ln -s ./.$localRepo/$subDir $localRepo
ln -s ./.$localRepo/$subDir $localRepo
代替符号链接,而应该修复 ln -s ./.$localRepo$subDir $localRepo
我写了一个.gitconfig
[alias]
用于执行“稀疏签出”的代码。签出(无双关语):
在Windows上运行 cmd.exe
git config --global alias.sparse-checkout "!f(){ [ $# -eq 2 ] && L=${1##*/} L=${L%.git} || L=$2; mkdir -p \"$L/.git/info\" && cd \"$L\" && git init --template= && git remote add origin \"$1\" && git config core.sparseCheckout 1; [ $# -eq 2 ] && echo \"$2\" >> .git/info/sparse-checkout || { shift 2; for i; do echo $i >> .git/info/sparse-checkout; done }; git pull --depth 1 origin master;};f"
除此以外:
git config --global alias.sparse-checkout '!f(){ [ $# -eq 2 ] && L=${1##*/} L=${L%.git} || L=$2; mkdir -p "$L/.git/info" && cd "$L" && git init --template= && git remote add origin "$1" && git config core.sparseCheckout 1; [ $# -eq 2 ] && echo "$2" >> .git/info/sparse-checkout || { shift 2; for i; do echo $i >> .git/info/sparse-checkout; done }; git pull --depth 1 origin master;};f'
用法:
# Makes a directory ForStackExchange with Plug checked out
git sparse-checkout https://github.com/YenForYang/ForStackExchange Plug
# To do more than 1 directory, you have to specify the local directory:
git sparse-checkout https://github.com/YenForYang/ForStackExchange ForStackExchange Plug Folder
该git config
命令是为方便和存储“精缩”,但这里是扩大了别名:
# Note the --template= is for disabling templates.
# Feel free to remove it if you don't have issues with them (like I did)
# `mkdir` makes the .git/info directory ahead of time, as I've found it missing sometimes for some reason
f(){
[ "$#" -eq 2 ] && L="${1##*/}" L=${L%.git} || L=$2;
mkdir -p "$L/.git/info"
&& cd "$L"
&& git init --template=
&& git remote add origin "$1"
&& git config core.sparseCheckout 1;
[ "$#" -eq 2 ]
&& echo "$2" >> .git/info/sparse-checkout
|| {
shift 2;
for i; do
echo $i >> .git/info/sparse-checkout;
done
};
git pull --depth 1 origin master;
};
f
L=${1##*/} L=${L%.git}
?太空是运营商吗?
使用Linux?并且只想要易于访问和清理工作树?无需打扰计算机上的其余代码。尝试符号链接!
git clone https://github.com:{user}/{repo}.git ~/my-project
ln -s ~/my-project/my-subfolder ~/Desktop/my-subfolder
测试
cd ~/Desktop/my-subfolder
git status
只是为了澄清一些很好的答案,许多答案中概述的步骤都假定您已经在某个地方有一个远程存储库。
给定:现有的git存储库,例如git@github.com:some-user/full-repo.git
,具有一个或多个您希望独立于存储库其余部分提取的目录,例如,名为app1
和的目录app2
假设您有一个上面的git存储库...
然后:您可以运行以下步骤,仅从较大的存储库中提取特定目录:
mkdir app1
cd app1
git init
git remote add origin git@github.com:some-user/full-repo.git
git config core.sparsecheckout true
echo "app1/" >> .git/info/sparse-checkout
git pull origin master
我错误地认为必须在原始存储库上设置稀疏签出选项:事实并非如此。在从远程目录中拉出之前,您可以在本地定义想要的目录。希望这个澄清对其他人有帮助。
虽然我讨厌在处理git repos时实际上不得不使用svn:/我一直都在使用它;
function git-scp() (
URL="$1" && shift 1
svn export ${URL/blob\/master/trunk}
)
这使您无需修改即可从github网址中复制出来。用法;
--- /tmp » git-scp https://github.com/dgraph-io/dgraph/blob/master/contrib/config/kubernetes/helm 1 ↵
A helm
A helm/Chart.yaml
A helm/README.md
A helm/values.yaml
Exported revision 6367.
--- /tmp » ls | grep helm
Permissions Size User Date Modified Name
drwxr-xr-x - anthony 2020-01-07 15:53 helm/
因此,我尝试了这一步中的所有操作,但对我没有任何帮助...事实证明,在Git 2.24版(此答案发布时cpanel附带的版本)上,您无需执行此操作
echo "wpm/*" >> .git/info/sparse-checkout
您只需要文件夹名称
wpm/*
简而言之,您可以这样做
git config core.sparsecheckout true
然后,您可以编辑.git / info / sparse-checkout并在末尾添加带有/ *的文件夹名称(每行一个),以获取子文件夹和文件
wpm/*
保存并运行checkout命令
git checkout master
结果是我仓库中的预期文件夹,如果适合您,则别无其他Upvote