分布式版本控制系统入门

红薯 发布于 2009/05/26 23:54
阅读 3K+
收藏 8

在过去几年,对于分布式版本控制可以给开发过程提供的益处有许多争论。最近,分布式工具已经很成熟了。尽管分布式工具的一些优点最初可能不明显,但是从长 期来看,它们提供的灵活性是非常有意义的。阅读完本文之后,您应该能够开始使用分布式版本控制系统,基本了解分布式模型能够提供的优点。

围绕分布式版本控制的争论主要集中在不再需要的中心服务器。这是一个非常独特的特性,对于一些开发人员组很重 要,但是它的真正价值在于,它允许开发人员组实现他们选择的几乎任何工作流。它能够完成很多事情,比如传统的集中式模型,或两个开发人员在咖啡馆通过无线 连接协同工作,等等。

允许开发人员以各种新的方式工作,这是分布式版本控制真正令人兴奋的特点。实际上,在本文末尾会介绍如何实现这样的“咖啡馆”工作流。这对于作家、学校教师和 Linux® 内核开发人员都有益处。

什么是分布式版本控制?

分布式版本控制 (DVCS) 是一种不需要中心服务器的管理文件版本的方法,但是它也可以使用中心服务器。更改可以被合并到 DVCS 的任何其他用户的系统中,因此可以实现非常灵活的工作流。

DVCS 的两个主要优点是:它比集中的版本控制更灵活,因为它除了支持传统的(集中式)工作流,还支持其他各种工作流;它比集中式服务器快得多,因为大多数操作在客户机本地进行,而不需要网络操作。

什么是钩子?
钩子是在版本控制操作的生命周期中通过程序执行操作的方法。例如,通过使用钩子,可以在代码签入(check in)存储库时自动发送电子邮件。另外,还可以在签入代码之前,检查用户是否满足一组条件,比如包含一个测试文件。

另一种扩展版本控制系统功能的方法是编写插件。如果打算编写自己的插件,在 参考资料 中可以找到描述 Bazaar、Git 和 Mercurial 的插件系统的文章链接。

DVCS 和集中式版本控制系统的主要差异

在 DVCS 和集中式版本控制系统之间有三个关键差异。第一个差异是,DVCS 通过本地提交支持离线工作,这是由 DVCS 的操作方式决定的。这与集中式版本控制完全不同,集中式版本控制要求通过到中心服务器的连接执行所有操作。这种灵活性让开发人员在飞机上也能够像在办公室 中一样轻松地工作,可以一次又一次地进行提交。

第二个差异是 DVCS 比集中式系统更灵活,因为 DVCS 支持许多不同类型的工作流,从传统的集中式工作流到纯粹的特殊工作流,再到特殊工作流和集中式工作流的组合。这种灵活性允许通过电子邮件、对等网络和开发团队喜欢的任何方式进行开发。

第三个差异是 DVCS 比集中式版本控制系统快得多,因为大多数操作在客户机上进行,速度非常快。另外,在需要进行推(push )操作(与另一个节点通信)时,速度也更快,因为两个客户机机器上都有完整的元数据。速度差异相当显著,根据使用本地存储库还是网络存储库,DVCS 比 Subversion 快大约 3-10 倍。

 




回页首


分布式版本控制工作流

因为 DVCS 非常灵活,可以实现各种各样的工作流,但是由于篇幅有限,本文只讨论两种工作流。首先讨论最常用的工作流之一 Partner 工作流。按照 Partner 工作流,一个开发人员启动一个项目,然后进行分支。然后,在不同开发人员工作的分支之间来回合并更改。

第二种常用的工作流是通过本地提交使用集中式服务器。在这种工作流中,开发人员的工作方式与使用集中式 subversion 存储库时非常相似,但是他们进行本地提交,然后把最终更改推到集中式服务器。这种工作流有许多变体,包括与 Partner 工作流结合使用。重要的是,可以采用许多种工作方式,通过使用 DVCS,可以灵活地选择最适合自己的工作方式。

 




回页首


快速入门指南

了解一种新技术的最好方法之一是实际使用它。在本节中,简要介绍 Mercurial、Bazaar 和 Git 中的常用操作,您可以试试这些操作:

  • Mercurial
    • 安装:sudo easy_install-2.5 mercurial
    • 建立项目目录:mkdir hgrepo; cd hgrepo
    • 初始化项目:hg init
    • 添加文件:touch foo.txt; hg add foo.txt
    • 提交:hg commit -m "added foo.txt" commit
    • 抓取共享的存储库:hg clone ssh://example.com//projects/hgrepo
    • 本地提交更改:hg -ci -m "adding a change"
    • 把更改推到服务器:hg push
    • 以补丁形式查看未处理的更新:hg incoming -p
    • 从服务器下载更新:hg pull
    • 应用更改:hg update
    • 合并冲突:hg merge
    • 合并两个不相关的远程存储库:hg pull -f ssh://example2.com//projects/hgrepo
  • Bazaar
    • 安装:sudo easy_install-2.5 bzr
    • 建立项目目录:mkdir bzrrepo; cd bzrrepo
    • 初始化项目:bzr init
    • 添加文件:touch foo.txt; bzr add foo.txt
    • 提交:bzr commit -m "added foo.txt" commit
    • 抓取共享的存储库:bzr branch bzr+ssh://example.com/projects/gitrepo
    • 本地提交更改:bzr -ci -m "adding a change"
    • 把更改推到服务器:bzr push
    • 从服务器下载更新:bzr pull
    • 应用更改:bzr update
    • 合并冲突:bzr merge
  • Git
    • 安装:下载最新的 tar 文件 http://kernel.org/pub/software/scm/
    • 建立项目目录:mkdir gitrepo; cd gitrepo
    • 初始化项目:git init
    • 添加文件:touch foo.txt; git add foo.txt
    • 提交:git commit -m "added foo.txt" commit
    • 抓取共享的存储库:git clone ssh://example.com/projects/bzrrepo
    • 本地提交更改:bzr -ci -m "adding a change" commit
    • 把更改推到服务器:bzr push
    • 从服务器下载更新:bzr pull
    • 应用更改:bzr update
    • 合并冲突:bzr merge

 




回页首


转换工具和与 subversion 的集成

这三种 DVCS 都能够把现有的 subversion 存储库轻松地转换为各自的格式,甚至可以在不同的 DVCS 之间进行转换。这使开发人员能够方便地试用 DVCS 或从一种 DVCS 转移到另一种 DVCS。

例如,对于 Mercurial,可以使用工具 hgimportsvn 和 hgpullsvn 与现有的 subversion 存储库通信,创建新的 hg 存储库和历史。tailor 工具是一种通用的存储库转换工具。

另一种有意思的试用方法是集成 DVCS 与现有的 subversion 存储库。对这种方法的详细讨论超出了本文的范围,但是 参考资料 给出了一些工具的链接,这些工具可以在 subversion 分支与 Git、Bazaar 和 Mercurial 之间进行双向操作。

 




回页首


第三方托管选项

如果开放源码或商业开发人员不希望或不需要管理自己的集中式 “集线器”,那么可以选用流行的托管站点托管自己的 Git、Bazaar 或 Mercurial 项目。对于 Mercurial,流行的免费和付费托管站点是 Bitbucket。对于 Git,可以使用 Github;对于 Bazaar,可以使用由 Canonical 发起的 Launchpad。

 




回页首


提示:“咖啡馆” Mercurial 工作流


图 1. 咖啡馆工作流
咖啡馆工作流

如果希望实现安全的特殊版本控制工作流,让两个开发人员可以在咖啡馆中通过无线网络一起工作,那么可以试试下面的方法。

第一个用户使用 Mercurial 创建一个存储库:

mkdir /tmp/myhgrepo
cd /tmp/myhgrepo
hg init

 

然后,通过 Web 作为只读共享共享它:

hg serve

 

第二个用户使用以下命令克隆这个存储库:

hg clone http://example.com:8000

 

注意:这是另一台机器的 IP 地址或本地主机名。在 OS X 上,可以通过对 your-machine-name.local 使用 Bonjour 获得这一信息。

第二个用户进行他需要的更改,然后作为只读的 HTTP 共享提供他的存储库:

http://example.com:8000

 

第一个用户对第二个用户的存储库拷贝执行 hg 拖操作:

hg clone http://example2.com:8000

 

每个开发人员都是安全的,因为他们只在需要更新自己的本地文件系统时才对对方的存储库进行拖操作。

 




回页首


结束语

本文讨论了分布式版本控制能够提供的价值,比较了三种主流工具 Git、Mercurial 和 Bazaar 之间的差异。如果您不太熟悉版本控制,那么应该继续学习版本控制、钩子和插件以及它们能够提供的功能。

如果您是老手,那么应该试试这些工具,寻找最适合自己的工具。请通过 参考资料 中的链接详细了解各种分布式版本控制系统以及别人的使用经验。

加载中
返回顶部
顶部