一直用git，你瞭解git的內部機制嗎？

2020-04-25 13:09:31 用戶3157401084373384

在工作過程中我們會不可避免的使用Git，但是你知道Git是如何存儲你的文件、如何保存你的提交信息嗎？等等瞭解這些也便於我們更好的理解和記憶命令，更好的排查問題和使用Git，下面就讓我們來看一下吧~

本文主要依照官網的介紹根據真實項目中的變化總結整理而成

首先，我們要明確 Git 是一個分佈式版本控制系統其本質是一套內容尋址文件系統

通俗點說，Git 從核心上來看不過是簡單地存儲鍵值對（key-value）。它允許插入任意類型的內容，並會返回一個鍵值，通過該鍵值可以在任何時候再取出該內容。

ps : 下面所說的SHA-1碼和 commit_id 是同一種

首先，Git存儲在本地的表現形式

當你在一個新目錄或已有目錄內執行 git init 時，Git 會創建一個 .git 目錄，幾乎所有 Git 存儲和操作的內容都位於該目錄下。如果你要備份或複製一個庫，基本上將這一目錄拷貝至其他地方就可以了。如下圖：

info 目錄保存了一份不希望在 .gitignore 文件中管理的忽略模式 (ignored patterns) 的全局可執行文件
hooks 目錄保存了客戶端或服務端鉤子腳本
config 文件包含了項目特有的配置選項
objects 目錄存儲所有數據內容
refs 目錄存儲指向數據 (分支) 的提交對象的指針
HEAD 文件指向當前分支
index 文件保存了暫存區域信息

其中，HEAD 及 index 文件，objects 及 refs 目錄是 Git 的核心部分。

接下來，說一下Git的存儲方式

如上述所說，objects 目錄存儲所有數據內容，objects 目錄下的每一個文件是Git為每份存儲數據內容生成一個文件，取得該內容與頭信息的 SHA-1 校驗和，創建以該校驗和前兩個字符為名稱的子目錄，並以 (校驗和) 剩下 38 個字符為文件命名 (保存至子目錄下)。如下圖：

打開00文件夾可以看到裡面保存的內容：

Git 以一種類似 UNIX 文件系統但更簡單的方式來存儲內容。所有內容以 tree 或 blob 對象存儲，其中 tree 對象對應於 UNIX 中的目錄，blob 對象則大致對應於 inodes 或文件內容。

一個單獨的 tree 對象包含一條或多條 tree 記錄，每一條記錄含有一個指向 blob 或子 tree 對象的 SHA-1 指針，並附有該對象的權限模式 (mode)、類型和文件名信息。

正如 Git的每一次提交都是對代碼倉庫的完整備份，也就是保存了一份代碼倉庫完整的快照所說，每一個commit都是存儲為一個Tree，如下圖：

具體在git中為：

可以看到，目錄作為tree存儲，文件作為blob存儲

之後，我們通過 git cat-file-p命令可以發現存儲是樹型的，也就是對應於git的tree對象，保存的都是指向下一個部分的索引id 如下圖，每一步都是查看的上一步中的某個id：

上述所說每個commit創建一個樹快照，那麼是通過什麼創建的呢？

這就是我們上述說的用於存儲暫存區信息的index文件了。

通常 Git 根據你的暫存區域或 index 來創建並寫入一個 tree 。因此要創建一個 tree 對象的話首先要通過將一些文件暫存從而創建一個 index 。

這也是為什麼commit前必須要有文件被add到暫存區，如果暫存區為空，commit會報錯停止執行。

這個時候就有一個問題了，我們有多個快照樹，它們指向了你要跟蹤的項目的不同快照，其中也沒有關於誰、何時以及為何保存了這些快照的信息

此時，commit對象就出場了~ 每次commit提交後就會創建一個對應commit 對象，這個對象就是為你保存了這些基本信息的。

一般情況下，一次commit提交就可以理解為創建了一個tree樹，以commit_id為根節點的tree，該樹包含了當前項目的整體快照

當我們使用 git log命令查看提交歷史的時候，就展示了commit對象的一些基本信息，如下圖：

其中：commit 後跟的id就是當前commit快照的樹根節點id 其餘的還包含作者，作者郵箱，創建時間等基本信息

Git每次commit提交會保存項目快照，難道是將所有的文件重新複製一份嗎？

當然不可能，在git的文件系統中，是存在共用文件的。

比如有三次commit提交，產生了三個tree樹，它們在向下引用的時候，如果兩個commit中的整個文件夾或者某個文件沒有改變，這兩個commit的tree會指向同一個對象。對於兩次提交修改了的文件，則會創建一個該文件的一個新的版本的文件，上一次提交指向舊的文件，修改文件的提交指向新版本的文件。

整體情況如下圖：

另外，Git 用 zlib 壓縮文件內容，因此存儲的文件並不會佔用太多空間

瞭解了git整體存儲方式之後，我們再看一下前面提到的存儲指向數據 (分支) 的提交對象的指針的 refs目錄

refs目錄內容如下圖：

首先，也是思考一個問題：在項目開發中，有許多分支，每個分支的提交記錄都不相同，我們也不可能去記住每個commit_id，去執行像 git log1a410e 這樣的命令來查看完整的歷史，這樣的話你就要記得 1a410e 是你最後一次提交併且記得這個id，這樣才能在提交歷史中找到這些對象，git是怎樣的應對這個問題的呢？

這時候，我們需要一個文件來用一個簡單的名字來記錄這些 SHA-1 值，這樣就可以用這些指針而不是原來的 SHA-1 值去檢索了。在 Git 中，稱之為“引用”（references 或者 refs）。

可以在 .git/refs 目錄下面找到這些包含 SHA-1 值的文件。如下圖refs中heads文件下的文件，其中每個文件存儲的是與文件名同名的分支的最新提交的commit_id：

添加上refs文件夾下的文件後，我們的Git存儲結構就看起來像下圖：

接下來，再思考一個問題，git是怎麼標識當前是在什麼分支，從而找到refs中對應的映射文件獲取SHA-1值呢？

那就是前面所說的HEAD文件了，我們打開文件可以看到以下內容：ref:refs/heads/test_branch

這裡標識的是當前指向的是test_branch分支，並且指定了要是用的映射文件的路徑，這樣就解決了上述問題，是不是特別簡單~

上述已經介紹了Git的三個主要類型：tree樹、commit對象、HEAD。下面我們說一下Git中另外一個重要的東西：Tag（標籤）Tag 對象比較簡單，Tag對象非常像一個 commit 對象---包含一個標籤，一組數據，一個消息和一個指針。最主要的區別就是 Tag 對象指向一個 commit 而不是一個 tree。它就像是一個分支引用，但是不會變化，永遠指向同一個 commit，僅僅是為了提供一個更加友好的名字。

好了，通過介紹了git的核心組成元素 HEAD及index文件，objects及refs目錄 , 你應該會對git的存儲和一些機制有一個簡單的整體瞭解，這對我們更好的理解git命令和更好的使用git是有幫助的。希望本片文章會對大家有些許幫助~

分享到:

閱讀更多 用戶3157401084373384 的文章

關鍵字: 目錄腳本語言保存

git 本地分支與遠程分支

Git 常用命令

【git】本地項目關聯到遠程項目

GIT 合併其它分支到新分支上

Git Bash快速入門

一個 .git 目錄，領悟 Git 的強大！

Git 如何優雅地回退代碼

Git 常用命令合集

Git 分支設計規範

02.28 Git 分支設計規範

git 常用命令

git 編譯安裝

Git 工作流程

Git 如何優雅的回退代碼？

git 高級用法小抄

01.29 GIT 學習指南

送給你 12 個 Git 使用技巧

別亂提交代碼了，看下大廠 Git 提交規範是怎麼做的

git 源碼安裝

高頻使用的 Git 命令集合，看完自信 git push

git(常用命令清單)

git 切換遠程倉庫地址

git 分支合併策略

關於 Git 提交這些規範，你都遵守了嗎？

git rm 和 rm的區別

珍藏多年的 Git 問題和操作清單

GIT 撤銷修改，恢復修改前的版本

Git 分支簡介、Git 和 GitHub 日常操作

Git 命令總結

git 入門教程之 git 私服搭建教程

git 入門教程之變基合併

Git 服務器部署

Git 工作區、暫存區和版本庫詳解

git-基本的工作流程

如何高效的使用 Git？

Git 使用雜記

9個SpringCloud實戰代碼分享:Eureka、Ribbon、Feign、Zuul、Git

Git 實用小命令收集

Git 內部原理之 Git 引用

GIT 命令入門

撤銷 git commit——amend

Git 使用簡介

Git 原理詳解及實用指南

git 多人合作合併代碼時常出現的問題

Git 分支操作介紹

工作常用 Git 命令小清單（建議收藏）

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"