零基礎 SQL 數據庫小白,從入門到精通的學習路線與書單

零基礎 SQL 數據庫小白,從入門到精通的學習路線與書單


一,學SQL的苦惱

我觀察了 865 個 SQL 入門者,發現大家在學習 SQL 的時候,最大的問題不是 SQL 語法,而是對 SQL 原理的不熟悉。

很多初學者,往往被 SQL 能做什麼,為什麼會有 SQL 這門語言給迷惑到了。他們用學英語的方法,去學SQL,結果發現什麼都學不到,而且感覺越來越難學,難用。想想你為什麼討厭英語就明白了,每次翻開詞典,從 abandon 學起來,不到 10 頁就學不下去了,不就是因為太枯燥,太乏味了嘛。

假如我告訴你,聽聽音樂 yesterday once more, 看看電影 iron man 就能輕鬆學好英語,是不是覺得有趣多了? 學 SQL 和學英語一樣,選擇枯燥的學習模式,必然帶來不好的學習結果。我們追求的是輕鬆學 SQL 的方法。

做個廣告,我公眾號【有關SQL】有近1萬訂閱者,分享了很多數據庫論文與學習資料,還與許多讀者深入交流了 SQL 數據庫,Python, 以及大數據的學習方法,歡迎關注。


二,SQL 的原理

SQL 的原理,超級簡單,四個字,集合運算。

所有複雜的 SQL 語句,命令都是圍繞著這個本質在做文章,添油加醋。

如果對集合這個概念陌生,沒關係,高中畢業那麼久,不記得情有可原。畢竟當時老師也不知道,風靡全球的 SQL 會基於集合理念發明出來。

集合,最簡單的例子就是數組,比如 { a, b, c, d}。舉個形象化的例子,比如大學全班同學,這是個大集合,按照性別進而可以分成男同學集合和女同學集合。

男同學有什麼特徵?高大,威猛,有鬍子。

女同學有什麼特徵?白嫩,溫柔,有長髮。

就這樣,我們有兩個大集合了,男同學集合,女同學集合。回到 SQL 的原理上來,針對這兩個集合,SQL 運算做的事情,無非就是這幾樣:

  1. 尋找身高大於180cm的男同學
  2. 尋找身高最高的男同學
  3. 尋找有鬍子的男同學
  4. 尋找長了鬍子,身高低於160cm的男同學
  5. 統計沒有長鬍子的男同學人數
  6. 尋找最高的女同學
  7. 尋找最白的女同學
  8. 尋找又高又白的女同學
  9. 尋找正在談戀愛的男女同學
  10. 尋找曾經談過戀愛,而現在又有其他男女朋友的男同學和女同學

你看,無非就是做這些事情。是不是對SQL立馬就有好感了呢!


三,SQL 的數學基礎

如此有趣的一件事情,教科書偏要說的枯燥(希望下面離散數學,集合理論的科普不會煩到你,不想看,完全可以跳過)

  1. 交換律(Commutative Laws):A ∪ B = B∪A, A ∩ B = B ∩ A
  2. 結合律(Associative Laws):(A ∪ B) ∪ C = A ∪ (B∪C) = A ∪ B∪C (A ∩ B) ∩ C = A ∩ (B ∩ C) = A ∩ B ∩ C
  3. 分配律(Distributive Laws): (A ∩ B) ∪C = (A∪C) ∩ (B∪C) (A∪B) ∩ C = (A ∩ C) ∪(B ∩ C)
  4. 等冪律(Impotent laws): A∪A = A,A∩A = A
  5. 吸收律(Absorption laws): (A∩B)∪A = A,(A∪B)∩A = A
  6. 同一律(Domination laws):A∪Ø = A,A∩Ω= A A∪Ω=Ω,A∩Ø = Ø;

參考:http://math001.com/laws_of_set_theory/
這羅列了詳細的集合運算數學表達式。

所以,千萬別被教科書上的數學符號嚇到,而失去了學習SQL的興趣。學霸別聽我的,這些符號我知道對你完全是小菜一碟。


四,SQL基礎問題

下面我們用SQL來回答上面的10個男女同學問題:

  1. 把全班男女同學登記到花名冊上
  2. 找班上的八卦同學打聽男女朋友關係,記錄到戀愛關係秘本上

這裡用到的花名冊,戀愛關係秘本就是數據庫裡的二維表。先建這兩張表,分別是 Students(花名冊表),Relationships(戀愛關係秘本)。為了更加形象,用 Excel 展示下,這兩張表分別長這個樣子:

StudentId Name Gender

Height Mustache SkinColor 001 陳冠奇 男 186 No 白 002 張白芷 女 172 No 白

RelationshipId BoyId GirlId BeginDate CurrentActive EndDate 1001 001 002 2002-4-1 Y 2008-4-1

第一張表是 Students 花名冊表,共有 6 欄,分別解釋下含義:

  • StudentId: 用來標註學生的學號,一個學生只有一個學號;
  • Name:學生姓名;
  • Gender:學生性別;
  • Height:學生身高,cm 為單位
  • Mustache:有無鬍子;
  • SkinColor:膚色

第二張表是 Relationships(戀愛關係秘本),共有 6 欄,分別解釋下:

  • RelationshipId: 男女朋友關係成立的編號,用來確立兩人曾經處過或正在處於關係之中;
  • BoyId:男生編號;
  • GirlId:女生編號;
  • BeginDate:關係成立日期;
  • CurrentActive:當前是否還在戀愛期;Y 表示正在戀愛;N 表示已經分手;
  • EndDate:分手日期

注意欄位在數據庫中被稱為字段

用 SQL 語句來表達建表的命令:

Students:

CreateTabledbo.Students(
StudentIdVarchar(10),
NameNvarchar(200),
GenderNvarchar(1),
HeightNumeric(4,1),
MustacheVarchar(3),
SkinColorNvarchar(1)
);
Relationships:

CreateTabledbo.Relationships(
RelationshipIdInt,
BoyIdVarchar(10),
GirlIdVarchar(10),

BeginDateDatetime,
CurrentActiveVarchar(1),
EndDateDatetime
);

注意:字段旁邊必須加上數據類型,規範數據長度,精度,比如 varchar(3) 表示 3 個字長。
有關數據類型,可以參考參考官方文檔對基本數據類型的定義和舉例

五,在線運行SQL工具

推薦可在線執行SQL的工具: http://sqlfiddle.com/

這款工具,有兩大特點:

  • 支持六大數據庫,MySQL,Oracle,SQL Server,PostgreSQL,SQLite;
  • 支持在線編輯及執行SQL,無需自搭數據庫環境

簡單瞭解下:

零基礎 SQL 數據庫小白,從入門到精通的學習路線與書單


整個頁面分為1,2,3個區域。

  1. 區域 1 的編輯器用來創建數據庫 schema ,比如建表,新建數據;
  2. 區域 2 則用來編輯和執行 SQL;
  3. 區域 3 用來展示 區域 2 中的 SQL 執行結果

使用這款工具,無需你手工安裝數據庫便可以完成本指南所有的 SQL.

完美!我們成功的完成了第一步。


六,SQL 簡易實戰


接下來,讓我們為巧婦準備好精米。

INSERT

使用這條 SQL 命令,將添加全班同學的個人信息,包括姓名,學號,性別,身高,膚色,有無鬍子,以及男女朋友關係,(當然這可不能讓班主任知道。)

INSERTINTOStudents(
StudentId,
Name,
Gender,
Height,
Mustache,
SkinColor
)
Values
('001',N'陳冠奇',N'男',186,'No',N'白'),
('002',N'謝堂風',N'男',182,'No',N'白'),
('003',N'黃博',N'男',176,'Yes',N'黑'),
('004',N'李少傑',N'男',172,'Yes',N'黑'),
('005',N'徐少斌',N'男',163,'No',N'黑'),
('006',N'張白芷',N'女',172,'No',N'白'),
('007',N'張少函',N'女',163,'No',N'白'),
('008',N'靈昆',N'女',181,'No',N'黑'),
('009',N'夏平',N'女',158,'No',N'白'),
('010',N'莫文麗',N'女',156,'No',N'白')
INSERTINTORelationships(
RelationshipId,
BoyId,
GirlId,
BeginDate,
CurrentActive,
EndDate
)
Values
(1001,'001','006','2002-04-01','Y',null),
(1002,'003','009','2001-04-01','Y',null),
(1003,'005','010','2003-04-01','N','2004-04-01'),
(1004,'002','010','2004-04-01','N','2004-05-01'),
(1005,'004','010','2004-05-01','N','2005-08-01')

接下來我們用 SQL 做一些有意思的事情:

查找身高大於180cm的男同學:

SELECTName
FROMStudents
WHEREHeight>180andGender=N'男'

查找身高大於170cm的膚白女同學:

SELECTName
FROMStudents
WHEREHeight>170andSkinColor=N'白'andGender=N'女'

查找最高的女同學:

SELECTName
FROMStudents
WHEREHeight=(SELECTMAX(Height)FROMStudentsWHEREGender=N'女')
andGender=N'女'

查找有戀愛關係的同學:

SELECTBoy.NameasBoyName,
Girl.NameASGirlName
FROMRelationshipsRel
INNERJOINStudentsBoyonRel.BoyId=Boy.StudentId
INNERJOINStudentsGirlonRel.GirlId=Girl.StudentId

最帥的陳冠奇居然留鬍子了,讓我們記錄下:

UPDATEStudents
SETMustache='Yes'
WHEREName=N'陳冠奇'

帥奇留鬍子的原因居然是,陳冠奇和張白芷前兩天分手了,我們要記錄這段關係的破裂:

UPDATERelationships
SETCurrentActive='N',
EndDate='2008-04-01'
WHEREBoyId=(SELECTStudentIdFROMStudentsWHEREName=N'陳冠奇')AND
GirlId=(SELECTStudentIdFROMStudentsWHEREName=N'張白芷')

任何的痛苦都離不開戀人的離去,張白芷居然去國外留學了,因此花名冊少了這個人:

DELETEStudents
WHEREName=N'張白芷'

帥帥的陳冠奇,怎麼甘心就此沉淪,他又找了莫文麗做女朋友:

INSERTINTORelationships(
RelationshipId,
BoyId,
GirlId,
BeginDate,
CurrentActive,
EndDate
)
Values
(1006,'001','010','2008-04-01','Y',null)

好奇的小樂,查了查莫文麗的後臺,發現她居然曾有過三次戀愛關係:

SELECTRelationshipId
FROMRelationships
WHEREGirlId=(SELECTStudentIdFROMStudentsWHEREName=N'莫文麗')

恭喜!到此為止,所有的SQL基本操作你都會了。


七,SQL 晉級分水嶺


有競爭力的技術肯定是要花大功夫來磨鍊的,否則人人看一遍就會的東西,賣得出什麼高價呢!

因此當大家都度過第一階段之後,如何意識到還有第二階段,第三階段,甚至第四階段就很重要了。那會影響你的長期發展。舒適區是留給平庸者的。

從技術角度,我們習慣將 SQL 數據庫開發分為 4 個階段:入門,初級,高級,資深。

注:技術角度可分這四個階段,並不代表做到資深,你一定能年薪百萬。可千萬別這麼想,很多朋友諮詢我的第一個問題是,“黃老師,以我的水平,能要個30K不?” 這我不打包票,能做到什麼收入完全看你水平和天意(沒錯,很多時候,賺大錢靠運!)

在本文中,我只談 SQL 技術水平的晉級,不談其他。

上面的入門指南,相信你看完之後,寫 SQL 基本掌握了。這一階段過後,就是要通過反覆的操練這些 SQL ,直到你熟透這些 SQL 命令和語法。

幫你度過這階段最好的方式,是什麼呢?刷題。沒錯,簡單粗暴。這裡推薦牛客網,你可以試著去刷:

零基礎 SQL 數據庫小白,從入門到精通的學習路線與書單


左邊是題目,右邊編輯 SQL, 點擊【保存並調試】即可運行 SQL。系統會提示,你的答案是否通過!

刷完這 60 多道題目,相信你的感覺一定很好!

再推薦基本經典的小書,可以兼顧理論與實戰,具體看哪一本,依據你使用的數據庫軟件來:

《SQL 必知必會》(綜合)
《T-SQL Querying》中文《T-SQL 查詢》(SQL Server適用)
《Oracle編程藝術》(Oracle適用,只要是 ASK Tom 主編 Thomas Kyte 的著作不會錯)

打個廣告。我在微信公眾號【有關SQL】中分享了這些基礎的電子書,你可以關注後,回覆1024,便可拿到!


八,SQL 數據庫深入學習


當你跨過了第二個階段,所有的 SQL 命令都會了,看到 SQL 題目也有自信了,自認為天下數據,為 SQL 皆可取的時候,你應該來挑戰下高難度了

現在你的角色是河南鄭州大學的學生會主席,所有學生的信息都歸你管。別小看了這學生會主席,2017 年鄭州大學在校人數總共有7.26萬人。此時,你再查找個又白又高的女生,嘿嘿…別想歪咯,數據查詢就會很難了。看你急不急!

怎麼辦呢,SQL 命令你也玩熟了,但每次查個人都要花費個20,30秒,查個交友記錄,快則1,2分鐘,慢則半天!

此時,你該修煉下 SQL 性能調優了。而 SQL 數據庫開發真正的挑戰才正式開始!

要研究數據,就要從體系著手,我總結了一下目前正在使用的 SQL Server,它的知識點可以用 20 張思維導圖來表達。而 SQL 性能調優正是與這 20 個知識點息息相關。

20圖歸納SQL Server知識點

如果你使用的是其他數據庫,那麼一份詳細的數據庫體系圖,是必不可少的。它就是深夜裡的北極星,為你照亮了前進的方向。

再一次,打個廣告。我在微信公眾號【有關SQL】中分享了這些有關數據庫體系,性能調優,高可用高併發的電子書,你可以關注後,回覆1024,便可拿到!

當然你跟我一樣,對紙質書情有獨鍾的話,這裡推薦幾本:

綜合類的數據庫調優書:

《數據庫索引設計與優化》


《數據查詢優化器的藝術》

Oracle 相關調優書:

《Oracle Concepts》
《Oracle 體系架構》
《Oracle DBA 手記》(雲和恩墨出品都是精品)

MySQL 相關調優書:

《高性能 MySQL》

SQL Server 相關調優書:

《Inside SQL Server 》系列
《T-SQL 性能調優密集-基於 SQL Server 2012 窗口函數》

這些書看下來應該會耗掉你2-3年的時間。當然,如果你願意痛飲咖啡,用007(一週工作7天,每天連續12個小時)的速度來看書,那也可能1年左右就夠了。但不建議這麼幹,身體健康比什麼都重要!


九,SQL 人的職業生涯


當任何超過5秒的SQL,在你手下都變成了秒出時,你可能會昂天長嘯,“老子終於天下第一啦”。不過且慢,你別忘記了,你還是會被項目經理催著幹活,比如改個字段,改個需求,改處bug等等。此時,你恐怕最需要的是,一個得力的左膀右臂,一個能打的需求分析,更重要的是搞定靈活多變的業務變更,甚至你要挽起袖子,自己盯著業務變更,發佈更靈活適配的數據模型。此時數據建模,業務管理,數據治理,數據挖掘,安全審核等等都來了

此時,正是你職業生涯的分水嶺。

若你覺得你就是幹不了開會,扯皮,來回折騰的活兒,就喜歡指揮機器幹活,那就選擇偏技術的方向,比如運維DBA,數據庫研發。從事這條路線,意味著你要懂的更多的邊角料知識,比如操作系統,網絡協議,自動化編程,架構設計,分佈式計算,雲計算等。這些知識資料早已有現成的資料可以參考,只要耐得下心來學,一定有成功出頭的那一天。但也極其容易放棄,因為東西實在太多,太雜,而且有些邊緣性的學科,一時半會你還用不到,比如網絡協議。但如果不懂網絡協議,碰到數據庫安全的問題,你就容易敗下陣來,死的很慘。你的任何一個缺點都會伴隨每一次的故障而被無限放大,被很多同事視為毫無戰鬥力,讓你自己都開始懷疑自己,鄙視自己。所以幹這行,首先要有一顆強大的心臟,在無數的口誅筆伐之下,你要堅挺自己的信念,不要懷疑自己的判斷,丟失基本判斷能力。

且運維不僅僅是個智力活,還是個體力活。

白天所有運行在數據庫上的應用都好好地跑著,一般不會有大問題,看上去 DBA 很輕鬆。但是一到晚上,你們的活兒才剛剛開始。有索引重建,磁盤告警了;有 ETL Job 失敗,數據庫卡住了;有集群節點宕機,需要更換機器了,等等。總之 7*24 的重活,累活都來了,而且是必須趕在天亮業務開始之前修復。有時候,那些夜貓子也很兇悍,大晚上非還要搶點貨,點個夜宵啥的。一下單,系統崩潰了,你的美夢也就泡湯了。或許你感冒了,正在休息,不行你得起來;或許你正在電影院看著復聯呢,不行,你得回公司。總之,為了工作,為了搶修數據庫,你必須第一時間趕赴現場。多少年輕的DBA都曾在高壓現場,留下了人生中第一口鮮血。

你說DBA那麼累,傻子才選,你走第二條路,扯皮!

恭喜你,你選了一條可以通向公司高層的路。也許是 CTO,也許是CEO。通過做數據運行,數據產品,或者數據分析,你認識了全公司上上下下的大小頭目,今天與運營總監吃個飯,明天與生產總監喝個咖啡。總之他們提的一切需求,都希望你全部搞定。你說你團隊人手不夠,公司不肯招人,跟他們有什麼關係?你說你excel就能實現的功能,為什麼非要整一套炫酷而無任何實用價值的可視化報表分析軟件?他們就想要!你說你這個需求要1個月才能做好,他們拍著你的肩膀說,“你可以的,要相信自己。倆天,頂多兩天就能搞定!”

你帶著這麼多需求回到你的辦公室,看著滿臉青春的這些小夥小姑娘們,刷著微博,舔著朋友圈,個個臉上洋溢著熱焦瑪的香氣。你好忍心讓他們陪你加班到凌晨,還自費打滴滴麼!

好不容易,2個shot的星爸爸熱焦瑪下肚,你來了精神。熬到凌晨2點,連續2,3天回家看不到老婆/老公的笑臉,還給自己打氣,一切都是為了家庭。等到交上報告一看,“這裡數據改一下,口徑要和運營部統一”,“哪裡整個版面太醜了,影響公司形象,再修得漂亮一些。還有,這些報表都要加上權限,不能讓其他部門人看到。好吧,明天下班前我們再談”。

好吧,這回你只得厚起臉皮請小朋友們一起改了,晚餐自費交了KFC全家桶,全組加班人員,一律打車報銷。你默默的在群裡丟了一個又一個紅包。收到一個又一個的“老闆帥氣,老闆再來一個,寶寶沒搶到”

終於趕在deadline之前做完了,“怎麼樣,我說你可以的吧,看好你哦。這樣,我們昨天幾個人會後碰了下,發現你原來的設計也挺好,只是稍微還要再改改;還有,數據需要增加導入導出功能…”

如此反反覆覆,來來回回的折騰,某天你突然感慨,原來“別人用了一年,真的學到了我十年所用會的SQL技術”。此時,你會堅持自己的選擇是對的嗎,假如不幸的是,公司投資人撤資了,你所熟悉的環境沒了,怎麼辦?

因此,在這些零零碎碎的項目鍛鍊中,你能否總結有效的規律,提高自己業務溝通的能力,掌握數據治理的策略,嚴格把控項目管理的進度,都成了你的必修課。一旦鬆懈和迷茫,可真是萬劫不復!


十,SQL 數據庫必讀書單


如果你選的是 DBA,除了各家數據庫文檔要通讀之外,還需要補充雲計算相關:

《數據庫系統實現》
《雲計算通俗講義》
《讓雲落地:雲計算服務模式》
《雲計算架構技術與實踐》
《Kubernates權威指南》
《微服務架構設計模式》

如果你選的是業務設計(無論是運營,產品,數據分析,尤其是數據分析師),那麼這些書,肯定是要讀一讀的

Kimball 的系列書:

《維度建模權威指南》
《數據倉庫與商業智能寶典-成功設計、部署和維護 DW/BI 系統》

業務場景解決方案:

《計算廣告》
《推薦系統實戰》
《決戰大數據》
《大數據之路-阿里巴巴大數據實踐》
《企業IT架構轉型之道》
《設計數據密集型應用》

大數據系列:

《Hadoop 權威指南》
《Spark 權威指南》
《Hive 編程》
《Hive 實戰》
《Spark 高級數據分析》
《Hadoop構建數據倉庫實踐》

我的公眾號【有關SQL】也提供了這些書的電子版。在後臺回覆1024,便可下載

以上就是基本路線了,能在5-10年搭好這個基礎,你定當可以獨當一面。


分享到:


相關文章: