如何開始使用SQL

如何開始使用SQL

幾乎每個流行的應用程序和社交媒體平臺都有一個引擎來驅動我們吸收的信息和數據。 要跟蹤數億個數據點,必須有運轉良好的計算機來維護該數據庫。 每個開發人員都有自己喜歡的用於數據庫管理的程序,但是大多數程序都使用結構化查詢語言(簡稱SQL)。

對於那些希望管理關係數據庫的人來說,SQL是一個很好的工具,後者依賴於基於諸如交互作用(例如視頻中的用戶評論)之類的關係來連接不同的數據類型。 每次交互都使用查詢來存儲和訪問,查詢可以精確選擇需要在網頁上顯示的數據或其他內容。 但是SQL不僅僅是一個數據庫管理工具-它在許多領域中都有大量的應用程序,是清理和瀏覽數據以及合併數據集以獲取更多見解的必備工具。

對於喜歡在shell中工作的傳統編碼器來說,腳本查詢應該不是問題,但是對於那些喜歡在更可視化環境中工作的程序員,可以使用多種選擇。 對於客戶端服務器應用程序,MySQL是一個不錯的選擇,但是對於本教程,我將使用DB Browser for SQLite。 儘管SQLite不是客戶端服務器,但我將僅介紹一些簡單的查詢,以使您熟悉語法。 事不宜遲,讓我們開始吧!

在為您的系統下載了適當的數據庫瀏覽器版本後,我們就可以開始查看數據源。 在開放數據科學學院,我們顯然喜歡使用隨時可用的數據,並且波士頓市的數據門戶還有很多餘地。 我下載了《犯罪事件報告》數據以供使用-如果您使用的數據具有數據字典,則必須對其進行研究以準確瞭解每一列所包含的內容,尤其是其名稱含糊不清時。

首先,單擊"創建新數據庫",為數據庫命名,然後保存到您選擇的位置。

如何開始使用SQL

使用數據庫瀏覽器的好處之一是能夠從逗號分隔的值文件中創建表,而這恰好是犯罪數據所採用的格式。

如何開始使用SQL

如果您對此處涉及的編碼語法感到好奇,或者想要從頭開始創建表,則可以突出顯示該表,然後單擊"修改表"以查看用於創建表的腳本,如下所示。

如何開始使用SQL

如您所見,每個類別都與不同的數據類型相關聯,在創建查詢時要特別注意。 此時,您可能想使用"瀏覽數據"選項卡來熟悉數據。

瀏覽完數據後,我們可以開始編寫簡單的查詢來選擇要突出顯示的特定數據。 首先,單擊"執行SQL"選項卡以打開腳本外殼。 大多數SQL查詢的Hallmark命令是SELECT命令,該命令根據特定條件從表中提取列和行。 如果我們寫" SELECT *",則可以在必要時包括表中的每一列。 與WHERE和FROM命令結合使用,SELECT允許您在短短几行中創建一個新表。 在這裡,我想隔離汽車盜竊事件; 執行完查詢後,輸出結果如下:

如何開始使用SQL

從我們的結果中可以看出,過去四年來在波士頓發生了5664起汽車盜竊案。 如果我們想統計某些事情,例如哪個區的報告最多,該怎麼辦? 我們可以使用COUNT命令來處理這一問題—同樣,只需執行幾行代碼,我們就會獲得一個漂亮的數據集來顯示每個地區的事件數。 注意:使用GROUP BY命令顯示每個不同區域的計數很重要。

如何開始使用SQL

根據波士頓警察局的區密鑰,在過去四年中,羅克斯伯裡,多切斯特和南端的事件最多。 作為實踐,我創建了一個名為Neighbourhood的列,並使用UPDATE命令插入與各自警區有關的社區名稱。

如何開始使用SQL

我將展示的最後一個示例結合了到目前為止我們已經練習的所有命令。 我想獲得發生槍擊案的犯罪現場的最常見街道的清單。 另外,我想從查詢中創建一個新表以導出以供以後使用,例如可視化。 這是我想出的查詢和輸出:

如何開始使用SQL

如果一切順利,則數據庫中應該有一個新表,您可以在"瀏覽數據"選項卡中查看該表,我們可以將其視為自己的數據集。

如何開始使用SQL

既然您已經瞭解了SQL的基本命令,那麼,世界就在您身邊。 這些命令與框架配對後,可以為後端系統提供支持,這些後端系統選擇與您的用戶看到的數據相關的數據。 對於使用SQL清理數據的用戶來說,這些命令是有用的工具,但是通過更多的實踐和對SQL語法的更好理解,即使對於非編碼人員,清理和導出數據也應輕而易舉。 因此,無論您是記者,實驗室技術人員還是大數據分析師,都可以嘗試使用SQL-它可能會成為您最喜歡的數據整理工具。

(本文翻譯自ODSC - Open Data Science的文章How to Get Started with SQL)


分享到:


相關文章: