08.28 如何構造高級檢索式,全面玩轉搜索引擎

今天的主題是如何構造高級檢索式,全面玩轉搜索引擎。

什麼是[檢索式」呢?

說白了就是我們向搜索引擎中發佈的指令。我們每次輸入給搜索引擎的內容,無論是直接輸入的是關鍵詞,還是帶有搜索指令的關鍵詞,這些都是檢索式,是人機對話的語言,表達了我們的搜索意圖。

今天的課程,我會為大家深入講解檢索式的構造邏輯,方法以及應用。不用這些檢索式和技巧你也能或多或少、或早或晚地搜索到你想要的資源,但是會使用高級搜索技巧的人,看到的資源是不一樣的。這些高級檢索式的使用,在搜索資料和文獻的時候尤其有效。而這種資料和文獻通常就就是高質量的一手知識,獲得這種信息濃度極高極純的內容,才是對我們提升認知真正有益處的。

一、搜索的布爾邏輯

首先,我們先從構造檢索式最基本、應用最廣泛的搜索邏輯講起一—布爾邏輯。

常用的布爾邏輯算符有三種,分別是邏輯與、邏輯或、邏輯非。

布爾邏輯查詢這一功能,允許我們輸入多處關鍵詞,而各關鍵詞之間的關係可以是“與”(and)、“或”(or)、“非”(not)這三種基本關係,並且在這三個關係的基礎上,還可以進行邏輯疊加。

AND表示邏輯“與”。有的時候,我們也可以用“+”,“,”和空格來表示。AND用於檢索兩個以上關鍵詞的情形,檢索的結果必須與這幾個關鍵詞都有關係。如“經濟AND文化”,就表示既包括經濟又包括文化。或者“景甜AND長城”表示搜索的結果內容中既包括景甜,又包括長城,以縮小搜索範圍。這個邏輯其實我們每個人在搜索的時候都會用到,只是可能之前我們沒有意識到罷了。

0R表示邏輯“或”,有的搜索引擎用“|”(豎線)來表示。檢索的結果只要求與若干個關鍵詞中的一個有關係即可。如“移動支付OR快捷支付”,表示搜索中可以包含移動支付或者快捷支付其中任意一個關鍵詞的內容。比如我碩士的專業如果放在國內的話就叫教育技術,但曾經還有一個名字叫電化教育,為了更全面瞭解這個專業的歷史,就可以在搜索引擎中輸入“教育技術|電化教育”,搜索結果當中就會同時出現包含任意一個關鍵詞的內容。這樣會讓我們把搜索的範圍擴大化,免得產生遺漏。

NOT表示邏輯“非”,或者用“-”減號來表示,也有的搜索引擎用“!”表示。我們來舉個使用的示例,你想搜演員景甜的新聞,但是你又不想搜到景甜和張繼科戀情相關的新聞,這個時候,你打開“必應”搜索引擎,輸入“景甜-張繼科”就把與張繼科相關的鏈接都過濾掉了。

關於這三個基本的邏輯關係,有些搜索引擎全部支持,有些搜索引擎是部分支持的。百度和谷歌中基本支持布爾邏輯的三種運算,使用規則是,在百度中建議用符號來表示,即與用“+”,或用“|”,非用“-”表示。而在谷歌或者英文檢索中,建議都用大寫的字母來代替,即“AND”,“OR”和“NO”,注意在輸入代表邏輯關係的字符時,一定要用半角。

還有一點需要提醒大家,通常百度中使用減號“一”去除廣告的效果並不十分明顯,很多時候用了反而出來的廣告更多,這種時候,強烈建議換為之前介紹的其他搜索引擎。

而關於檢索的科學研究表示,絕大部分人在搜索的時候,只會查找檢索的前50條結果。所以,越是精確的檢索式的構造,越能夠把相關度最高的結果高效率地篩選出來,如果一次檢索還需要去很後面的結果中一條條翻找內容,那還不如重新開始一次新的檢索。

二、積木法構造檢索式

當我們面臨一個檢索問題的時候,我們往往可能不止要用一種方法,而是要用這些方法綜合應用,才能準確地達到我們的檢索結果。

而有了布爾邏輯的基礎,配合我們之前學過的檢索式,我們就能夠進行更加高級的檢索式的構造了。怎麼樣構造呢?這個過程可以簡練為以下三步:

第一步:分析需求,提煉檢索基本概念單位;

第二步:尋找概念之間的關係,找到邏輯關係;

第三步:添加檢索指令,縮小檢索範圍;

這三個步驟就像是我們把拿到的需求打碎,我們先把問題拆解成最小的單位,然後把這些單位當作一個個的積木塊,像搭積木那樣,用搜索指令和檢索邏輯搭建起來。

我給大家舉幾個例子,幫助大家更形象地理解。

比如,我們要查找關於“信息素養的電子文檔資料”。在這個搜索請求中,我們可以提煉出兩個基本的關鍵詞,一個“信息素養”,一個是“電子文檔”。因為信息素養是一個很大的範圍,所包含的信息和資料有各種各樣的形式。而電子文檔也是如此,可以有各種各樣的主題的電子文檔。而這兩個關鍵詞是要同時存在的,缺了哪一部分都不能找到準確的內容,所以用AND的交集結合起來才是我們想要的結果。

同時,“信息素養”有的時候還可以叫做“信息能力”,這幾種不同的稱呼方式是一種or,即選擇的關係。電子文檔也有其他的近義詞的形式比如電子檔案等等。因此這個檢索式就可以構造為:

(“信息素養”OR“信息能力”)AND(“電子文檔”OR“電子檔案”)在這裡,涉及到多層邏輯關係的運算的時候,就用括號()表示優先運算,而增加的“”(雙引號)則表示關鍵字的不可拆分。這裡要注意的是百度的查詢限制在38個漢字以內,所以稍微複雜一些的檢索邏輯在百度中會自動忽略後面多出來的字詞的。可能就這麼聽起來會有點暈?這部分涉及的邏輯關係有些複雜,如果你聽得有點暈,建議再看一看這節課的文稿,鞏固一下,其實也可以很容易明白的。

下面我們再以文獻搜索作為例子。

比如,我們需要搜索“2015年關於新能源的立法”的英文著作或者論文。

第一步,看關鍵的信息模塊有:

時間是:2015年;關鍵詞有:新能源和立法;要搜到的資源形式是:著作或者文獻。

那麼把我們所學所有搜索技巧都綜合起來,我們應該構造的檢索式就是:

PY=2015AND“新能源”AND(“立法”0R“法律”OR“法規”)AND DT=book OR article.

在這裡DT就是document也就是文檔類型的縮寫。而這個檢索式翻譯成英文的話就是:

PY=2015 AND“Renewable Energy"AND(Law OR Rules)AND DT =book OR article

這樣的檢索式,在我們做文獻搜索的時候,能夠迅速地幫我們定位到結果,大量排除海量文獻中不想管的文獻結果。還是請大家注意,如果是做這種相關的文獻檢索,最好用的通用搜索引擎就是Google,這個搜索指令在Goog1e中可以完美運行,但是放到百度、必應之類的搜索引擎中就根本搜不出來任何想要的結果,這點一定注意。

如果在通用搜索引擎中搜索,而不是垂直的學術搜索引擎,那麼我們就要依靠之前學過的幾個基礎搜索指令來縮小範圍。

比如,你想使用搜索到關於learning design,標題中有STEM的pdf形式的論文。那麼你的搜索指令就應該是:

filetype:pdf AND“learning design"AND intitle:STEM其中,連接的AND關係,也可以通過空格來代替。

總之,搜索的最高境界就是能夠根據自己的需求,靈活自如地搭配使用這些搜索指令,如武林高手一般,一出手就快、準、狠,一把搜出最高效的資源。

三、高級檢索界面介紹

除了以上的各種搜索指令,每個搜索引擎都有高級搜索界面,幫助我們進行更高級的限定搜搜。

比如,如下圖所示,在百度高級搜索界面,你可以對關鍵詞,結果顯示條數,時間限定,語言搜索文檔格式等條目進行設置,從而更加精確地幫你找到想查找的結果。

直接在百度搜索的對話框裡輸入高級搜索,就能調出搜索界面。最近百度推出的搜索工具,就能進行簡單的搜索時間、文件形式和網站來源進行限定。

在谷歌的高級搜索中,因為針對的是全球資源,提供更多的搜索限定選項,幫助你更準確地找到搜索結果。

講到這裡,肯定會有人會想:既然有了高級搜索界面,我們還有必要學習搜索指令麼?

我的回答是,還是有必要的。就好像我們人人都會打開百度輸入關鍵詞,但是還是需要來學習搜索,原因是一樣的:在你真正掌握一項技能前,對於它的潛力你是沒辦法評價的。而對事物的理解越深入、掌握的屬性和技能越多,能發揮和挖掘的資源和財富就越多。

有些人會說,這些高級檢索離我的生活太遙遠了,我根本不需要,其實這並非這項能力對你而言不重要,而是你現有的環境對你要求太低,現有的環境不足以驅動你去積極探索、求知和追求卓越。

我真心希望有一天有更多人能夠躋身到被優秀而卓絕的人包圍的環境中。只有這樣,你才會發現你覺得很高冷的技能對身邊其他人來說已經像呼吸一樣自然,只有受到這樣的刺激,你才會一點點地想要更多地探索和求知,一點點地追求與眾不同,日積月累地,漸漸讓自己積累出足夠的能量,不斷提升。總之,追求卓越,卓越就屬於你。

讓我們基於搜索,又高於搜索,去探尋解決問題的邏輯。

如何構造高級檢索式,全面玩轉搜索引擎


分享到:


相關文章: