這里描述了菜鳥們搜索時容易犯的七個低級錯誤,正是因為你經(jīng)常犯這些錯誤,所以你總是得到無用的、荒謬的或者完全沒有意義的搜索結(jié)果。而一旦你認(rèn)識到這些錯誤,將很容易把這些小鬼從你的搜索工具箱中永遠(yuǎn)驅(qū)逐出去。
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會忽略這些詞,當(dāng)你把停用詞輸入搜索框時,不管網(wǎng)上有多少數(shù)量的相關(guān)文件,它們一個都不會找回來給你。
這些被叫做“停用詞”(stop words),因為搜索引擎在它的數(shù)據(jù)庫里碰到這些詞時不會搜索。
為什么不搜么?因為停用詞可能太常見了以至于無法搜索出有意義的結(jié)果,或者是語言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無意義的詞,除非它們在一個短語中且有重要的名詞和動詞相伴。
如果你在一個搜索請求中使用了停用詞,那么你得到大量毫不相關(guān)的搜索結(jié)果。比如,短語'searching the Web' 包含了兩個停用詞,'the' 和 'Web'。雖然這還不算特別常見的詞匯,但Web 在網(wǎng)絡(luò)上實在是太常見了,使它事實上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個關(guān)鍵詞帶給你的搜索結(jié)果會從搜索一個逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運(yùn),當(dāng)然也會得到一些關(guān)于“searching the Web”的搜索結(jié)果。
怎樣辨別停用詞呢?300個最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關(guān)鍵詞中含有停用詞時,會把它忽略的每個停用詞告訴你,就顯示在搜索結(jié)果頁最上邊。你可以用一個含停用詞 'web' 的關(guān)鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結(jié)果更精確——如果使用正確的話。
問題在于布爾操作符看上去太簡單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說法, 各種搜索引擎對布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達(dá)到。而且,有些搜索引擎要求布爾符必須是大寫的,另一些就沒有這種要求。
如果你真的想使用布爾符,請認(rèn)真學(xué)習(xí)它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來自拉丁語vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對普通詞的搜索存在缺陷。不是因為它們妄自尊大或自命不凡。而是因為這些詞太常見了,以至于出現(xiàn)在成百萬上千萬的網(wǎng)頁中,使得它們事實上不能被用來幫你找到什么有用的內(nèi)容。
比如說“weather”, 有成千上萬的網(wǎng)站提供跟“weather”相關(guān)的信息,從地方天氣預(yù)報到學(xué)術(shù)論文到氣象學(xué),
所以使用更多的關(guān)鍵詞或更明確的關(guān)鍵詞來搜索要比單單搜索'weather'好得多。 設(shè)計一個類似 'Cicely Alaska annual snowfall'這樣特殊的搜索關(guān)鍵詞,會給你真正有用的結(jié)果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務(wù)主管,舉了'bond' 作為例子。我們不得不問自己,他們在找的信息是關(guān)于金融公債的、化學(xué)粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問自己這個問題,然后用短語代替多義單詞作為關(guān)鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時候, 意思是領(lǐng)導(dǎo),發(fā)音LED的時候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫字母Committing Capital Offenses
========================================
搜索者的另一個問題是要不要在關(guān)鍵詞中使用大寫字母。
有的搜索引擎是區(qū)分大小寫的,但也有搜索引擎是不分大小寫的。憑經(jīng)驗來說,總是使用小寫字母搜索是個好主意。
這樣搜索,會得到所有包含你的搜索關(guān)鍵詞的網(wǎng)頁,不管其中的關(guān)鍵詞首字母大寫還是小寫。
如果你在搜索關(guān)鍵詞中使用大寫字母,那么搜索引擎返回的結(jié)果將只有一種,其網(wǎng)頁中含有大小寫跟你的搜索關(guān)鍵詞完全相同的單詞。
象人名和地名之類關(guān)鍵詞使用大寫字母是個好選擇,但是其它對大小寫沒那么敏感的單詞,如果也使用大寫字母,可能使你錯過很多有用的網(wǎng)頁。 如果想知道哪個搜索引擎對大寫敏感,以及如何處理大小寫字母,就對Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點(diǎn)時間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語搜索效果很好。然而,當(dāng)你使用類似這一節(jié)的標(biāo)題的短語“Close, But No Cigar”進(jìn)行搜索時,就遇到問題了。 在一個主流搜索引擎中搜索'close but no cigar',得到的第二條結(jié)果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個關(guān)鍵詞之間的距離稱為接近程度。 當(dāng)你的搜索關(guān)鍵詞們分散在一個網(wǎng)頁的不同位置時,有些搜索引擎會給你一個積極的結(jié)果,不管它們是否彼此靠近,還是位于同一個短語中。
如果你希望你用的搜索關(guān)鍵詞們在搜索到的內(nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個操作符號,而 Lycos 的高級搜索提供了多種設(shè)置關(guān)鍵詞接近程度的可能。
好,現(xiàn)在說最容易犯的那個搜索錯誤
7:在錯誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認(rèn)你對這次搜索任務(wù)使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒有為你的每次搜索分別選擇正確的搜索工具,你將浪費(fèi)自己大量的時間。
你應(yīng)該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強(qiáng)項和弱點(diǎn),然后選擇最適合這次搜索任務(wù)的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過苛求自己。我所聽過的最荒謬可笑的說法是:“你能在ingternet上找到任何東西”。這就象在說,你能在每一個煤礦里都找到鉆石。
也許聽上去有點(diǎn)異端邪說的味道,但是有個網(wǎng)絡(luò)搜索指南確實說過,有時你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書館。圖書館里網(wǎng)上找不到的成噸的信息資源。而且圖書館員一般是受過訓(xùn)練的的專家,它們通常會很樂意幫你找東西。當(dāng)你在網(wǎng)上無處可去的時候,試一下真正的“人工智能搜索引擎”吧,你會發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯誤走開Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡(luò)搜索經(jīng)驗的過程中,避免這七個常見的搜索錯誤將成為一種自然而然的習(xí)慣。無論何時,當(dāng)你得到意料之外和怪異的搜索結(jié)果時,記得檢查一下你用的搜索關(guān)鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個自己需要避免的搜索錯誤。
不可不信,也不可全信,呵呵!
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會忽略這些詞,當(dāng)你把停用詞輸入搜索框時,不管網(wǎng)上有多少數(shù)量的相關(guān)文件,它們一個都不會找回來給你。
這些被叫做“停用詞”(stop words),因為搜索引擎在它的數(shù)據(jù)庫里碰到這些詞時不會搜索。
為什么不搜么?因為停用詞可能太常見了以至于無法搜索出有意義的結(jié)果,或者是語言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無意義的詞,除非它們在一個短語中且有重要的名詞和動詞相伴。
如果你在一個搜索請求中使用了停用詞,那么你得到大量毫不相關(guān)的搜索結(jié)果。比如,短語'searching the Web' 包含了兩個停用詞,'the' 和 'Web'。雖然這還不算特別常見的詞匯,但Web 在網(wǎng)絡(luò)上實在是太常見了,使它事實上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個關(guān)鍵詞帶給你的搜索結(jié)果會從搜索一個逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運(yùn),當(dāng)然也會得到一些關(guān)于“searching the Web”的搜索結(jié)果。
怎樣辨別停用詞呢?300個最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關(guān)鍵詞中含有停用詞時,會把它忽略的每個停用詞告訴你,就顯示在搜索結(jié)果頁最上邊。你可以用一個含停用詞 'web' 的關(guān)鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結(jié)果更精確——如果使用正確的話。
問題在于布爾操作符看上去太簡單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說法, 各種搜索引擎對布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達(dá)到。而且,有些搜索引擎要求布爾符必須是大寫的,另一些就沒有這種要求。
如果你真的想使用布爾符,請認(rèn)真學(xué)習(xí)它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來自拉丁語vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對普通詞的搜索存在缺陷。不是因為它們妄自尊大或自命不凡。而是因為這些詞太常見了,以至于出現(xiàn)在成百萬上千萬的網(wǎng)頁中,使得它們事實上不能被用來幫你找到什么有用的內(nèi)容。
比如說“weather”, 有成千上萬的網(wǎng)站提供跟“weather”相關(guān)的信息,從地方天氣預(yù)報到學(xué)術(shù)論文到氣象學(xué),
所以使用更多的關(guān)鍵詞或更明確的關(guān)鍵詞來搜索要比單單搜索'weather'好得多。 設(shè)計一個類似 'Cicely Alaska annual snowfall'這樣特殊的搜索關(guān)鍵詞,會給你真正有用的結(jié)果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務(wù)主管,舉了'bond' 作為例子。我們不得不問自己,他們在找的信息是關(guān)于金融公債的、化學(xué)粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問自己這個問題,然后用短語代替多義單詞作為關(guān)鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時候, 意思是領(lǐng)導(dǎo),發(fā)音LED的時候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫字母Committing Capital Offenses
========================================
搜索者的另一個問題是要不要在關(guān)鍵詞中使用大寫字母。
有的搜索引擎是區(qū)分大小寫的,但也有搜索引擎是不分大小寫的。憑經(jīng)驗來說,總是使用小寫字母搜索是個好主意。
這樣搜索,會得到所有包含你的搜索關(guān)鍵詞的網(wǎng)頁,不管其中的關(guān)鍵詞首字母大寫還是小寫。
如果你在搜索關(guān)鍵詞中使用大寫字母,那么搜索引擎返回的結(jié)果將只有一種,其網(wǎng)頁中含有大小寫跟你的搜索關(guān)鍵詞完全相同的單詞。
象人名和地名之類關(guān)鍵詞使用大寫字母是個好選擇,但是其它對大小寫沒那么敏感的單詞,如果也使用大寫字母,可能使你錯過很多有用的網(wǎng)頁。 如果想知道哪個搜索引擎對大寫敏感,以及如何處理大小寫字母,就對Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點(diǎn)時間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語搜索效果很好。然而,當(dāng)你使用類似這一節(jié)的標(biāo)題的短語“Close, But No Cigar”進(jìn)行搜索時,就遇到問題了。 在一個主流搜索引擎中搜索'close but no cigar',得到的第二條結(jié)果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個關(guān)鍵詞之間的距離稱為接近程度。 當(dāng)你的搜索關(guān)鍵詞們分散在一個網(wǎng)頁的不同位置時,有些搜索引擎會給你一個積極的結(jié)果,不管它們是否彼此靠近,還是位于同一個短語中。
如果你希望你用的搜索關(guān)鍵詞們在搜索到的內(nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個操作符號,而 Lycos 的高級搜索提供了多種設(shè)置關(guān)鍵詞接近程度的可能。
好,現(xiàn)在說最容易犯的那個搜索錯誤
7:在錯誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認(rèn)你對這次搜索任務(wù)使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒有為你的每次搜索分別選擇正確的搜索工具,你將浪費(fèi)自己大量的時間。
你應(yīng)該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強(qiáng)項和弱點(diǎn),然后選擇最適合這次搜索任務(wù)的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過苛求自己。我所聽過的最荒謬可笑的說法是:“你能在ingternet上找到任何東西”。這就象在說,你能在每一個煤礦里都找到鉆石。
也許聽上去有點(diǎn)異端邪說的味道,但是有個網(wǎng)絡(luò)搜索指南確實說過,有時你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書館。圖書館里網(wǎng)上找不到的成噸的信息資源。而且圖書館員一般是受過訓(xùn)練的的專家,它們通常會很樂意幫你找東西。當(dāng)你在網(wǎng)上無處可去的時候,試一下真正的“人工智能搜索引擎”吧,你會發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯誤走開Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡(luò)搜索經(jīng)驗的過程中,避免這七個常見的搜索錯誤將成為一種自然而然的習(xí)慣。無論何時,當(dāng)你得到意料之外和怪異的搜索結(jié)果時,記得檢查一下你用的搜索關(guān)鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個自己需要避免的搜索錯誤。
不可不信,也不可全信,呵呵!