2014年3月4日 星期二

如何使用網路上的搜尋引擎

提到「上網」現在感到害怕的人應該比以前少了,這幾年有許多成年人勇敢地踏出第一步,開始了自己的「網路生涯」。不過提到「找資料」,還是有很多人覺得抓不到要訣,為什麼別人可以哪麼快就找到那麼多相關資料,而我卻找了半天還是找不到呢?

其實,在網路上找資料也是需要練習的!隨著嘗試的次數和經驗的累積,你一定可以成為一個找資料的高手。

在網路上要找東西,一定要去「搜尋引擎」,目前大部分的入口網站都有提供搜尋引擎,例如在中文文網路世界裡的蕃薯藤網路家庭、英文網路裡的雅虎Lycos,當然也有一些純粹只提供搜尋引擎的網站,例如Google

如果想要知道到底有哪些搜尋引擎,您不妨就直接到蕃薯藤Google,在搜尋的方框中輸入「搜尋引擎」,或是「Search Engine」,你會發現,原來世界上有這麼多搜尋引擎在提供資料搜尋服務。

通常在入口網站裡的搜尋引擎,查詢的就是網站及網頁,但是這樣的技術,也運用在很多其他的地方,例如找人名、電話、書籍、圖片、音樂等等。現在,我們就分階段介紹如何找網站和網頁吧!

找資料之前的準備階段

找資料的準備工作就是要先分析您要找的資料的性質,要弄清楚才能決定該使用哪一個搜尋引擎才比較合適。

 

確定語文別

首先,您要先確定您要找的資料所用的語文,然後使用該國家的搜尋引擎才能找到比較多的資料,當然像google那種國際性的搜尋引擎,能提供多達132種語言,則是另當別論。

至於讓中國人困擾的繁體字與簡體字之差異,也可以透過軟體做繁簡轉換來解決,比如說,在firefox瀏覽器上,您可以加裝「同文堂」擴充套件,在IE瀏覽器上,您可以加裝ALiBaBar來做轉換。不過,這只是解決看網頁時的困擾,在搜尋簡體字網頁時,您還是要使用大陸的搜尋引擎,比如在百度搜索引擎上找會比較有效。

確定資料的種類

第二是確定資料類型,您當然清楚您要找的是圖片、程式、新聞、網頁或是簡報,但是您必須先弄清楚哪些搜尋引擎有針對這些資料做索引,還有指令要如何輸入才能找到特定的資料。

搜尋引擎的種類

搜尋引擎依據其建立資料庫的方法可以分成兩種,即關鍵字索引式,如GAISgoogle和目錄分類式,例如「蕃薯藤」和yahoo

關鍵字索引是搜尋引擎採用的是全文檢索,而且有模糊匹配的功能,並且會利用一個電腦程式自動定時到網路上到處遊走,收錄各大小網站的資料回來更新本身的資料庫,所以資料龐大,但精確度不夠。

而目錄分類式是要靠站長主動登錄,或人為的分類,其優點是經過人為判斷會比較精確,但是人腦永遠不比電腦快,無法像電腦做索引那樣能及時更新。

當然現在的大型入口網站都同時具有這兩種搜尋引擎,以對客戶做更週延的服務。

另外還有一種搜尋引擎,它在呈現搜尋結果時,不是採條列式的,而是使用概念圖的方式來顯示,它讓您可以很容易看出關鍵字在不同網站上的出現頻率,以及常與此關鍵字同時出現的其他關鍵字。

這種概念圖的顯示方式,可以幫助您建立相關的概念,對於學習新事物很有幫助。

有一種網站會提供整合搜尋(meta search)的服務,它本身沒有建立索引資料庫,但它會替您把關鍵字送到不同的搜尋引擎,然後把找到的資料彙整,剔除重複的,並把出現評率高的排在前面,為您省去了逐一到不同引擎搜尋的時間。這種整合搜尋服務最適合那些冷闢難找的資料。

開始找資料階段

不要使用禁止使用的字(stopword)

所謂stopword就是一般文章中因為太常出現的字,以至於搜尋時會出現很多無關的資料,例如英文中的the, and, or, of, you, there, is, are 等等,搜尋引擎遇到這些字會直接告訴您不能用這些字,除非它是片語中的一部分,而且您有用雙引號包圍住它們。

中文也有類似情形,在搜尋方框裡,只用「電腦」這兩個字當關鍵字,看您會找到多少資料,它不是被拒絕,就是資料多到無法處理。

簡單的一句話,就是您要預估用這關鍵字會找到多少資料量,已經它的精確程度如何,若是太過廣泛,趕快增加關鍵字以縮小範圍。

使用Meta search(整合式搜尋)

若您要找的是很冷闢、專精的專有名詞,您預估可能要找好幾個搜尋引擎才能找到您所要的資料,那麼試試看整合式搜尋(meta search)會是個好主意。

不過有些整合搜尋會替您整理各引擎所找到的資料,替您省下不少時間,也些則只是替您送出關鍵字而已,您會忙於應付各個搜尋引擎傳回來的結果。

使用進階搜尋

如果您已經將常用的搜尋引擎的網頁存成書籤或加入我的最愛,我建議您將這書籤或我的最愛換成這個網頁的「進階搜尋」。進階搜尋的彈性比一般搜尋來的大,要限制搜尋條件也方便許多。
輸入關鍵字階段

關鍵字多多益善

例如您要查"徐娘半老"一詞中"徐娘"究竟是指誰。您要先想:「徐娘半老」是一個成語,如果只用「徐娘半老」做關鍵詞,搜尋結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵詞來縮小搜尋結果。

那選擇什麼關鍵詞好呢?可考慮的的有「意思」、「含義」、「來歷」、 「由來」、「典故」、、「淵源」等,可以想像得到的是,類似的資料,應該是包含在一些民俗介紹性的文字裡,所以用諸如「來歷」、「由來」、「典故」等詞彙找到的的概率更高一些。
現在,您重新輸入「徐娘半老 徐娘 典故」三個關鍵字,看看結果有什麼不同。

加上雙引號


如果您查Windows 2000,您不加上雙引號,搜尋引擎會自動把它拆成兩個字,即windows 2000,也就是這兩個字的聯集了,數量會龐大的嚇人,但是加上前後加上雙引號,就會被當作一個字處裡,結果當然較精確。

若您要找的是一個固定的片語,或是複合名詞,就更應該加上雙引號,例如您可以打入一本小說的書名 go with wind (中文譯做「飄」),看看您有加上雙引號和沒有加上雙引號會有何不同。

使用同義字

很多事物是一物多名,若您用關鍵字找不到合適的資料,換一個同義字說不定就會找到了,例如,主機板的英文可以做motherboardmain-board 或是mainboard

談到同義字,就不能不談到當前兩岸用詞上的差異,例如說,在台灣用「警察」,大陸卻稱作「公安」。因此,當您在搜尋引擎上輸入繁體字的「警察」,它並不會自動轉成簡體字的「公安」去找,而是使用簡體字的「警察」在找網頁,這樣當然找不到您所要的有關「警察」的文章了。

所以當您使用中文搜尋引擎,卻只找到兩岸其中一邊的網頁,您就可推斷,若不是它只蒐集一邊的網頁,就是兩岸對於這一名詞的用法不一樣。

限制資料類型或搜尋範圍

為了讓找到的資料更符合您的需要,您可以限制資料的類型,例如您先輸入關鍵字之後再輸入filetype:ppt,那您就會找到具有該關鍵字的Powerpoint簡報檔,不瞞您說,我個人就常用這方法去找別人做的教學簡報來參考。

同樣的方式,您也可以限制檔案類型為WORD用的 .doc 檔,或是共通的 .pdf 檔,或是純文字的 .txt 檔。

您也可以指定您的關鍵字的搜尋範圍。

例如您只要找網址上含有該關鍵字的網站,就輸入 inrul:“關鍵字即可。
若是要在網頁標題上尋找,就輸入 intitle:“關鍵字
若只要在網頁內文上找,而不管網址、網頁標題或連結的文字時,就輸入intext:“關鍵字

GOOGLE特色

最後剩下下一些時間,我們來介紹一下到目前為止功能最強的搜尋引擎。--google特色。
GOOGLE 支援多達 132 種語言, 包括簡體中文和繁體中文;
GOOGLE 網站只提供搜尋引擎功能, 沒有太多花俏的裝飾;
GOOGLE 速度極快, 據說有 8000 多台服務器, 200 多條 T3 級頻寬;
GOOGLE 的專利網頁級別技術 PageRank 能夠提供高命中率的搜尋結果;
GOOGLE 的搜尋結果摘錄查詢網頁的部分具體內容, 而不僅僅是網站簡介;
GOOGLE 智慧型的 「好手氣」 功能, 為您找出可能最符合要求的網站;
GOOGLE 的 「網頁快取」 功能, 能從 GOOGLE 服務器裡直接取出緩衝存放的網頁。

除了這些特色外,它還提供了許多其他的服務,例如:

google earth –可以找全球各地區的空照圖
google news –可以找全球各地的熱門新聞
google group –可以找各種分類討論區
google ctalogs –可以找各公司商品型錄,並下訂單
google university search—可以找美國各大學的網站內容,對大學新生選擇學校很有幫助。

聽了這些後,我想您快就會成為google的愛用者了。




沒有留言: