- 註冊時間
- 2003-3-4
- 線上時間
- 2160 小時
- 閱讀權限
- 200
- 積分
- 1314
- 主題
- 31
- 精華
- 1
- 文章
- 430
TA的每日心情 | 郁悶 2020-5-27 17:14 |
---|
簽到天數: 1 天 連續簽到: 1 天 [LV.1]初來乍到 - 文章
- 430
|
回覆: [分享] 在Google上找PDF or DOC檔的方法
分享一篇大陸網友的文章,看完之後保證google功力大增
=======================================================
GOOGLE搜索從入門到精通
-----------------------------------
作者:donquix
時間:11/2/2000
作者電郵:donquix@sina.com
------------------------------
內容
1,前言
2,摘要
3,如何使用本文
4,GOOGLE簡介
5,搜尋入門
6,初階搜尋
6.1,搜尋結果要求包含兩個及兩個以上關鍵字
6.2,搜尋結果要求不包含某些特定資訊
6.3,搜尋結果至少包含多個關鍵字中的任意一個
6.4,“+”、“-”和“OR”的混合查詢
6.5,用“+”和“-”減少冗餘資訊
7,輔助搜尋
7.1,萬用字元問題
7.2,關鍵字的字母大小寫
7.3,搜尋整個句子
7.4,搜尋引擎忽略的字元和辭彙
7.5,強制搜尋
8,進階搜尋
8.1,對搜尋的網站進行限制
8.2,查詢某一類文件(往往帶有同一副檔名)
8.3,搜尋的關鍵字包含在URL鏈結中
8.4,搜尋的關鍵字包含在網頁標題中
9,其他罕用語法
9.1,搜尋所有鏈結到某個URL位址的網頁
9.2,查找與某個頁面結構內容相似的頁面
9.3,從GOOGLE伺服器上緩存頁面中查詢資訊
9.4,info
10,圖片搜尋
11,目錄內搜尋
12,新聞群組(USENET)搜尋
13,GOOGLE的其他傑出功能
13.1,集成化的Toolbar
13.2,單詞英文解釋
13.3,網頁翻譯
13.4,搜尋結果過濾
14,搜尋技巧之關鍵字選擇初探
15,常用搜尋個案
15.1,找人
15.2,找軟體
15.3,找圖片
15.4,找MP3
15.5,找書
16,GOOGLE搜尋FAQ
17,後記
------------------------------
1,前言
我是在2000年上半年知道GOOGLE的。在這之前,我搜尋英文資訊通常用AltaVista,而搜尋中文資訊則常用Sina。但自 從使用了GOOGLE之後,它便成為我的Favorite Searchengine了。這也得感謝新浪網友曹溪,因為當初正是因為他的大力推介,才使我識得了GOOGLE。
記得1996年夏季的時候,當我第一次接觸Internet,便被撲面而來的魔力征服了。那種天涯咫尺的感覺,真是妙不可言。在經歷了瘋狂的WWW衝浪和如癡如醉的BBS沉迷之後,我意識到Internet對我影響至深的還是在於學習方式的變遷。
如何來描述這種變遷呢?以前的學習,一般需要預先在肚子裏存儲下足夠的知識,必要時,就從海量的資訊中提取所需的部分。這種學習方式造就了很多“才高八斗,學富五車”的大才子。但是,到了資訊領域大大超出“四書五經”的新時期,預先無目的的吞下海量資訊的學習方式就有些不合時宜了。比方說,我們到了大型的圖書城,往往有一種不知所措的感覺。舊有的學習方式需要變更以適應這個資訊爆炸的年代。目的明確的去學習,即先知道要學什麼,然後有目的的去尋找答案,這種方式看上去更加有效率。我不妨把這稱為“即學式”,相應的,舊有的稱為“預學式”。
不過,“即學式”的實施是有前提的。首先,要求學習者擁有一個包羅萬象的資訊庫,以供隨時抽取各種目的資訊;其次,是需要一個強勁的資訊檢索工具,以便高效率的從資訊庫中提取資訊。很明顯,Internet可以充當那個海量的資訊庫,而 搜尋引擎,則正是尋找光明之火的絕好工具。
“公欲善其事,必先利其器”。Internet只有一個,而搜尋引擎則有N多個。有搜尋高手說,所謂搜尋,就是“在正確的地方使用正確的工具和正確的方法尋找正確的內容”。但是,對於普通人而言,掌握諸多 搜尋引擎的可能性似乎不大。用一兩個相對強勁的具代表性的工具達到絕大多數搜尋目的更為人們所迫切希望。不同的時期,湧現出不同的強者。就目前而言,我們非常幸運的有了:
*****GOOGLE*****
2,摘要
本文簡要的介紹了GOOGLE的歷史和特點,GOOGLE的基本搜尋語法和進階搜尋語法,GOOGLE的特色功能,包括圖片搜尋、新聞群組搜尋和集成Toolbar等,還簡單的介紹了一些常用 搜尋技巧和實用個案。儘管本文名為“GOOGLE搜索從入門到精通”,但事實上,筆者對運用GOOGLE進行搜尋也尚處於“入門”階段。
3,如何使用本文
閱讀本文最好具備一些最基本的布林代數基礎,如“與”、“或”、“非”等。不過,即便你沒有這方面的知識,也不必在意。對那些實例進行練習,你的疑惑就會迎刃而解。對於剛剛接觸網絡 搜尋的讀者而言,也許你應該從頭到尾的閱讀本文;但對於那些有一定搜尋基礎的讀者而言,只需要跳躍著尋找自己所需要的資訊就可以了。當然,如果你有一定的英文基礎,也可以把本文與GOOGLE大全( http://www.google.com/about.html )參照閱讀,那樣效果會更好。
4,GOOGLE簡介
Google( www.google.com )是一個搜尋引擎,由兩個斯坦福大學博士生Larry Page與Sergey Brin於1998年9月發明,Google Inc. 于1999年創立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜尋引擎,同年9月份,Google成為中國網易公司的搜尋引擎。98年至今,GOOGLE已經獲得30多項業界大獎。
GOOGLE的成功得益於其強大的功能和獨到的特點:
GOOGLE支援多達132種語言,包括繁體中文和簡體中文;
GOOGLE網站只提供搜尋引擎功能,沒有花裏胡哨的累贅;
GOOGLE速度極快,據說有10000多台伺服器,200多條T3級寬帶;
GOOGLE的專利網頁級別技術PageRank能夠提供高命中率的搜尋結果;
GOOGLE的搜尋結果摘錄查詢網頁的含有關鍵字的內容,而不僅僅是網站簡介;
GOOGLE智慧化的“好手氣”功能,提供可能最符合要求的網站;
GOOGLE的“頁庫存檔”功能,能從GOOGLE伺服器裏直接取出緩存的網頁。
5,搜尋入門
要用GOOGLE做搜尋,當然首先要進入GOOGLE網站- www.google.com;不過,163.com和yaho...tw使用的實際上?/a>]是GOOGLE搜尋引擎,只是對 搜尋結果進行了編排,但無法提供一些特色功能,如圖片搜尋等。
第一次進入GOOGLE,它會根據你的作業系統,確定語言介面。需要提醒的是,GOOGLE是通過cookie來存儲頁面設定的,所以,如果你的系統禁用cookie,就無法對GOOGLE介面進行個人設定了。
GOOGLE的首頁很清爽,LOGO下面,排列了四大功能模組:所有網頁、圖片、新聞群組和目錄服務。默認是網站搜尋。現在進行第一次搜尋實踐,要查找所有關於“易筋經”的中文網站和網頁。在 搜尋框內輸入一個關鍵字“易筋經”,然後點擊下面的“google搜尋”按鈕(或者直接按下Enter鍵),結果就出來了。
搜尋:“易筋經”
結果:已搜尋有關易筋經的中文(繁體)網頁。 共約有2,020項查詢結果,這是第1-10項 。 搜尋共費0.45秒。
6,初階搜尋
在上例子中,你已經知道了最基本的搜尋,即查詢包含單個關鍵字的資訊。現在,進一步探討多個關鍵字以及關鍵字間不同邏輯關係的查詢。
6.1,搜尋結果要求包含兩個及兩個以上關鍵字
一般搜尋引擎需要在多個關鍵字之間加上“+”,而GOOGLE無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了。
示例:搜尋所有包含關鍵字“易筋經”和“吸星大法”的中文網頁
搜尋:“易筋經 吸星大法”
結果:已搜尋有關易筋經 吸星大法的中文(繁體)網頁。 共約有268項查詢結果,這是第1-10項 。 搜尋共費0.59秒。
注意:文章中搜尋語法外面的引號僅起引用作用,不能帶入搜尋欄內。
6.2,搜尋結果要求不包含某些特定資訊
GOOGLE用減號“-”表示邏輯“非”操作。
示例:搜尋所有包含“易筋經”而不含“吸星大法”的中文網頁
搜尋:“易筋經 -吸星大法”
結果:已搜尋有關易筋經 -吸星大法的中文(繁體)網頁。 共約有1,750項查詢結果,這是第1-10項 。 搜尋共費0.58秒。
注意:這裏的“+”和“-”號,是英文字元,而不是中文字元的“+”和“-”。此外,操作符與作用的關鍵字之間,不能有空格。比如“易筋經 - 吸星大法”,搜尋引擎將視為關鍵字為易筋經和吸星大法的邏輯“與”操作,中間的“-”被忽略。
6.3,搜尋結果至少包含多個關鍵字中的任意一個
GOOGLE用大寫的“OR”表示邏輯“或”操作。假定你是布蘭妮和披頭四的歌迷,現在要查找所有關於布蘭妮和披頭四的中文網頁。
示例:搜尋包含布蘭妮“Britney”或者披頭四“Beatles”、或者兩者均有的中文網頁。
搜尋:“Britney OR Beatles OR 布蘭妮 OR 披頭四”
結果:已搜尋有關Britney OR Beatles OR 布蘭妮 OR 披頭四的中文(繁體)網頁。 共約有22,500項查詢結果,這是第1-10項 。
注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次“與”查詢。
6.4,“+”、“-”和“OR”的混合查詢
混合查詢涉及到邏輯操作符的順序問題。一般而言,搜尋引擎按照從左往右的順序讀取操作符號。如果只涉及“與”操作和“非”操作,則不會產生順序問題,搜尋結果數量和關鍵字順序無關,不過,具體 搜尋的結果順序會視關鍵字的順序而定。單純的“或”操作也同樣道理。但是,如果“或”查詢和其他兩種查詢混合在一起,問題就複雜了。現在我們做這樣的查詢:“所有關於Britney或者Beatles、但是沒有Madonna相關資訊的中文網頁”。
搜尋:“Britney OR Beatles -Madonna”
結果:已搜尋有關Britney OR Beatles -Madonna的中文(繁體)網頁。 共約有7,860項查詢結果,這是第1-10項 。 搜尋共費0.44秒。
搜尋:“-Madonna Britney OR Beatles”
結果:已搜尋有關-Madonna Britney OR Beatles的中文(繁體)網頁。 共約有7,850項查詢結果,這是第1-10項 。 搜尋共費0.45秒。
搜尋:“Britney -Madonna OR Beatles”
結果:找不到和您的查詢-Britney -Madonna OR Beatles-相符的資料
搜尋:“Britney OR -Madonna Beatles”
結果:找不到和您的查詢-Britney OR -Madonna Beatles -相符的資料
可見,“或”操作的前後兩個關鍵字必須是默認的“與”查詢,否則,搜尋引擎將無法完成搜尋。
6.5,用“+”和“-”減少冗餘資訊
通常情況下,用一個關鍵字查詢,會得到很多和查詢目的不相關的冗餘資訊。我們總是希望,搜尋結果的第一個條目中就包含所需要的資訊。“+”和“-”很多時候就起到縮小 搜尋結果的範圍,以提高查詢結果命中率。
例:查閱天龍八部具體是哪八部。
分析:如果光用“天龍八部”做關鍵字,搜尋結果有9,190項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。
1,如果你知道八部中的某一部,比如阿修羅,增加“阿修羅”關鍵字。“天龍八部 阿修羅”的搜尋結果就只有553項,可以很快找到全部八部。
2,如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄。“天龍八部 佛教 -金庸”的查詢結果為791項,可以迅速找到需要的資料。
7,輔助搜尋
7.1,萬用字元問題
很多搜尋引擎支援萬用字元符號,如“*”代表一連串字元,“?”代表單個字元等。GOOGLE不支持萬用字元,只能做精確查詢,關鍵字中的“*”或者“?”會被忽略掉。
7.2,關鍵字的字母大小寫
GOOGLE對英文字元大小寫不敏感,“GOD”和“god”搜尋的結果是一樣的。
7.3,搜尋整個句子
GOOGLE的關鍵字可以是片語(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。
示例:搜尋包含“long, long ago”字串的頁面。
搜尋:“"long long ago"”
結果:已搜尋有關long long ago的中文(繁體)網頁。 共約有147項查詢結果,這是第1-10項 。 搜尋共費0.59秒。 。
7.4,搜尋引擎忽略的字元和辭彙
GOOGLE對一些網路上出現頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。
示例:搜尋關於第一次世界大戰的資訊
搜尋:“worldwar i”
結果:"i"使用頻率太高,沒有被列入搜尋範圍。已向網際網路搜尋"worldwar i". 共約有23項查詢結果,這是第1-10項 。 搜尋共費0.07秒。
7.5,強制搜尋
如果要對忽略的關鍵字進行強制搜尋,則需要在該關鍵字前加上明文的“+”號。
示例:搜尋包含“Who am I ?”的網頁。如果用“"who am i ?"”,“Who”、“I”、“?”會被省略掉,搜尋將只用“am”作關鍵字,所以應該用強制 搜尋。
搜尋:“"+who +am +i"”
結果:已向網際網路搜尋"+who +am +i". 共約有35,900項查詢結果,這是第1-10項 。 搜尋共費0.39秒。
注意:大部分常用英文符號(如問號,句號,逗號等)無法成為搜尋關鍵字,加強制也不行。
8,進階搜尋
上面已經探討了GOOGLE的一些最基礎搜尋語法。通常而言,這些簡單的搜尋語法已經能解決絕大部分問題了。不過,如果想更迅速更貼切找到需要的資訊,你還需要瞭解更多的東西。
8.1,對搜尋的網站進行限制
“site”表示搜尋結果局限於某個具體網站或者網站頻道,如“sina.com.tw”、“edu.sina.com.tw”,或者是某個功能變數名稱,如“com.tw”、“com”等等。如果是要排除某網站或者功能變數名稱範圍內的頁面,只需用“-網站/功能變數名稱”。
示例:搜尋中文教育科研網站(edu.tw)上所有包含“金庸”的頁面。
搜尋:“金庸 site:edu.tw”
結果:已搜尋有關金庸 site:edu.tw的中文(繁體)網頁。 共約有7,600項查詢結果,這是第1-10項 。 搜尋共費0.31秒。
示例:搜尋包含“金庸”和“古龍”的中文新浪網站頁面,
搜尋:“金庸 古龍 site:sina.com.tw”
結果:已在sina.com.tw搜尋有關金庸 古龍 的中文(繁體)網頁。 共約有14項查詢結果,這是第1-10項 。 搜尋共費0.26秒。
示例:搜尋新浪新聞頻道中關於魯迅的資訊。
搜尋:“魯迅 site:news.sina.com.tw”
結果:已在news.sina.com.tw搜尋有關魯迅的中文(繁體)網頁。 共約有32項查詢結果,這是第1-10項 。 搜尋共費0.17秒。
注意:site後的冒號為英文字元,而且,冒號後不能有空格,否則,“site:”將被作為一個搜尋的關鍵字。此外,網站功能變數名稱不能有“http”以及“www”首碼,也不能有任何“/”的目錄尾碼;網站頻道則只局限於“頻道名.功能變數名稱”方式,而不能是“功能變數名稱/頻道名”方式。諸如“金庸 site:news.sina.com.tw/1/”的語法是錯誤的。
8.2,查詢某一類文件(往往帶有同一副檔名)
“filetype:”,這是個尚在測試階段的GOOGLE特色查詢,不過功能已經非常強大,可以做很多意想不到的事情哦。
最重要的文檔搜尋是PDF搜尋。PDF是ADOBE公司開發的電子文檔格式,現在已經成為互聯網的電子化出版標準。目前GOOGLE檢索的PDF檔案大約有2500萬左右。PDF檔案通常是一些圖文並茂的綜合性 檔案,提供的資訊一般比較集中全面。
示例:搜尋關於電子商務(ECOMMERCE)的PDF檔案。
搜尋:“ecommerce filetypedf”
結果:已向網際網路搜尋ecommerce filetypedf. 共約有38,300項查詢結果,這是第91-100項 。 搜尋共費0.38秒。
下面是某項搜尋結果:
[PDF] www.ecommerce.gov/apec
檔案類型: PDF/Adobe Acrobat - HTML 版
Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE
READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. ...
www.ecommerce.gov/apec/docs/readine...ess_guide_5.pdf - 類似網頁
可以看到,GOOGLE在PDF檔前加上了[PDF]的標記,而且,GOOGLE把PDF檔轉換成了文字檔,點擊“HTML 版”,可以粗略的查看該PDF檔案的大致內容。當然,PDF原有的圖片以及格式是沒有了。
搜尋PDF檔案還可以用“inurl:”語法。比如上例,也可以用“inurldf ecommerce”。搜尋結果數量大致相同,不過查詢結果順序則有很大差別。
注意,上述查詢均是對PDF內文的檢索,“ecommerce”這個關鍵字是包含在PDF檔案中的。
“filetype”的另一個強大用處則在圖片搜尋。下文將對GOOGLE的圖片搜尋功能作詳細說明,此處只是略提一下。進入“ http://images.google.com/ ”,查找關於本拉登的JPG圖片。
搜尋:“Bin Laden filetype:jpg”
結果:搜尋有關 Bin Laden filetype:jpg 的圖片。(試驗版) 共約有1,630項查詢結果,這是第1-20項 。 搜尋共費0.14秒。
除此之外,我尚未發現其他的filetype用法。如果有誰知道,請給我發郵件。預先感謝。
8.3,搜尋的關鍵字包含在URL鏈結中
“inurl”語法返回的網頁鏈結中包含第一個關鍵字,後面的關鍵字則出現在鏈結中或者網頁檔案中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,於是,就可以用INURL語法找到這些相關資源鏈結,然後,用第二個關鍵字確定是否有某項具體資料。INURL語法和基本搜尋語法的最大區別在於,前者通常能提供非常精確的專題資料。
示例:查找MIDI曲“滄海一聲笑”。
搜尋:“inurl:midi 滄海一聲笑”
結果:已搜尋有關inurl:midi 滄海一聲笑的中文(繁體)網頁。 共約有22項查詢結果,這是第1-10項 。 搜尋共費0.16秒。
示例:查找微軟網站上關於windows2000的安全課題資料。
搜尋:“inurl:security windows2000 site:microsoft.com”
結果:已在microsoft.com內搜尋有關inurl:security windows2000 的網頁。 共約有459項查詢結果,這是第1-10項 。 搜尋共費0.27秒。
注意:“inurl:”後面不能有空格,GOOGLE也不對URL符號如“/”進行搜尋。例如,GOOGLE會把“cgi-bin/phf”中的“/”當成空格處理。
“allinurl”語法返回的網頁的鏈結中包含所有作用關鍵字。這個查詢的關鍵字只集中於網頁的鏈結字串。
示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF script程式(這個script是不安全的),表現在鏈結中就是“功能變數名稱/cgi-bin/phf”。
語法:“allinurl:"cgi-bin" phf +com”
搜尋:已向網際網路搜尋allinurl:"cgi-bin" phf +com. 共約有47項查詢結果,這是第1-10項 。 搜尋共費0.36秒。
8.4,搜尋的關鍵字包含在網頁標題中
“intitle”和“allintitle”的用法類似於上面的inurl和allinurl,只是後者對URL進行查詢,而前者對網頁的標題欄進行查詢。網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。
示例:查找日本明星藤原紀香的照片集。
搜尋:“intitle:藤原紀香 寫真”
結果:已搜尋有關intitle:藤原紀香 寫真的中文(繁體)網頁。 共約有125項查詢結果,這是第1-10項 。 搜尋共費0.36秒。
9,其他罕用語法
9.1,搜尋所有鏈結到某個URL位址的網頁
如果你擁有一個個人網站,估計很想知道有多少人對你的網站作了鏈結。而“link”語法就能讓你迅速達到這個目的。
示例:搜尋所有含指向台灣大學“www.ntu.edu.tw”鏈結的網頁。
搜尋:“link:www.ntu.edu.tw”
結果:搜尋有鏈結到www.ntu.edu.tw的網頁 。 共約有1750項查詢結果,這是第1-10項 。 搜尋共費0.20秒。
注意:“link”不能與其他語法相混合操作,所以“link:”後面即使有空格,也將被GOOGLE忽略。
9.2,查找與某個頁面結構內容相似的頁面
“related”用來搜尋結構內容方面相似的網頁。例:搜尋所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),“related:www.sina.com.tw/index.shtml”。
9.3,從GOOGLE伺服器上緩存頁面中查詢資訊
“cache”用來搜尋GOOGLE伺服器上某頁面的緩存,通常用於查找某些已經被刪除的死鏈結網頁,相當於使用普通搜尋結果頁面中的“頁庫存檔”功能。
示例:查找GOOGLE緩存的中文yahoo首頁
搜尋:“cache:www.yahoo.com.tw”
結果:這是 G o o g l e 內 http://tw.yahoo.com/ 的頁庫存檔。
G o o g l e 已先預覽各網站,在頁庫儲有各網頁的存檔。
這網頁可能有更新的版本,請按此查看新版。
Google 和網頁作者無關,對網頁的內容恕不負責。
...
9.4,info
info用來顯示與某鏈結相關的一系列搜尋,提供cache、link、related和完全包含該鏈結的網頁的功能。
示例:查找和新浪首頁相關的一些資訊。
搜尋:“info:www.sina.com.tw”
結果:有關www.sina.com.tw的網頁信息。
新浪網 台灣 - 未來生活現在GO!
SINA_AD, 新浪電子信箱, SINA English | | 加
入會員. |, 新聞, |, 兩岸, |, 雜誌, |, 財
金, ...
Google提供這個網址的資料:
查看Google頁庫裡www.sina.com.tw的存檔
尋找和www.sina.com.tw類似的網頁
尋找網頁有連結到www.sina.com.tw
尋找網頁內容裡有"www.sina.com.tw"
10,圖片搜尋
我不得不承認,GOOGLE的圖片搜尋功能真是個偉大的發明!!GOOGLE自稱可以檢索330,000,000張圖片,並稱自己為“互聯網上最好用的圖片搜尋工具”。儘管目前該功能尚在測試階段,但的確已經非常好用!
GOOGLE首頁點擊“圖片”鏈結就進入了GOOGLE的圖片搜尋介面“images.google.com”。你可以在關鍵字欄位元內輸入描述圖片內容的關鍵字,如“britney spears”,就會搜尋到大量的小甜甜布蘭妮的圖片。我目前尚不是很清楚圖片的排列標準,不過以觀察來看,似乎圖片檔案名完全符合關鍵字的結果排列比較前,然後才按照普通的頁面搜尋時的標準排列。
GOOGLE給出的搜尋結果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖片檔案名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是 圖片之縮略圖,以及頁面鏈結,而下禎,則是該圖片所處的頁面。螢幕右上角有一個“Remove Frame”的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。
GOOGLE圖片搜尋目前支援的語法包括“+”,“-”,“OR”,“site”和“filetype”。
示例:查找美國教育網上的宇宙大爆炸jpg圖片
搜尋:“BIG BANG filetype:jpg site:edu”
結果:搜尋有關 BIG BANG filetype:jpg site:edu 的圖片()。共約有371項查詢結果,這是第1-20項 。 搜尋共費1.99秒。
11,目錄內搜尋
如果不想搜尋廣泛的網頁,而是想尋找某些專題網站,可以瀏覽GOOGLE的分類目錄“ http://directory.google.com/ ”,中文目錄是“ http://directory.google.com/Top/Wor...se_Traditional/ ”。
目前GOOGLE使用的分類目錄採用了ODP的內容。“Open Directory Project”是網景公司所主持的一項大型公共網頁目錄。由全世界各地的義務編輯人員來審核挑選網頁,並依照網頁的性質及內容來分門別類。因此,在某一目錄門類中進行搜尋往往能有更高的命中率。另外,GOOGLE根據其專業的“網頁級別”(PageRank)技術對目錄中登錄的網站進行了排序,可以讓一般的檢索更具高效率。
示例:查找一下關於癌症治療以及護理方面的中文資料
搜尋:先進入中文繁體分類目錄,再進入“健康”子目錄,確定選中“只在健康中搜尋”單選項目。在搜尋欄內填入“癌症”進行搜尋。
結果:在分類健康項中搜尋癌症。 共約有98,300項查詢結果,這是第1-10項 。 搜尋共費0.21秒。
可以看到,上述查詢結果比普通的檢索更有效,因為在分類健康項中進行搜尋剔除了很多不相關的諸如新聞之類的無效資訊。不過,對於中文用戶而言,現在最大的問題是志願的中文目錄編輯太少,導致收錄站點太少,因此搜尋結果範圍顯得過於狹隘。但願這個問題能隨著GOOGLE以及ODP項目在國內名聲的響亮而能得到改觀。
12,新聞群組(USENET)搜尋
新聞群組有詳盡的分類主題,某些主題還有專人管理和編輯,具有大量的有價值資訊。由於新聞群組包含的資訊實在是海量,因此不利用工具進行檢索是不大可能的。DEJA一直是新聞群組搜尋引擎中的佼佼者。2001年2月份,GOOGLE將DEJA收購並提供了所有DEJA的功能。現在,除了搜尋之外,GOOGLE還支援新聞群組的WEB方式流覽和張貼功能。
進入GOOGLE新聞群組“ http://groups.google.com/ ”,你有兩種資訊查找方式。一種是一層層的點擊進入特定主題討論組,另一種則是直接搜尋。現在,我們進行一個最簡單的搜尋試驗,查找一下新聞群組中關於山頂洞人的討論資訊。
搜尋:“山頂洞人”
結果:在各群組內搜尋 山頂洞人 共約有2,210項查詢結果,這是第1-10項 。 搜尋共費0.29秒。
搜尋結果默認按照“留言內容”排列,但是你也可以點擊“依照日期”按鈕,讓帖子按照發佈日期排列。
因為新聞群組中的帖子實在是多,而且又涉及一些普通搜尋所沒有的語法,所以建議使用“進階新聞群組搜尋”進入進階搜尋介面。進階新聞群組搜尋提供尋找留言、 新聞群組、標題、作者、留言代碼、語言和留言日期作為條件進行 搜尋。其中作者項指作者發帖所用的唯一識別號電子信箱。
13,GOOGLE的其他傑出功能
13.1,集成化的Toolbar
為了方便搜尋者,GOOGLE提供了Toolbar,集成於流覽器中,用戶無需打開GOOGLE主頁就可以在Toolbar內輸入關鍵字進行搜尋。此外,Toolbar還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞群組搜尋、進階搜尋和 搜尋設定之間切換。欲安裝GOOGLE的Toolbar,可以瀏覽“ http://toolbar.google.com/ ”,按頁面提示可以自動下載並安裝。不過,GOOGLE Toolbar目前只支援IE5.0以上版本。
對於經常進行網路搜尋者而言,GOOGLE Toolbar實在是必備的東西!!
13.2,單詞英文解釋
寫英文文章的時候,最頭疼的事情就是對某個英文單詞的用法不確定。現在有了GOOGLE,一切就迎刃而解了!無論你是想查找某個生詞的意思還是想瞭解某個單詞的用法,均可使用線上詞典。
進入英文GOOGLE,輸入你要查的單詞。舉個例子,我想查一下suggest的用法。結果如下:“Searched the web for suggest. Results 1 - 10 of about 11,300,000. Search took 1.14 seconds. ”注意看上面句子中,單詞suggest下出現了一個橫線,點擊這個鏈結,就跳轉到另外一個網站“http://www.dictionary.com/”,GOOGL...悛爾埏伓挭嬪a。
13.3,網頁翻譯
你懂英文,但是你不見得就懂德文、法文、拉丁文。如果搜尋出來的頁面是這些語言怎麼辦?呵呵,GOOGLE提供了網頁翻譯功能!!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,但是我不得不承認,這是個傑出功能。
試著做以下搜尋:“big bang site:fr”。這個表示查找關於宇宙大爆炸的法文網頁。看第一條結果:
The Big Bang Website - [ Translate this page ]
... A propos de Big Bang. Le dernier numero en date. Les anciens numeros. Autres
activites. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages
有點暈。沒關係,點擊“Translate this page”按鈕。再看結果,嗯,大致能看明白,這原來是個叫“big bang”的樂隊的網站,與大爆炸無關...
機器翻譯是一個很前沿的人工智慧課題,想指望翻譯出來的結果跟專門用英語撰寫的內容是不可能的。但西文間的互相轉譯比中英文機譯強得多得多了。至少能看明白。
13.4,搜尋結果過濾
網路上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,流覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設置頁面, http://www.google.com/preferences ,最底下有一個選項SafeSearch Filtering。不過,中文狀態下的GOOGLE尚沒有這個功能。
14,搜尋技巧之關鍵字選擇初探
關鍵字的選擇在搜尋中起到決定性的作用,所有搜尋技巧中,關鍵字選擇是最基本也是最有效的。
例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。
分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜尋引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果瞭解目標資訊的構成,用一些目標資訊所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜尋關鍵字不一定就是目標資訊的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。
搜尋:“酒 貴 賤 之”,OK,找到的第一條資訊就是鏡花緣的這一段落:“先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...”
以上的關鍵字選擇技巧可以謂之“特定詞法”。
例二:“黃花閨女”一詞中“黃花”是什麼意思。
分析:“黃花閨女”是一個約定的俗語,如果只用“黃花閨女
黃花”做關鍵字,搜尋結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵字,約束搜尋結果。選擇什麼關鍵字好呢?備選的有“意思”、“含義”、“來歷”、“由來”、“典故”、“出典”、“淵源”等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字裏,所以用諸如“來歷”、“由來”、“出典”等辭彙的概率更高一些。
搜尋:“黃花閨女 黃花 由來”,查到“黃花”原來出典于《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用“太平御覽 壽陽公主”做搜尋了。
以上的關鍵字選擇技巧可以謂之“近義詞法”。
例三:劉德華同志的胸圍是多少。
分析:首先聲明,這是某個MM要我做的搜尋,我把它作為搜尋案例而已,沒其他的意思。非常直接的搜尋是,“劉德華 胸圍”,但事實上,這麼搜尋出來的結果,儘是一些諸如“劉德華取笑莫文蔚胸圍太小”之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關資訊。OK,這樣就可以進一步的增加其他約束性關鍵字以縮小 搜尋範圍。
搜尋:“劉德華 胸圍
身高”,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》裏居然含有這樣關鍵字,阿泰“改編自劉德華《忘情水》的變態歪歌”、“用身高體重三圍和生日來加以編號”。好辦,把這部小說去掉,“劉德華 胸圍 身高 -阿泰”,OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用“阿泰”而不用“第一次親密接觸”呢?這是因為小說的名字被轉載的時候可能有變動,但裏面角色的名字是不會變的。
以上的關鍵字選擇技巧可以謂之“相關詞法”。
15,常用搜尋個案
15.1,找人
分析:一個人在網上揭示的資料通常有:姓名,網名,性別,年齡,畢業學校,工作單位,外號,住址,電話,信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要瞭解一下你多年沒見過的同學,那不妨用上述資訊做關鍵字進行查詢,也許會有大的收穫。
15.2,找軟體
分析一:最簡單的搜尋當然就是直接以軟體名稱以及版本號為關鍵字查詢。但是,僅僅有軟體名稱和目標網站,顯然還不行,因為搜尋到的可能是軟體的相關新聞。應該再增加一個關鍵字。考慮到下載頁面上常有“點擊此處下載”或者“download”的提示語,因此,可以增加“下載”或者“download”為關鍵字。
搜尋:“winzip 8.0 下載”
結果:已搜尋有關winzip 8.0
下載的中文(繁體)網頁。共約有1,440項查詢結果,這是第1-10項。搜尋共費0.42秒。
分析二:很多網站設有專門的下載目錄,而且就命名為“download”,因此,可以用INURL語法直接搜尋這些下載目錄。
搜尋:“winzip 8.0 inurl:download”
結果:已搜尋有關winzip 8.0
inurl:download的中文(繁體)網頁。共約有552項查詢結果,這是第1-10項。搜尋共費0.64秒。
在互聯網上隨意的下載軟體是不安全的,因為供下載的軟體有可能帶有病毒或者捆綁了木馬,所以,對下載網站作一個限定,是一個穩妥的思路。可以用SITE語法達到這個目的。
共用軟體下載完之後,使用的時候,軟體總跳出警示框,或者軟體的功能受到一定限制。由於中國的線民多是窮棒子,所以應該再找一個註冊碼。找註冊碼,除了軟體的名稱和版本號外,還需要有諸如“serial
number”、“sn”、“序列號”等關鍵字。現在,來搜尋一下winzip8.0的註冊碼。
搜尋:“winzip 8.0 sn”
結果:已向網際網路搜尋winzip 8.0 sn. 共約有70項查詢結果,這是第1-10項。搜尋共費0.30秒。
15.3,找圖片
除了GOOGLE提供的專門圖片搜尋功能,還可以組合使用一些搜尋語法,達到圖片搜尋之目的。
分析一:專門的圖片集合,提供圖片的網站通常會把圖片放在某個專門目錄下,如“gallary”、“album”、“photo”、“image”等。這樣就可以使用INURL語法迅速找到這類目錄。現在,試著找找小甜甜布蘭妮的照片集。
搜尋:“"britney spears" inurlhoto”
結果:已向網際網路搜尋"britney spears" inurlhoto. 共約有3,430項查詢結果,這是第1-10項。 搜尋共費0.59秒。
分析二:提供圖片集合的網頁,在標題欄內通常會注明,這是誰誰的圖片集合。於是就可以用INTITLE語法找到這類網頁。
搜尋:“intitle:"britney spears" picture”
結果:已向網際網路搜尋intitle:"britney spears" picture. 共約有16,300項查詢結果,這是第1-10項。 搜尋共費0.40秒。
分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。於是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。
搜尋:“"britney spears" site:geocities.com”
結果:在geocities.com站內搜尋了有關"britney spears" 的網頁。共約有53,100項查詢結果,這是第1-10項。 搜尋共費0.18秒。
15.4,找MP3
分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。所以,可以用INURL語法迅速找到這類目錄。現在用這個辦法找找老歌“say
you say me”。
搜尋:“"say you say me" inurl:mp3”
結果:已向所有網站搜尋"say you say me" inurl:mp3。 共約有179項查詢結果,這是第1-10項。搜尋共費0.19秒。
分析二:也可以通過網頁標題,找到這類提供MP3的網頁。
搜尋:“"say you say me" intitle:mp3”
結果:已向所有網站搜尋"say you say me" intitle:mp3。 共約有185項查詢結果,這是第1-10項。搜尋共費0.45秒。
當然,如果你知道某個網站的下載速度快,而且樂曲全,就可以用SITE語法先到該網站上看看有沒有目標樂曲。
15.5,找書
分析一:對我而言,常瀏覽的電子圖書館類網站就那麼幾個,比如文藝類的“ www.shuku.net ”。於是可以用SITE語法很簡單的找到某本書(如果該網站上有的話)。比如,“舊唐書 site:shuku.net”,就可以馬上找到該書。如果沒有,通常別的網站上也很難找到。因此,找書的關鍵,是你瞭解一大批著名的圖書館網站。
結果:從shuku.net站內搜尋有關舊唐書 的中文(繁體) 和 中文(簡體)網頁。 共約有347項查詢結果,這是第1-10項。搜尋共費3.41秒。
分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對於迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的內容有印象的基礎上。比如如果瞭解堂吉訶德一書戰風車的大致內容,就可以用“吉訶德 風車 桑喬”迅速找到該書。
16,GOOGLE搜尋FAQ
Q:如何全面的瞭解google.com?
A:查看網站相關頁面“ http://www.google.com/about.html ”。
Q:如何切換google.com的初始語言介面?
A:點擊搜尋欄右邊的“使用偏好”(Preferences),選擇“介面語言”(Interface Language)中你期望的語言,點擊最下面的“設定使用偏好”(Save Preferences)按鈕。需要提醒的是,GOOGLE用cookie記錄這個偏好,所以如果你把流覽器的cookie功能關掉,就無法進行設定。
Q:如何設定每頁搜尋結果顯示數量?
A:同上,進入使用偏好,在該頁的“查看結果”(Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,默認是10項。
Q:搜尋到的鏈結無法打開怎麼辦?
A:鏈結無法打開的原因很多,比如網站當機,或者頁面已經死掉等等,可以點擊GOOGLE的“頁庫存檔”查看在GOOGLE伺服器上的網頁緩存。不過,如果該頁面是被當地ISP過濾的話,伺服器緩存還是無法打開。唯一的辦法在於利用代理伺服器,然後在URL欄內輸入鏈結的IP位址。
Q:打開搜尋結果的鏈結,可是該頁面太大,很難找到一下子找到目的資料怎麼辦?
A:直接打開“頁庫存檔”,GOOGLE會把關鍵字用不同顏色標記出來,很容易找到。
Q:點擊每個查詢結果的時候,我想單獨彈出視窗,這該怎麼辦?
A:進入“使用偏好”介面,注意底部有個“結果視窗”專案,選中“開啟新視窗以顯示查詢結果”核取方塊然後存儲設置就可以了。
17,後記
這個小文章的3.0版本終於更新完了,我終於可以籲口氣了。寫這個搜尋普及文章的初衷和動力在於我以及我的朋友因為使用Internet搜尋引擎而使得工作和學習變得更加輕鬆有趣,我想應該有更多的人來分享這種愉悅。需要提及的是,這個小文章的繼續和更新,多虧了新浪網友“搜尋引擎9238”的大力幫助和鼓勵。如果沒有他的熱忱意見,我想此文會遜色的多了。其他提供過幫助和意見的網友就一併謝過。希望你們能繼續給出意見。 |
|