搜索引擎分為哪幾類(SEO搜索引擎的發展史和分類)
搜索引擎的發展史
互聯網還沒有出現時,人們普遍使用FTP共享信息,大量的文件散布在FTP主機中,使
用戶查詢信息非常麻煩。為了解決這個問題,1990 年,加拿大麥吉爾大學( McGill University )
計算機學院的艾倫。埃塔奇( Alan Emtage)研發了一一種搜索服務工具Archie。Archie可以定期搜集并分析FTP服務器上的文件名信息,為用戶提供查找分散保存在各個FTP主機中的文件的服務。
雖然Archie搜集的信息資源不是網頁,但和搜索引擎的基本工作原理是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie 被公認為搜索引擎的雛形。
后來,隨著互聯網的出現,為了方便查詢互聯網中的網頁信息,真正的搜索引擎也應運而生,并隨著互聯網的發展不斷的發展和進步。總體來說,搜索引擎分為4代,下面分別進行介紹。
● 第一代搜索引擎: 分類目錄時代
分類目錄時代的搜索引擎會收集互聯網上各個網端的站名、網址、內容提要等信息,并將它們分門別類地編排到各網結中,用戶可以在分類目錄中還級瀏覽并尋我相關的網站。搜狐目錄、hao123 等就是典型的分類目承時代的代表。
● 第二代搜索引擎:文本檢索時代
在文本檢索時代,搜索引擎可以對用戶輸入的查詢信息進行各種運算,進而判斷其與目標網頁內容相關程度的高低,并返回相關度高的網頁給用戶。一些早期的搜索引擎, 如Alta Vista、Excite 都是這個時代的代表。
● 第三代搜索引擎: 整合分析時代
到了整合分析時代, 搜索引擎會通過外部鏈接的數量來判斷一個網站的流行性和重要性,然后再結合網頁內容的重要性和相似程度來完善反饋信息的質量,最后還會將反饋回來的海量信息,智能整合成一個門戶網站形式的界面。而不是像文本檢索時代返回一個沒有分類的鏈接清單。最早使用這種整合分析的是Google,它不僅使Google大獲成功,還在當時引起了學術界和其他商業搜索引擎的極度關注。
● 第四代搜索引擎:用戶中心時代
以用戶為中心就是當用戶查詢時,要充分挖掘用戶的深層次需求,實現精準化的用戶定位和營銷。例如,當搜索關鍵詞“手機”時,對于不同職業和不同年齡階段的用戶來說,他們的需求是不同的。甚至同個用戶, 也會因為時間和場合的不同而有不同的需求。而要通過用戶輸入的簡短關鍵詞來判斷用戶的真正需求,就需要搜索引擎能夠真正地了解用戶。搜索引擎可以通過用戶搜索時的大量特征,如上網的時間、操作習慣、搜索內容等,去逐漸勾勒出用戶的大致特征、如性別、年齡階段、興遵愛好等,這些數據就是搜索引擎進行“商業數據控報”的巨大寶城。
搜索引擎的分類
SEO人員要想提升網站的搜索效率、首先應該熟悉搜索引擎的分類,再根據網站的屬性來優化網站。目前搜索引擎主要分為全文搜索引擎、目錄搜索引擎、元搜索引擎和垂直搜索引擎等,下面分別進行介紹。
1.全文搜索引擎
全文搜索引擎(Full Text Search Engine )是目前應用較泛的主流搜索引擎,國外最具代表性的全文搜索引擎是Google, 國內則是百度和360搜索。全文搜索引擎從互聯網中提取各個網站的信息(以網頁文字為主),建立起網頁數據庫,并檢索與用戶搜索條件相匹配的記錄,按一定的排列順序返回結果。
全文搜索引擎又可以分為兩類,一類是擁有 自己的檢索程序(通常被稱為網絡蜘蛛或網絡機器人)能夠自己從互聯網中抓取網頁建立數據庫,從自身的數據庫中調用搜索結果,如Google、百度和360搜索等。另一類則是租用其他搜索引擎的數據庫,并且按照自定的格式排列搜索結果,如Lycos.由于這種搜索引擎不能夠創建自己的數據庫,無法滿足用戶的需求,現已逐漸被第一類搜索引擎所替代。
2.目錄搜索引擎
目錄搜索引擎( Search Index/Directory )也被稱為“分類檢索”,是以人工方式或者半自動方式搜索網頁的內容,并根據網頁的內容和性質將其納到不同層次的類目之下,形成一定的人工信息摘要,最終形成像圖書館目錄一樣的樹狀分類結構索引。典型的目錄搜索引擎包括雅虎、網易、搜狐等。
目錄搜索引擎為樹狀結構,它在首頁中提供了最基本的入口,用戶可以逐級向下訪問,直到找到所需要的類別。此外,用戶也可以利用搜索引擎提供的搜索功能直接查詢某個關鍵詞。
由于目錄搜索引擎只能在已經保存的站點的描述中搜索,因此網站本身的變化不會反映到搜索結果中,這也是目錄搜索引擎與全文搜索引擎之間的區別。
3.元搜索引擎
元搜索引擎( Meta Search Engine )是為了彌補傳統搜索引擎的不足而出現的一種輔助搜索工具,它可以使用戶只搜索次就得到在多個搜索引擎中搜索的結果。元搜索引擎在接受用戶的搜索請求后,會同時在多個搜索引擎中選擇和利用相對合適的搜索引擎來實現搜索操作,并且將搜案結果返回給用戶。典型的元搜索引擎有IfoSpce、 Dogpile 和Vivisimo 等。
元搜索引擎由3個部分組成,分別是搜索請求處理模塊、搜索接口代理模塊和搜索結果顯示模塊。搜索請求處理模塊負責接收和處理用戶的搜索請求,搜索接口代理模塊負責將用戶的搜索請求翻譯成不同搜索引擎所要求的格式,搜索結果顯示模塊則負責對所有搜索結果進行去重、合并和顯示輸出。
4.垂直搜索引擎
垂直搜索引擎( Vertical Search Engine )更專注于特定的搜索領域和搜索需求,如圖片搜索、視頻搜索、法律搜索、專利搜索和論文搜索等,它是對通用搜索內容的細分。在其特定的搜索領域有更好的用戶體驗,如百度學術、百度文庫、Google學術等都是垂直搜索引擎。
垂直搜索引擎最大的特點是精、準、深,且具有行業色彩。相比于其他無序化的搜索引擎,垂直搜索引擎更加專業和深入,進而保證所收錄信息的完整性和及時性,且其返回的結果重復率低、相關性強、查準率高。
除了以上4種搜索引擎以外,還有集合搜索引擎、免費鏈接列表等搜索引擎。這些搜索引擎的應用范圍相對較窄,讀者只需適當了解即可。