這個時代也可以稱為"導航時代",Yahoo和國內hao123是這個時代的代表。通過人工收錄整理,把屬于各個類別的高質量網站或者網頁分門別類羅列,用戶可以根據分級目錄來查找高質量的網站。這種方式是純人工的方式,并未采取什么高深的技術手段。
相比分類目錄,這種方式可以收錄大部分網頁,并能夠按照網頁內容和用戶查詢的匹配程度進行排序。但是總體而言,搜索結果質量不是很好。采取分類目錄的方式,一般被收錄的網站質量都比較高,但是這種方式可擴展性不強,絕大部分網站不能被收錄。
文本檢索的一代采用經典的信息檢索模型,比如布爾模型,向量空間模型或者概率模型,來計算用戶查詢關鍵詞和網頁文本內容的相關程序。網頁之間有豐富的鏈接關系,而這一代搜索引擎并未使用這些信息。早期的很多搜索引擎比如Altavista、Excite等大都采取這種模式。
這一代的搜索引擎充分利用了網頁之間的鏈接關系,并深入挖掘和利用了網頁鏈接所代表的含義。通常而言,網頁鏈接代表了一種推薦關系,所以通過鏈接分析可以在海量內容中找出重要的網頁。這種重要性本質上是對網頁流行程序的一種衡量,因為被推薦次數多的網頁期實代表了更具有流行性,搜索引擎通過結合網頁流行性和內容相似性來改善搜索質量。

相比分類目錄,這種方式可以收錄大部分網頁,并能夠按照網頁內容和用戶查詢的匹配程度進行排序。但是總體而言,搜索結果質量不是很好。采取分類目錄的方式,一般被收錄的網站質量都比較高,但是這種方式可擴展性不強,絕大部分網站不能被收錄。
文本檢索的一代采用經典的信息檢索模型,比如布爾模型,向量空間模型或者概率模型,來計算用戶查詢關鍵詞和網頁文本內容的相關程序。網頁之間有豐富的鏈接關系,而這一代搜索引擎并未使用這些信息。早期的很多搜索引擎比如Altavista、Excite等大都采取這種模式。
這一代的搜索引擎充分利用了網頁之間的鏈接關系,并深入挖掘和利用了網頁鏈接所代表的含義。通常而言,網頁鏈接代表了一種推薦關系,所以通過鏈接分析可以在海量內容中找出重要的網頁。這種重要性本質上是對網頁流行程序的一種衡量,因為被推薦次數多的網頁期實代表了更具有流行性,搜索引擎通過結合網頁流行性和內容相似性來改善搜索質量。