close
飼育網路爬蟲:搜尋引擎資料探勘最佳化在博客來熱銷
推薦好書值得您購買
博客來電腦資訊-網路/架站分類熱銷好書
想了解更多[飼育網路爬蟲:搜尋引擎資料探勘最佳化]的介紹請點擊左邊圖片
點圖即可看詳細介紹
內容簡介
本書作者是一位資深的搜尋引擎開發人員,作者對資料獲取(網路資訊挖掘)與資料檢索(搜尋引擎)兩方面作了深入的介紹。本書首先提出了一套「網路資料採擷」的完整理論,並舉出一個實際的智慧爬蟲系統,透過理論與實際的完整呈現,使讀者能夠對「網路資料採擷」有一個比較具體的認識,然後介紹了一個專用程式語言IRS,並舉出了這個語言的編譯器以及虛擬機器的實現方法。
本書還透過對多個開放原始碼搜尋引擎項目抽絲剝繭的細緻分析,引出搜尋引擎的一些基本原理與開發方法,並介紹一個商業化搜尋引擎的實例;最終還結合一個Java框架介紹一些軟體設計思想。
希望本書能對搜尋引擎開發人員有所啟發,幫助那些對搜尋引擎開發有興趣的讀者踏進這扇大門,並為那些經驗不那麼豐富的搜尋引擎開發者提供一些參考,使得廣大網際網路使用者能在Google 和Baidu 之外的眾多的垂直搜索網站上獲得更好的體驗與服務。從初學者到有一定經驗的搜尋引擎開發人員,各個層次的讀者都能找到一些適合自己閱讀的章節。
...繼續閱讀
全站熱搜
留言列表