九大開源搜索引擎介紹
2010-01-08 10:47 來源:中國搜索研究中心 責編:涂運
【CPP114】訊:1. Lucene.
他是一個全文搜索引擎工具包,但只支持文本文件以及少量語種的索引;通過Lucene提供的接口,我們可以自己開發具體語言的分詞器,針對具體文檔的文本解析器等;Lucene是索引數據結構事實上的標準;使用Java編寫,但是被轉化為多個庫;
2. LIUS
是Lucene的加強版,Lucene Index Update and Search增加了對多種文檔的支持,增加了索引更新功能;
3. Egother
一個用于全文搜索引擎的Java庫,能夠為具體的應用程序添加全文搜索功能;新的動態算法提高索引的更新速度;支持平行的查詢方式,支持多種文檔
4.Xapian
使用C++編寫,提供綁定程序使得其他語言能夠方便地使用它;便于進行二次開發
5. Campass
在Lucene上實現的開源搜索引擎架構,提供更加簡潔的搜索引擎api增加了索引事務處理功能,與數據庫事務處理整合;更新時無需刪除原文檔,更加簡介與高效;資源與搜索引擎之間采用映射機制;能與Hibernate,Spring等架構進行整合;開源web搜索引擎系統:
6. Nutch
基于Lucene構建的web搜索引擎系統,簡潔;
7.YaCy
基于p2p的分布式開源web搜索引擎系統,使用java;其核心是分布在數百臺計算機上的被稱為YaCy-peer的計算機程序,基于p2p網絡構成了YaCy網絡,整個網絡是一個分散的架構,所有的peer處于對等的地位,沒有統一的中心服務器,每個peer獨立地進行互聯網的爬行抓取,分析及建立索引庫,并通過p2p網絡進行共享;而且每個peer又都是一個獨立的代理服務器,能夠對本機使用的網頁進行索引,采用多種機制保護用戶的隱私,也通過本機運行的web服務器進行查詢和返回結果。桌面搜索引擎系統
8. regian
對中文支持跨平臺
9. Zilverline
以Lucene為基礎,采用Spring為框架,中文名為銀錢查打引擎;使用Jave編寫;
【點擊查看更多精彩內容】
相關新聞:
企業網站SEO必知:谷歌搜索引擎收錄與排名習慣淺析
廣告協會陳永:搜索營銷將垃圾信息變廢為寶
提升報業收入默多克先禮后兵 新聞集團收費政策叫停谷歌搜索
他是一個全文搜索引擎工具包,但只支持文本文件以及少量語種的索引;通過Lucene提供的接口,我們可以自己開發具體語言的分詞器,針對具體文檔的文本解析器等;Lucene是索引數據結構事實上的標準;使用Java編寫,但是被轉化為多個庫;
2. LIUS
是Lucene的加強版,Lucene Index Update and Search增加了對多種文檔的支持,增加了索引更新功能;
3. Egother
一個用于全文搜索引擎的Java庫,能夠為具體的應用程序添加全文搜索功能;新的動態算法提高索引的更新速度;支持平行的查詢方式,支持多種文檔
4.Xapian
使用C++編寫,提供綁定程序使得其他語言能夠方便地使用它;便于進行二次開發
5. Campass
在Lucene上實現的開源搜索引擎架構,提供更加簡潔的搜索引擎api增加了索引事務處理功能,與數據庫事務處理整合;更新時無需刪除原文檔,更加簡介與高效;資源與搜索引擎之間采用映射機制;能與Hibernate,Spring等架構進行整合;開源web搜索引擎系統:
6. Nutch
基于Lucene構建的web搜索引擎系統,簡潔;
7.YaCy
基于p2p的分布式開源web搜索引擎系統,使用java;其核心是分布在數百臺計算機上的被稱為YaCy-peer的計算機程序,基于p2p網絡構成了YaCy網絡,整個網絡是一個分散的架構,所有的peer處于對等的地位,沒有統一的中心服務器,每個peer獨立地進行互聯網的爬行抓取,分析及建立索引庫,并通過p2p網絡進行共享;而且每個peer又都是一個獨立的代理服務器,能夠對本機使用的網頁進行索引,采用多種機制保護用戶的隱私,也通過本機運行的web服務器進行查詢和返回結果。桌面搜索引擎系統
8. regian
對中文支持跨平臺
9. Zilverline
以Lucene為基礎,采用Spring為框架,中文名為銀錢查打引擎;使用Jave編寫;
【點擊查看更多精彩內容】
相關新聞:
企業網站SEO必知:谷歌搜索引擎收錄與排名習慣淺析
廣告協會陳永:搜索營銷將垃圾信息變廢為寶
提升報業收入默多克先禮后兵 新聞集團收費政策叫停谷歌搜索
- 關于我們|聯系方式|誠聘英才|幫助中心|意見反饋|版權聲明|媒體秀|渠道代理
- 滬ICP備18018458號-3法律支持:上海市富蘭德林律師事務所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098