资源列表
[搜索引擎] lucene-1.4.3
说明:java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)<淞信呈> 在 2008-10-13 上传 | 大小:1.63mb | 下载:0
[搜索引擎] rj588_tongyicjuniveralgatsy
说明:统一搜集系统 Univeral Gather System(UGS) 是针对搜集程序设计的一套PHP类 ,使用方便 运行于各种Unix系统 linux系统和Win2000/XP/2003 系统中 类内函数 steal 用于搜集页面文字 cut/cutpro 用于剪切文字 filt/filtx用于过滤文字 change用于改变文字 getenterkey用于获得关键位置的链接Array _striplinks和_striptext 用于产生锚点的Array和文字-unified collectio<邹军强> 在 2008-10-13 上传 | 大小:8.18kb | 下载:0
[搜索引擎] PDFBox-0.6.7a
说明:采用java编写的处理PDF文档的程序,可从PDF文档中抽取txt文本,可与lucene搜索引擎相结合。-adopting the java programs compiled to dispose the PDF document, taking out the txt text from the PDF document, and combining with the lucene searcher.<孔敬> 在 2008-10-13 上传 | 大小:9.2mb | 下载:0
[搜索引擎] 信息检索报告
说明:Information Retrieval (IR) is the discipline that deals with retrieval of unstructured data, especially textual documents, in response to a query or topic statement, which mayitselfbeunstructured,e.g.,asentenceorevenanotherdocument,orwhichmay be s<fuji246> 在 2009-01-05 上传 | 大小:741.63kb | 下载:14
[搜索引擎] Webloup
说明:WebLoupe is a java-based tool for analysis, interactive visualization (sitemap), and exploration of the information architecture and specific properties of local or publicly accessible websites. Based on web spider (or web crawler) technology. 开源搜索爬<vanjor> 在 2009-03-11 上传 | 大小:3.14mb | 下载:0
[搜索引擎] google Search Engine
说明:google php 搜索引进,代码简易,功能强大。<luckywolf2004@163.com> 在 2009-11-01 上传 | 大小:47.32kb | 下载:0
[搜索引擎] BISM “菁搜”FTP搜索引擎控制台源码
说明:开源项目:BISM“菁搜”FTP搜索引擎 borland c++ 2007开发平台 这里使用了boost库 联系EMAIL:BISM软件工作组 E-MAIL:Bismsotware@163.com 余文锋 E-MAIL:wenfeng610@yahoo.com.cn 陈鸿雏 E-MAIL:canzer@126.com.cn 吴侃侃 E-MAIL:suzerain2005@163.com 相关的其它信息:http://blog.csdn<wenfeng610> 在 2009-06-08 上传 | 大小:7.62mb | 下载:9