资源列表
[搜索引擎] bamboo.v.1
说明:该程序从网页的特征出发,利用简单的规则方法,却能够达到较好的效果。-The characteristics of the program starting from a web page, using simple rules of method, they can achieve better results.<yanyuzuo> 在 2025-06-10 上传 | 大小:2kb | 下载:0
[搜索引擎] search.class
说明:文本搜索类,支持全文搜索及关键字高亮显示,搜索结果类似百度的搜索结果-a class of text search,which support all text search and highlighting keywords,the result looks like the result of BAIDU<jewgle> 在 2025-06-10 上传 | 大小:2kb | 下载:0
[搜索引擎] collect
说明:简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度-Simple collection reptiles# 1. I have only had a collection of url feature, if y<wangyh123> 在 2025-06-10 上传 | 大小:5kb | 下载:0
[搜索引擎] google-blog-CodePub.tar
说明:Google “解放数据”(Data Liberation)团队今天正式发布 Google Blog Converters 1.0,该开源工具可以让你在不同博客服务之间自由转移文章和评论数据。第一个版本提供了 Python 程序库及相关可执行脚本,用于相互转换 Blogger、LiveJournal、MovableType 和 WordPress 导出的各种数据文件格式。-Google " the liberation of Data" (Data Liberation) te<wangyh123> 在 2025-06-10 上传 | 大小:1.83mb | 下载:0