搜索资源列表
cx-extractor-1.1
- 基于行块分布函数的通用网页正文抽取算法,内有多种方法-Distribution function based on a common line of the block body of the page extraction algorithm, there are several ways
TextExtract
- * 在线性时间内抽取主题类(新闻、博客等)网页的正文。 * 采用了<b>基于行块分布函数</b>的方法,为保持通用性没有针对特定网站编写规则。-Web text extraction code,* in linear time extract topic class (news, blogs, etc.) the body of the page. * using the < b > &l
基于行块分布函数的通用网页正文抽取 (1)
- 基于行块分布函数的通用网页正文抽取 (1)(General Text Extraction Based on Line Block Distribution Function)