搜索资源列表

  1. je-analysis-1.5.3

    0下载:
  2. 在java环境下开发的分词源代码,本代码可以通过lucene,nutch调用,实现对中文的分词-Java development environment in the sub-etymology code, this code can be used with lucene, nutch call, the aim is to achieve the Chinese word
  3. 所属分类:JSP源码/Java

    • 发布日期:2024-05-23
    • 文件大小:801792
    • 提供者:小艺
  1. apache-nutch-1.4-src.tar

    0下载:
  2. 很好的一个开源搜索引擎,可以自己设计添加代码。-A good open source search engine can be designed to add your own source code
  3. 所属分类:搜索引擎

    • 发布日期:2024-05-23
    • 文件大小:2066432
    • 提供者:李伟男
  1. clou

    0下载:
  2. 集群三台主机,搭建了基于NUTch的搜索引擎-Cluster three hosts, built based on NUTch search engine
  3. 所属分类:Linux/Unix编程

    • 发布日期:2024-05-23
    • 文件大小:1580032
    • 提供者:keyoo
  1. Hadoopsource

    0下载:
  2. Google的核心竞争技术是它的计算平台。Apache上就出现了一个类似的解决方案,目前它们都属亍Apache的Hadoop项目,对应的分删是: Chubby-->ZooKeeper GFS-->HDFS BigTable-->HBase MapReduce-->Hadoop 目前,基亍类似思想的Open Source项目迓径多,Hadoop是其中最为流行的框架,本文就将简要介绍hadoop的一个开发流程。-Ha
  3. 所属分类:技术管理

    • 发布日期:2024-05-23
    • 文件大小:607232
    • 提供者:aaaaaaa
  1. lucene

    0下载:
  2. lucene+nutch搜索引擎开发,分布式搜索引擎开发-lucene+nutch search engine development Download
  3. 所属分类:书籍源码

    • 发布日期:2024-05-23
    • 文件大小:23204864
    • 提供者:Joanna
  1. Nutch

    0下载:
  2. Apache-Nutch1.3 学习笔记,很完整的学习笔记,内容很全-Apache-Nutch1.3 study notes, very complete study notes, is the whole content
  3. 所属分类:软件工程

    • 发布日期:2024-05-23
    • 文件大小:631808
    • 提供者:李焦飞
  1. nutch-yuqing

    0下载:
  2. 该资料介绍了现实网络舆情监测系统所用到的流行的技术手段-The information on the real network public opinion monitoring system used by the popular techniques
  3. 所属分类:其他小程序

    • 发布日期:2024-05-23
    • 文件大小:111616
    • 提供者:撒是
  1. Hadoop-based-distributed-crawler

    0下载:
  2. 本文讨论了搜索引擎的基本技术和网络爬虫的基本原理,并对分布式爬虫的技术原型Nutch进行了剖析。 -This article discusses the basic principles and basic techniques of search engine web crawlers, and distributed Nutch crawler technology prototypes were analyzed.
  3. 所属分类:软件工程

    • 发布日期:2024-05-23
    • 文件大小:5183488
    • 提供者:张培培
  1. apache-nutch-2.2.1-src

    0下载:
  2. web crawl desigend by java,web crawl desigend by java
  3. 所属分类:Internet/网络编程

    • 发布日期:2024-05-23
    • 文件大小:5663744
    • 提供者:song qing
  1. select_mfcc.tar

    0下载:
  2. Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫-Nutch is an open source Java implementation of the search engine. It provides all the tools we needed to run its own search engine for. Including full-text sear
  3. 所属分类:汇编语言

    • 发布日期:2024-05-23
    • 文件大小:6661120
    • 提供者:楚博策
  1. WPCrawler

    0下载:
  2. 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需
  3. 所属分类:搜索引擎

    • 发布日期:2024-05-23
    • 文件大小:1863680
    • 提供者:Francis
  1. ddh_v1.0

    0下载:
  2. DDH垂直搜索引擎商业版,是目前互联网中唯一可以商业运作的垂直搜索引擎系统,由JAVA语言开发,可以运行在大规模集群中的网络信息整合系统。DDH整合Nutch(开源搜索引擎系统),UCI(网页信息抽取系统)和SOLR(企业级搜索应用服务器)。无论从可扩展性,系统的性能方面还是稳定性方面,DDH垂直搜索引擎系统,都可以算的上顶级垂直搜索引擎系统之一。-DDH vertical search engine business edition,
  3. 所属分类:WEB源码

    • 发布日期:2024-05-23
    • 文件大小:5697536
    • 提供者:zzpudn27
  1. Lucene+nutch搜索引擎开发

    0下载:
  2. lucene search code develop search engine
  3. 所属分类:JSP源码/Java

    • 发布日期:2024-05-23
    • 文件大小:87265280
    • 提供者:Aire
« 1 2 3 4»

源码中国 www.ymcn.org