搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3
countTexture
- 统计图像子区域的相似度,但图像像素信息要先存到一个文本文件中。
072832
- 本文介绍了在向量空间模型下, 使用一和一两种不同的相似度评测方法, 来评测查询与文本之间的相关性。
simalar
- 基于Python的单词相似度分析,通过分析一些大文本来判断测试文件中给出的单词相似度判断的准确率-Python-based word similarity analysis, by analyzing a number of large text files to determine the test given to determine the accuracy of word similarity
knn
- 文本分类,用KNN方法,通过计算其相似度,找出与它靠近的K个文档。-text classify
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
pLSA_EM
- PLSA EM演算法,用於文本與字詞之間的矩陣工具,測量其相似度-PLSA EM algorithm for the matrix between the text and words tool to measure the similarity
Text-Retrieval
- 信息检索系统从最初的纯手工检索系统业已发展到现在的以信息技术为支撑的检索系统,在这一过程中,适应新的信息资源、信息技术这些检索环境,提高信息检索系统的查全率、查准率和系统响应时间是不变的主题,在众多文本中掌握最有效的信息始终是信息处理的一大目标。围绕向量空间模型设计了一个文本检索系统,介绍向量空间模型的基础上给出了基于它的信息检索系统的一般结构框架和各部分的功能,探讨了系统中所涉及到的关键技术。用向量空间模型进行特征表达,用TF-IDF
Text-Similarity-0.08.tar
- 计算两段文本之间相似度的java工具,需结合该共享工具的源网络地址查看-the tools to compute the similarity of texts
CBR-filtering-algorithm
- 智能信息推荐系统能够通过用户偏好,利用信息过滤算法主动剔除无关信息。该文提出了一个基于案例推 理的职能信息推荐系统的架构,主要包含数据层、过滤层和结果展示层3个功能层次。设计了一个基于案例推理的 过滤算法,将用户对文本的评价定义为案例 采用归一化的Euclidean距离,计算用户之间的相似度。在一个公共数 据集上进行了不同过滤算法的recall值对比实验。结果表明,采用案例推理技术,对协同过滤的准确度有一定程度 的改善。
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
WIP3
- Kaggle竞赛“Can your AI smarter than a 8th grade student?”的代码。 使用文本相似度计算的方法,对美国八年级学生的科学考试卷(4选1选择题)进行自动回答。-Kaggle contest Can your AI smarter than a 8th grade student? Code. The method of using text similarity calculat
DocDistance
- java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。-Java text similarity system, using the vector space model and the cosine similarity distance formula, the measured results can be achieved two similarity of tex
xsd
- 易语言快速计算文本相似度源码例程程序演示了文本相似度的对比计算方法。 -Easy language to quickly calculate the similarity of the text source routine procedures to demonstrate the text similarity calculation method.
English
- 包括了原始英文文档、删除特殊符号、分词、词干化、计算相似度等文本预处理后产生的文档,总的数量是500个英文文档(Including the original English document, delete special symbols, such as text segmentation, a preprocessed documents produced, the total number of 500 English docum
Chinese
- 是做文本预处理时候利用爬虫收集的500个中文文档,包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and t
EnglishChuLi
- 利用python编写的文本预处理的程序,包含了每一步的实现代码,分为删除标点符号、删除停用词、相似度计算、PCA降维、聚类以及可视化等,运行环境为pytharm,python3开发环境(The text preprocessing program written by Python contains every step of implementation code, which is divided into delete punct
文本相似度计算方法研究综述.pdf
- Text similarity; semantic similarity; ontology; word bag model; neural network ; thesis review
analyze
- 实现比较文本的差异,和得到两个文本的最大相似度(Implementing the comparison text and getting the maximum similarity)