搜索资源列表
malletTest
- mallet测试代码, 非常优秀的自然语言处理工具包,基于Java编写,可以进行文本分类,聚类等功能,并且支持加入自定义的算法,其中有众多的API接口,有着很好的研究和实用价值。-mallet test code, very good natural language processing toolkit based on Java, you can text classification, clustering and other f
MyTextCluster
- 实现k-means算法的文本分类,用java代码实现的,希望对大家能有帮组-k-means cluster
knn
- 简单的 knn 文本算法 ,用于中文文本分类,比较方便的方法!-Simple text knn algorithm for Chinese text classification, more convenient way!
class
- 中文文本分类可以对已经分好词的文本进行分类,先自己导入数据,用libsvm中的svm进行分类和预测,特征用tfidf算法,还利用卡方检验进行了特征选择,可自行设定阈值-text mining
616341
- 中文文本语料库 适合中文文本分类使用 朴素贝叶斯算法整合 -Chinese text categorization corpus
PMl-IR
- Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了—种基于PMI—IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本 中的情感要素和背景情感词之问的点互信息值,从而对文本进行情感分类。该方法在国家语言资源监测与研究中心网络媒体语言分中-心2008年度的Blog语料和COAE2008的语料上分别进行了测试。与传统方法相比准确率和召回率都有了较大的提高。
An-Introduction-to-SVM
- 支持向量机(SVM)是在统计学习理论的基础上发展起来的新一代学习算法,该算法在文本分类、手写识别、图像分类、生物信息学等领域中获得了较好的应用。本书是SVM的权威参考书。-Support Vector Machine (SVM) is a new learning algorithm developed on the basis of statistical learning theory, the algorithm to obtai
maxent-master
- 最大熵模型算法,用于统计学习,文本分类,文本聚类研究-The maximum entropy model algorithm for statistical learning, text classification, text clustering research
lle
- lle局部线性嵌入算法,对数据做降维处理,数学建模,文本分类方面有比较好的效果-Lle locally linear embedding algorithm, the dimension data, mathematical modeling, text classification has a good effect
Naive_Bayesian_classify_version
- 朴素贝耶稣算法进行文本分类,删除“无用词”,对训练集训练之后完成对测试集的测试,并输出测试集文档属于哪个分类-Tony simple algorithm for text classification Jesus, delete " without words" , after training set for the completion of the test set of tests and test sets t
textClassifier
- 新闻文本分类器,采用naive Bayes算法。先对训练集处理得到词库,再通过测试集检验,核算分类器的正确率。-News texts classification, the use of naive Bayes algorithm. First treatment of the training set to get the thesaurus, then tested by the test set and accounting th
Bias_algorithm_java
- 贝叶斯算法java实现,在贝叶斯算法思想基础上做改进,提供文本分类效率-Bias algorithm java implementation, based on the idea of Bias algorithm to improve the efficiency of text classification
bayes100
- 贝叶斯分类算法源代码,用于对文本文件进行分类-Bayesian classification algorithm source code, used to classify a text file
knntextclassify
- knn算法实现的文本分类器,有界面,使用VS2010编写,能实现分类功能。-KNN algorithm to achieve the text classifier, the interface, the use of VS2010 to prepare, to achieve the classification function
test1
- 朴素贝叶斯分类算法,用于进行文本分类,自带训练集-Naive Bias classification algorithm with training set
tfidf
- TFIDF algorithm to achieve, through the input data sets and keywords to get each keyword corresponding weights to achieve text classification TFIDF算法的实现,通过输入数据集和关键词来获取每个关键词对应的权重,实现文本分类-TFIDF algorithm to achieve, th
cnn-text-classification-tf-master
- 深度学习实现算法,卷积网络,文本分类,python代码实现-deep learning alg,cnn,text classification,very very useful
CLASSIFICATION-with-newsgroup
- 多文本分类,KNN和朴素贝叶斯算法,英文文本,-Text categorization, KNN and naive bayes algorithm, the English text,
fenciledebeiyesi
- 中文文本分词系统+基于贝叶斯算法的文本分类源码,用matlab实现。-Chinese word segmentation system+ based on Bayes text classification source code, using matlab implementation.
MAERJIANCE
- 场景图像中文本占据的范围一般都较小,图像中存在着大范围的非文本区域。因此,场景图像文本定位作为一个独立步骤越来越受到重视。这包括从最先的CD和杂志封面文本定位到智能交通系统中的车牌定位、视频中的字幕提取,再到限制条件少,复杂背景下的场景文本定位。与此同时文本定位算法的鲁棒性越来越高,适用的范围也越来越广泛。文本定位的方式一般可以分为三种,基于连通域的、基于学习的和两者结合的方式。基于连通域的流程一般是首先提取候选文本区域,然后采用先验