搜索资源列表
TextCategorization
- 基于朴素贝叶斯算法实现的中文文本分类程序。可以对中文文本进行分类识别,使用时先对分类器进行训练,然后进行识别。该Beta版本仅支持对3类文本进行分类,使用简单的中文分词方法,本程序尚不具备实用性,用于算法研究和改进。-based on Bayesian algorithms to achieve the Chinese text classification procedure. Can the Chinese text classif
windtree
- 决策树算法 用于文本分类实现 使用C语言开发-Decision Tree Algorithm to achieve for text classification C-language development
wenbendefenlei11
- 有关文本分类的摘要,包括了各种分类的算法,是进行分类的有力文章-the text of a summary, including the classification of various algorithms for classification is a powerful article
SVMcode
- 这是一个采用c++编写的用于机器学习文本分类的SVM算法的实现代码。-c prepared using machine learning for text classification of SVM codes.
KNN0
- knn算法的源代码,用来实现文本分类,是目前应用最广的算法-knn algorithm source code, which can be used for text classification, is the most widely Algorithm
code1
- 文本分类中的降维技术的PCA核心算法,比较复杂,请仔细看
knn
- 朴素贝叶斯(Naive Bayes, NB)算法是机器学习领域中常用的一种基于概率的分类算法,非常简单有效。k近邻法(k-Nearest Neighbor, kNN)[30,31]又称为基于实例(Example-based, Instance-bases)的算法,其基本思想相当直观:Rocchio法来源于信息检索系统,后来最早由Hull在1994年应用于分类[74],从那以后,Rocchio方法就在文本分类中广泛应用起来。
@polynomial
- VC维理论和结构风险最小化准则是统计学习理论中的重要内容,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视,并被研究用于文本分类问题.基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响,并且能够处理很高维的分类问题,用于文本分类无需进行特征选择.研究发现,随着多项式核阶数的升高,SVM文本分类器会出现过学习现象,并且特征数越多越明显,特征选择是必需的.通过估计函数集的VC维,基于结构风险最小化理论对此问题进行分析,得
KNN
- k阶临近算法 可以用于文本分类和加密的应用
winnow
- winnow文本分类算法 ,有全部测试集合-winnow text classification algorithm, all the test set
随机森林文本分类
- 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 "
pyspark_process
- 使用pyspark进行文本分类算法实现,其中使用了tf-idf表示-Use pyspark text classification algorithm, which uses the tf-idf representation
DataStructTest
- 使用k-means + tf-idf 实现简易的文本分类算法,可直接运行- U4F7F u7528k-means+ tf-idf u5B9 u7B0 u7B80 u6613 u7684 u6587 u672C u5206 u7C7B u7B97 u6CD5, u53EF u76F4 u63A5 u8FD0 u884C
文本深度挖掘
- 用于分析文档,分析情感指数,正负面情绪,及新闻分类(Used to analyze documents, analyze sentiment, positive and negative emotions, and classify news)
BNUPCU
- 文本分类器 文本分类算法 详细介绍了算法过程()
lrogress
- 一种文本分类数据挖掘的技术,比较几种不同的文本分类方法,重点介绍熵,()
rarsb
- 有关文本分类的摘要,包括了各种分类的算法,是进行分类的有力文章()
knn
- KNN文本分类算法(k nearest neighhor)使用knn实现样本分类(KNN(k nearest neighhor)classification)
cnn-text-classfication
- 通过机器学习中的卷积神经网络实现对文本进行分类的算法。(The text is classified by the convolution neural network.)
lstm-text-classfication
- 通过机器学习中的长短时记忆单元实现对文本进行分类的算法。(The long short term memory unit realizes the algorithm of classifying text by machine learning.)