搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3
KMEANS聚类
- knn分类模式识别可用于文本挖掘和其他的识别分类,vc代码,-Commission pattern recognition can be used for classification of text mining and other identification classification, vc code,
Incremental_Document_Clustering
- 一个增量文本聚类的算法。 参考文献: Wai-chiu Wong, Ada Wai-chee Fu, Incremental Document Clustering for Web Page Classification. -an incremental version of the clustering algorithm. References : Wai-chiu Wong, Ada Wai-CHEE Fu, Increm
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
dsa
- 基于SOM算法实现的文本聚类,有详细的剖析与例证,希望大家喜欢
wawatextcluster
- 蛙蛙的中文文本聚类,主要采用k-means算法。wawa s text cluster using C#.
tct-070227
- 类似于Weka的文本聚类工具箱,可以读取Weka格式的文件,并实现了常用的文本聚类算法以及聚类集成算法,对于机器学习的朋友来说是个好东西
featureselectionbasedongeneticalgorithm
- 利用遗传算法进行文本聚类的特征选择.把一种特征组合看作一个染色体,对其进行二进制编码,引入文本集密度作为适应度函数进行特征个体适应度的评价.
K均值算法
- 实现K均值算法,读取文件,实现K均值的分类。-K-means algorithm to achieve, reading the paper, K-mean achievement category.
ADOConnection
- 封装了常见的ADO连接字符串,通过调用函数,可以连接到Access\SQLServer\Oracle等数据库-Packaging, a common ADO connection string, by calling the function, Access can connect to the \ SQLServer \ Oracle database
2007Z
- 语义平滑文件模式聚类,代表了文本挖掘的前沿技术,和热门方向(英语原版)-semantic document clustering model, the representative of the Text Mining of advanced technology, and popular direction (English original)
K-Means
- K均值算法--- --- --- --VC代码编写-K 戮 霉脰渭脣茫 篓------ VC
HLSSplit.RAR
- 关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤
SurveyTextMining
- 这是一本关于文本挖掘的书籍,包括聚类 分类 信息提取的内容-This is a book on text mining, including clustering classification of the content of information extraction
AIyouxi
- 一个有VC++语言编写的神经网络游戏,其中包含了遗传算法,人工智能等游戏选项。-A VC++ Languages neural network games, which includes genetic algorithms, artificial intelligence, such as game options.
PLSA
- PLSA 的Java实现,可以用于图像处理,文本分类,文本聚类等-code of PLSA in JAVA
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点*专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文
dbscan的matlab代码实现
- 使用MATLAB对文档进行聚类,尤其在数据挖掘中使用,一般用于文本特征表示之后(Clustering documents using MATLAB)
finallyliuyuClassifier
- 用于文本分类,文本挖掘,文本特征提取,文本聚类,文本关联等(It is used for text classification, text mining, text feature extraction, text clustering, text association, etc.)
chinese_text_cluster-master
- 基于中文文本的机器学习聚类算法的实现,包括LDA算法等(Chinese Text Clustering)