搜索资源列表
matlab_ex1
- 对数据进行预处理的程序,希望用本程序把这些到期收益率(标准期限)数据拿出来组成一个数据集以备分析之用。-Data pretreatment procedures, hope to use this procedure to these yield to maturity (standard period) data show the formation of a data set for analysis.
data_mining
- 一本关于数据挖掘方面的基础书籍《数据挖掘:概念与技术》,韩家炜著。本书是一个导论,介绍什么是数据挖掘,什么是数据库中知识发现。书中的材料从数据角度提供,特别强调发现藏在大型数据集中有趣数据模式的数据挖掘基本概念和技术。-1 on the basis of data mining aspects of the book
general
- ID3决策树程序,内含训练和测试数据。 输入为选择原训练数据集和测试数据集的百分数,如0.25。根据实验要求,测试数据都选全部,故都输入1。 输出结果为实验要求的实验数据结果。-ID3 decision tree procedures, including training and test data. Input for the selection of the original training data set and te
Clustering
- 数据挖掘算法的实现,基于模糊聚类的最大树算法,数据集是darpa99,也就是KDD-CUP99中采用的数据集-The realization of data mining algorithms, based on fuzzy clustering of the largest tree algorithm, a data set is darpa99, which is used in KDD-CUP99 data set
IBM_data_gen
- IBM实验室提供的数据集生成器源码,可以数据挖掘中经常使用的关联规则数据集。-IBM laboratory data sets provided by the generator source, Data mining can be used in the association rules data sets
JTS
- JTS拓扑结构程序组是一个通过使用明确的精度模型和健壮的几何算法来执行空间数据操作的Java应用编程孔。JTS是用来对可以支持空间数据集的确认、处理、综合及质疑的应用程序进行改善。这篇文献就是对在JTS拓扑程序组中执行的类、方法与算法进行说明-JTS Topology program group is defined through the use of a precision model and robust geometric al
DM4
- 执行流程: 1. 用户输入参数:K的选择,训练数据,测试数据的路径; 2. 读取训练数据集和测试数据集文件,用ArffFileReader类读取并组织起InstanceSet数据结构; 3. 利用上面的相似度量标准,对每一个测试集中的Instance,计算与其最相似的K个训练集中的Instance,通过投票进行分类,将分类结果存储经Instance的成员变量targetGuess中; 4. 对分类结果进行度量,包括分类正
shujucangku
- 基于一家销售公司的数据仓库,建立4个多维数据集,包括钻取,切片等操作-Based on a sale of the company' s data warehouse, the establishment of four multi-dimensional data sets, including coring, slicing and other operations
ibm
- 生成测试集,要做数据挖掘的关联规则试验,少不了数据集,人工生成的数据集可以采用agrawal等人实现的一个数据集生成器,叫:IBM Quest Market-Basket Synthetic Data Generator-生成测试集
cloudPlot
- 一种用于生成二维数据分布图形的函数,在观察大数据量的数据集合是很有效.-A function to plot the distribution of 2-dimensional data
comparison
- 本文有对大数据集的数据挖掘技术比较结果,帮助大家选择合适的方法-This article has pairs of large data sets compare the results of data mining technology to help you choose the right method of
dbscan
- DBSCAN算法,利用数据集中密度差异来区分不同聚类。-DBSCAN algorithm, the density difference between the use of data sets to distinguish between different cluster.
CAIM
- 粗糙集理论中连续属性离散化操作算法,matlab上运行,有数据集-Rough Set Theory discretization operation algorithm
os-weka1-Examples
- 在weka环境下进行数据挖掘数据,一个数据集实例-Environment in the weka data mining data, a set of instance data
粗糙集全部算法
- 实现了粗糙集的全部算法,包括上下近似、属性约简、规则产生等,可以和数据库直接连接,里面包括了测试数据。
数据挖掘
- 对于初学者学习weka这个数据处理的软件有用,arrf数据集(For beginners to learn Weka, this data processing software useful, arrf data set)
Data set for data mining
- 该文档为自用数据挖掘数据集,数据量相对较小,用于数据挖掘初学者使用(thank you for download)
apriori
- 数据挖掘Aprior的简易c++实现,通过string来表示数据集,没有采用STL set集合操作,因此实现起来简单一些,判断是否包含用到了动态规划算法中的最长公共子序列,思想是暴力求解,没有用到很高端的思想和算法。(Simple c++ data mining Aprior, said data set by the string, without the use of STL set collection operation, th
主成分分析PCA
- 用PCA算法对iris数据集进行主成分分析(The PCA algorithm is used to analyze the iris data set)
titaniccsv
- 数据挖掘训练集 泰坦尼克 kaggle 训练集 超级好用(train datasettrain he world had witnessed a titanic struggle between two visions of the future)