海平线软件 / 下载安全软件,信赖海平线
海平线软件

您的位置: 首页 > 电脑软件 > 编程开发 > 数据库类 > weka软件(数据挖掘)下载v3.8.0 官方最新版

weka是一款功能强大的数据挖掘软件,这款软件具有、分类、回归、聚类、关联分析、数据预处理、评估等特色功能,是数据挖掘分析的必备工具,需要的朋友欢迎来绿色资源网免费下载使用。

weka官方介绍

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的the University of Waikato。

weka下载

weka软件功能介绍

原理与实现

聚类分析中的“类”(cluster)和前面分类的“类”(class)是不同的,对cluster更加准确的翻译应该是“簇”。聚类的任务是把 所有的实例分配到若干的簇,使得同一个簇的实例聚集在一个簇中心的周围,它们之间距离的比较近;而不同簇实例之间的距离比较远。对于由数值型属性刻画的实 例来说,这个距离通常指欧氏距离。

模型应用

现在我们要用生成的模型对那些待预测的数据集进行预测了。注意待预测数据集和训练用数据集各个属性的设置必须是一致的。即使你没有待预测数据集的Class属性的值,你也要添加这个属性,可以将该属性在各实例上的值均设成缺失值。

在“Test Opion”中选择“Supplied test set”,并且“Set”成你要应用模型的数据集,这里是“bank-new.arff”文件。

现在,右键点击“Result list”中刚产生的那一项,选择“Re-evaluate model on current test set”。右边显示结果的区域中会增加一些内容,告诉你该模型应用在这个数据集上表现将如何。如果你的Class属性都是些缺失值,那这些内容是无意义 的,我们关注的是模型在新数据集上的预测值。

现在点击右键菜单中的“Visualize classifier errors”,将弹出一个新窗口显示一些有关预测误差的散点图。点击这个新窗口中的“Save”按钮,保存一个Arff文件。打开这个文件可以看到在倒 数第二个位置多了一个属性(predictedpep),这个属性上的值就是模型对每个实例的预测值。

建模结果

OK,选上“Cross-validation”并在“Folds”框填上“10”。点“Start”按钮开始让算法生成决策树模型。很快,用文 本表示的一棵决策树,以及对这个决策树的误差分析等等结果出现在右边的“Classifier output”中。同时左下的“Results list”出现了一个项目显示刚才的时间和算法名称。如果换一个模型或者换个参数,重新“Start”一次,则“Results list”又会多出一项。

weka关联规则又称购物栏分析

目前,WEKA的关联规则分析功能仅能用来作示范,不适合用来挖掘大型数据集。

我们打算对前面的“bank-data”数据作关联规则的分析。用“Explorer”打开“bank-data-final.arff”后,切 换到“Associate”选项卡。默认关联规则分析是用Apriori算法,我们就用这个算法,但是点“Choose”右边的文本框修改默认的参数,弹 出的窗口中点“More”可以看到各参数的说明。

背景知识

首先我们来温习一下Apriori的有关知识。对于一条关联规则L-R,我们常用支持度(Support)和置信度(Confidence)来衡量它的重要性。规则的支持度是用来估计在一个购物栏中同时观察到L和R的概率P(L,R),而规则的置信度是估计购物栏中出现了L时也出会现R的条件概率P(R|L)。关联规则的目标一般是产生支持度和置信度都较高的规则。

有几个类似的度量代替置信度来衡量规则的关联程度,它们分别是

Lift: P(L,R)/(P(L)P(R))

Lift=1时表示L和R独立。这个数越大,越表明L和R存在在一个购物栏中不是偶然现象。

Leverage:P(L,R)-P(L)P(R)

它和Lift的含义差不多。Leverage=0时L和R独立,Leverage越大L和R的关系越密切。

Conviction(更不知道译了):P(L)P(!R)/P(L,!R) (!R表示R没有发生)

Conviction也是用来衡量L和R的独立性。从它和lift的关系(对R取反,代入Lift公式后求倒数)可以看出,我们也希望这个值越大越好。

值得注意的是,用Lift和Leverage作标准时,L和R是对称的,Confidence和Conviction则不然。

参数设置

现在我们计划挖掘出支持度在10%到100%之间,并且lift值超过1.5且lift值排在前100位的那些关联规则。我们把 “lowerBoundMinSupport”和“upperBoundMinSupport”分别设为0.1和1,“metricType”设为 lift,“minMetric”设为1.5,“numRules”设为100。其他选项保持默认即可。“OK” 之后在“Explorer”中点击“Start”开始运行算法,在右边窗口显示数据集摘要和挖掘结果。

下面是挖掘出来的lift排前5的规则。

Best rules found:

1. age=52_max save_act=YES current_act=YES 113 == income=43759_max 61 conf:(0.54) lift:(4.05) lev:(0.08) [45] conv:(1.85)

2. income=43759_max 80 == age=52_max save_act=YES current_act=YES 61 conf:(0.76) lift:(4.05) lev:(0.08) [45] conv:(3.25)

3. income=43759_max current_act=YES 63 == age=52_max save_act=YES 61 conf:(0.97) lift:(3.85) lev:(0.08) [45] conv:(15.72)

4. age=52_max save_act=YES 151 == income=43759_max current_act=YES 61 conf:(0.4) lift:(3.85) lev:(0.08) [45] conv:(1.49)

5. age=52_max save_act=YES 151 == income=43759_max 76 conf:(0.5) lift:(3.77) lev:(0.09) [55] conv:(1.72)

对于挖掘出的每条规则,WEKA列出了它们关联程度的四项指标。

命令行方式

我们也可以利用命令行来完成挖掘任务,在“Simlpe CLI”模块中输入如下格式的命令:

java weka.associations.Apriori options -t directory-path"bank-data-final.arff

即可完成Apriori算法。注意,“-t”参数后的文件路径中不能含有空格。

在前面我们使用的option为

-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 命令行中使用这些参数得到的结果和前面利用GUI得到的一样。

我们还可以加上“- I”参数,得到不同项数的频繁项集。我用的命令如下:

java weka.associations.Apriori -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -t d:"weka"bank-data-final.arff

挖掘结果在上方显示,应是这个文件 的样子。

标签: weka软件(数据挖掘) 数据挖掘 weka

人气软件

更多>单机游戏合集

在这里,您可以随时脱离网络依赖,畅享完整剧情与高自由度玩法——从3A大作到小众神作,随时开启一段专属于您的沉浸式游戏旅程。 查看 >>

weka软件(数据挖掘)下载v3.8.0 官方最新版

下载地址在右侧
相关文章
] OraSQL下载v4.0.3 英文绿色免费版 Navicat Premium 12中文正式版下载32/64位 v12.1.22 已激活版 智创MS ACCESS MDB数据库批量压缩修复优化助手下载v3.0 中文绿色版 sql server 2005 64位下载win7 精简标准版 for32&64位 MS SQL SERVER日志收缩工具下载v2.0 绿色版 mysql for visual studio 2017版下载v1.2.7 官方最新版 mysql client for linux下载v5.7 官方版 sa口令清除工具下载v1.0 绿色官方版-绿色资源网 SQL Server 2008 SP3下载V10.00.550 简体中文版(32/64位) mysql odbc驱动64位下载32位 v5.3.6 官方安装版 A从ccess 2003 sp3下载中文绿色版_从office2003中提取 Oracle数据库客户端工具(Oracle SQL Handler)下载v5.2 官方版 MyCon Professional(数据库管理)下载v2005.3.6 最新版 Batch Access Database Compactor(Access数据库修复工具)下载v13.11.26 免费版 Microsoft Office access 2003 简体中文绿色版下载Access数据库管理工具 Longtion Application Builder中文版下载v5.21.0.720 织梦环境配置工具(DedeAMPZForDebug)下载官方安装版-绿色资源网 keeptool(Oracle数据库工具包)下载v12 最新注册版 OraBone(数据库管理软件)下载v8.5.0 绿色版 exui支持库2017(exui.fne)下载v8.30 最新免费版 microsoft sql server 2005 express下载官方中文正式版 DtSQL通用数据库管理工具下载v6.2.1 绿色版 tableplus免费版下载v4.2.1.174 官方版 SQLWays最新版(数据库转换)下载v6.0.1 官方版 access2000下载绿色版 mysql server 5.1 64位下载v5.1.73 官方免费版 mysql administrator tools下载v5.2.40 官方最新版 Navicat for PostgreSQL中文版下载v11.0.6 最新版 rational rose 2003完整汉化版下载win7版 sql server自动联想表名字段名工具下载for 2000/2005/2008 免费版-绿色资源网 sql server企业管理器下载v16.5 绿色版 visual foxpro 6.0简体中文版下载v6.0 官方最新版 Access密码修改器下载v1.0 单文件免费版 Convert Oracle to Mysql下载v4.0.0 中文绿色版 PW Access(ACCESS97/2000数据库密码恢复工具)下载v1.01 单文件绿色版 SQL2000 Perssonal Edition(xp)下载中文个人版 oracle数据库免安装版下载中文版 便携式数据库浏览器(Database Browser)下载v5.3.1.0 免费英文版 microsoft sql server 2000个人免安装版下载v6.5.0.4 简体中文版 万用图表下载v9.07 官方安装版-绿色资源网 Microsoft Visual Foxpro(vfp)下载v9.0 官方专业版_附汉化补丁 微软access2007数据库引擎 apache cassandra(分布式数据库)最新版下载v3.11.7 官方版 sql语句在线生成器下载v2.0 绿色免费版 sql server2016企业版下载32/64位 SQLite(数据库管理工具)下载v3.7.4 绿色中文版 用友MSDE管理小工具下载v1.0 中文版 plsql developer 10.0.3下载v10.0.3.1701 64位中文版 Front(MYSQL导入导出工具)下载v5.3.2.42 官方安装版 Access to Sql 脚本编写器下载v1.05 中文绿色版
回顶部 去下载

关于本站|下载帮助|下载声明|软件发布|联系我们

Copyright © 2026 www.hpxrj.com.All rights reserved.

备案号琼ICP备2026002670号-1

11111