作为强大的数据挖掘软件,SmartMining敏捷挖掘产品桌面版,能够通过桌面安装使用,使得人人都能轻松体验数据挖掘。
想了解SmartMining操作界面,我还会更新的
根据算法功能将算法分为以下几个部分:
- 数据源模块
用来读取不同文件格式的数据。提供了各种数据源的读取接口,通过简单的配置连接更多数据库、数据文本文件。
- 数据准备模块
通过数据准备模块实现对数据的清洗整理工作。
此模块包含丰富数据处理节点(算法)。根据处理对象的不同分为对行的处理和对列的处理(过滤、合并、派生分箱等)。
支持通过JAVA编程的方式自定义算法,技术人员可以通过JAVA自定义节点实现自定义算法。(自定义算法的使用可以参考软件自带的自定义算法案例流。)
- 可视化探索模块
包含丰富美观的图形组件,通过可视化的方式探索数据特征(例如地图,网络图,多种交互视图等数据可视化探索节点)
- 统计分析模块
统计分析模块是统计分析专用的节点。(包括假设检验、方差分析,计算特征统计量的统计节点,以及基于他方检验的交叉表)
- 机器学习模块
机器学习模块是最核心的算法,基于不同的算法类型将模型分类:
分类预测,用来进行已知一定影响因素的情况下对目标字段进行预测的场景。包括字符型目标和数值型目标字段进行预测的算法。
聚类分析,用来解决类似于对产品进行分类,对客户进行分群的问题,这些节点可以将相似的研究对象聚集在一起。
时间序列,针对目标字段是数值型,且带时间维度的场景需要使用时间序列的算法。
关联规则,一个常见的应用场景就是购物篮分析,分析消费者购物时哪些产品会被同时购买的可能性比较大。
特征选择,是用来筛选输入的算法,通过定义的规则,比如缺失等来筛选字段。
降维分析,用来减少数据的维度,也就是用少数的几个字段包含很多个字段的信息。
模型评估,用于评估模型的稳定性和准确性。
- 文本挖掘模块
用来分析非结构化的数据。(词云就是通过文本挖掘模块实现的)
- 社交网络模块
用来分析社交类的数据,意见领袖的挖掘等等。
- SmartR模块
可以实现基于SmartMining桌面版实现R语言功能的体验,让R的算法更易实现,满足用户丰富的需求
- 数据导出模块
用于导出数据,方便后续应用
SmartMining桌面版具体包含了哪些算法,还需要体验才知道
(试不试随你
,资源给你了http://pan.baidu.com/s/1slAOgMx password:pyi2)
偷偷的告诉你,SmartMining的服务器版和云版的功能更加强大(从计算能力、数据管理、权限管理、定时任务等方面)