全部版块 我的主页
论坛 数据科学与人工智能 人工智能
4760 2
2017-02-09

人人可用的数据分析认知计算产品

           IBM Watson Analytics 试用体验一


IBM Watson Analytics  

专业的数据可视化分析工具。基于云平台的智慧的、自动化的数据发现服务和自动预测性分析功能,帮助用户轻松理解数据中的奥秘,并自动创建仪表板和信息图。

论坛2.jpg


IBM Watson Analytics 能解决什么问题

Watson Analytics 数据可视化分析软件官方介绍 —— 可为您提供高级分析的诸多优势,但同时不增加复杂性。这种云端智慧数据发现服务可以引导数据探索,自动化实现预测分析,并支持轻松的仪表盘和信息图表创建。您可以迅速获得答案和新的洞察,在几分钟内迅速作出自信的决策 - 所有这一切全部由您自己完成,无需专业统计分析背景。

从这些描述中总结出来三个简单的特点:人人可用的数据可视化分析、云平台、自动化预测分析和数据洞察。


IBM Watson Analytics 的注册

试用 IBM Watson Analytics 需要注册一个 IBM ID 账号,根据一些提示填写一些基本的信息。


论坛4.webp.jpg


注册成功后,会收到相应的邮件验证和 IBMid。

通过邮件验证并再次登录到 IBM Watson Analytics 页面。


在主页面中有三个版块:

·        Data 数据版块:用来上传和准备数据。

·        Discover 发现版块:数据洞察与分析,通过后续的试用,我发现期中有几个亮点很值得注意。

·        Display 展现版块:数据发现结果呈现与分享。


IBM Watson Analytics 数据准备

论坛5.webp.jpg

点击 New Data 可以发现 IBM Watson Analytics 预置了很多第三方应用和服务、IBM Cognos 、社交相关的数据接口(国外的为主),例如共享云存储 Dropbox、在线活动服务平台 Eventbrite、数字营销产品 Hubspot、很多外企都在用的笔试与问卷调查类SurveyMonkey、Twitter 社交数据。


luntan 6.webp.jpg

先简单使用 Local File 上传数据,实验数据来自 IBM Sample Data 一个有关人力资源培训相关的数据。上传成功后在这个页面可以看到文件,可以重命名。


luntan 7.webp.jpg


60% Quality 说明数据的质量在 60% 左右,这是因为 Watson Analytics 在上传这个数据的时候对数据做了一些内部的转换和分析。通过分析之后对数据给出评分,数据质量越好高评分就越高。如果分数很低,远远低于 60%,那么就意味着这个数据质量可能存在很大的问题,这种数据也不适合做进一步的分析。


在微软 BI 的 ETL 工具 SSIS 中也有一款类似的组件叫 SQLProfiling Task 也能够用来检查数据的质量。但目前有关数据准备的做法,这种趋势会更加明显 —— 数据在上传和加载的过程中就把数据质量的评估给反馈出来。


导致数据质量低的原因有的可能是空格、有的可能是空值、出现了与整列其它数据不匹配的数据类型的值等等,这个时候可以点击 Refine 对数据重新做出调整和优化。

luntan 8.webp.jpg


Refine 页面下可以看到不同列的数据质量情况,包括缺失值、甚至可以看到数据之间的层次关系等等。也可以在 Refine 页面创建计算列、数据组(比如 Age 1-12 岁定义为少年等 )、增加层级关系等。


Refine 的作用就类似于一个数据质量检查工具和一个轻量的 ETL 数据准备和清洗工具。

luntan 9.webp.jpg


数据准备阶段的几点总结和思考

1. 这款产品的面向的用户群体可以是无需专业统计分析背景的业务人员,因此在数据准备环节对源数据的要求还是存在的。数据尽量通过 IT 部门做过专业的清洗和规范,这样会更大程度的节省业务人员在数据准备上的时间和精力。

2. 在保证大部分数据规范和质量的前提下,业务人员可以根据自己的理解对数据做一些初步加工。这一点在以后的数据分析工具发展上是一个趋势,让业务人员自己可以处理一些基本的数据清洗,而不用事事都需要 IT 的支持。

3.  IBM Watson Analytics 数据上传即反馈数据质量评估,数据质量评估得分低则表明该数据不适合在接下来的分析场景中使用。因此,这就尽最大可能的避免了因低质量的数据而造成了分析结果不准确的情况。

4. 在数据准备的沟通和环节上,IT 部门和业务部门可以有效的进行职责划分。IT 部门对数据质量结果负责,业务部分对分析结果负责。IT 部门数据提供的质量低,则返回重做、重新准备,直到达到双方共识的一个标准比如 80% 或者 90%,达到这个标准后业务部门再进行后续的数据分析和探索工作。


IBM Watson Analytics 的数据质量评估为我们提供了一个很好的关于数据质量的参考,我们可以利用好这个特点对团队的协作过程进行有效的考核和流程把控。


如果感兴趣!或者觉得自己要提升!或者想跟我们一起探讨一些问题,扫描下方二维码加好友,发送wa进群,寻找和你一样志同道合的小伙伴!

想了解更多IBM WatsonAnalytics,请点击阅读原文获取平台试用链接。

阅读原文链接: http://t.cn/RMFW8pD


本文由天善智能原创,原文链接:https://ask.hellobi.com/blog/lvpin/6065


Club4.jpg


[FSS] CDA 585x73.jpg

CDA banner_585x73.jpg
附件列表
论坛1.jpg

原图尺寸 18.83 KB

论坛1.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-2-10 10:43:48
你好,本文由天善智能原创,原文链接:https://ask.hellobi.com/blog/lvpin/6065,请及时标明出处,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-11-2 19:00:51
点个赞加点人气
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群