人人可用的数据分析认知计算产品
IBM Watson Analytics 试用体验二
上一贴给大家更新了第一部分的体验,这一贴继续。
人人可用的数据分析认知计算产品IBM Watson Analytics 试用体验一
https://bbs.pinggu.org/thread-5192743-1-1.html
IBM Watson Analytics 数据分析与探索在正式的数据探索和分析之前,先来简单的了解一下要分析的数据(只展示了部分数据)。
很显然,在这份数据中可以分析的是有关培训课程的消费或支出成本等问题。先简单的理解和观察一下这些数据,这对后面理解 IBM WatsonAnalytics 是如何设计这种自动化化数据分析和自然语言探索很有帮助。
点击文件的标题 -WA_HR_Training-2013-16-1,我们对数据的分析就已经开始了,并且这是一种全新的体验。在以前我们是要向自己提问,通过工具来帮助实现。而现在 Watson Anlytics 向你提问或是你也可以向它提问,而提问之后的分析都会自动实现。
在 Discovery 分析和探索页面,Watson “猜”出了你可能想要分析的问题。例如:
1. What is the trend of Course cost overYear by Department? 不同部门每年培训课程成本的趋势如何?
2. What drives Position Count ? 什么因素驱动了/影响了职位数量?
3. How are the values of Course days andExpense total associated ? 课程天数和费用总额之间有什么样的关系 ?
而每一项“猜”出来的问题,点击进去就会自动呈现一个分析结果,例如这个问题可能正是业务人员所需要的 What is thetrend of Course cost over Year by Department?
一个分析就这么结束了,没有任何的拖拉拽操作,图形化的分析结果就已经呈现了。
这种产品理念的过人之处就是 —— 它为你提供想法,但是把选择权留给你:
1. 对于很多没有从事过专业分析的业务人员 IBM WatsonAnalytics 给出了很多提示和线索,或者说分析问题的思路。有了这些提示和思路,普通业务人员可以通过这些问题很快速的得到分析结果。
2. 对于一些初级的从业务岗位转向业务分析的人员,也面临过这些问题:BI 开发人员在需求沟通的时候通常也会发现部分业务人员不知道要分析什么,可能知道要分析什么但又不知道分析的结果要如何呈现。通过 Watson Analytics,可以不需要 BI 开发人员的任何参与,业务人员可以自行挑选出所需要的分析结果。
3. 对于大部分数据分析人员,往往凭自己的经验可以很快的想出一些分析的场景,但是人无完人总有遗漏的分析角度。对于 IBM WatsonAnalytics 来说,分析的角度我提供给你,非常的全面,可以随时放在身边提醒你,是对你想法的一个补充,它并不会干涉你。
就如同员工跟老板汇报工作方案的时候,老板并没有考虑好要怎么来做,但员工准备了很多套方案。最终方案员工来提,老板来拍板,既不伤害老板的面子,又让老板获得权威感,Watson 的这种细腻的设计思维很人性化。同时,上面反应出来的几个问题对应是日常 BI 开发和数据分析、呈现阶段的几个痛点场景,IBM Watson Analytics 产品在这些方面的考虑还是比较周到的。
这是我们看到的 IBM WatsonAnalytics 通过我们上传的数据就 “猜” 出来的问题,同样,我们也可以向 Watson 提问我们自己的问题。
How to ask a question 返回到这个页面,我们再来关注一下 How to ask a question ?
如果你不知道要问什么问题,IBM Watson Analytics 提供了一些问题分类导向,每一个分类对应着不同角度的问题。
· Variety pack - 一些基本的问题
· Compare data - 数据比较相关的问题
· Understand relationships andidentify patterns - 理解数据之间的关系
· Aggregate data - 有关数据聚合的问题
· Sort and filter data - 排序和筛选
· Predict data - 数据预测相关的问题
· All available examples - 所有问题
比如说Aggregate data
每一个问题都可以调整分析的维度和事实,每一个问题只要点击一下 ASK,整个的分析也就自动完成了。
IBM Watson Analytics 分析问题的逻辑
通过上面的简单介绍,大家基本上能够发现我们在对这份测试数据分析的时候,大部分的我们所想要的分析已经由 IBM Watson Analytics 已经帮我们完成了,每一个问题就对应这一个分析结果,如何做到的?
回到我之前列出来的数据,很显然 IBM Watson Analytics 在数据上载的阶段就已经完成了对数据的分析。IBMWatson 通过数据列的值对分析数据的角度(即维度)和分析的目标数据(即度量值或事实)进行了解析和自动建模处理。
· Year 年份
· Organization 组织
· Department 部门
· Position 职位
· Position Count 职位数量
· Planned Position Count 计划职位数量
· Expense Total 总支出
· Course Cost 课程成本
· Course Days 课程天数
· Terminations 终止标记
· Internal Hires 内部招聘
· External Hires 外部招聘
自动对维度和事实进行分组 - 数值型的自动变为分析的事实。
自动对维度和事实进行分组 - 字符或字符串类型的数据自动解析为维度。
很多数据分析工具能够自动的区分维度和事实,但是 Watson Analytics 在这个层面上更进了一步。Watson Analytics 不仅自动的对维度和事实进行划分,同时“猜想”了人们可能要用到的所有分析角度和事实组合,而这些组合可以直接的通过 Question 呈现给用户选择。
维度和事实建模分析三个发展阶段
1. 先设计好分析模型再分析和呈现。2013年以前使用传统的 BI 分析或报表工具(IBM Cognos、SAP BO、Oracle BIEE、Microsoft SSRS 等)大都需要预先建好数据仓库,在数据仓库建模的过程中我们需要自己设计维度表、事实表,还要考虑到性能和开发流程的问题,才有了 inmonkimball 之争。
2. 在分析和呈现过程中来建模。例如 Tableau、Qlik(QlikSense)、Power BI、Ptmind DataDeck、永洪、Smartbi、帆软、ETHINKBI 等产品不再严格考虑数据仓库建模的问题,具体表现就是可以基于基础数据直接将字段拖放到维度和事实面板,分析结果自动呈现。
3. 数据上载完成即建模完成,分析结果可及时呈现。IBM WatsonAnalytics 处于这个阶段。有一部分细分领域的产品也符合这一点,比如固定了数据模型的接口,按照接口上载数据,已经固化的分析报表和结果即可呈现。但区别就在于 IBM WatsonAnalytics 并不会预先固定好数据分析模型和分析报表,也不会预先固定了数据模型的接口,而是根据上载的数据对建模和分析进行随时调整。
上面是对 How to ask aquestion 的过程进行了一些解析,今天的分享就先到这,接下来我们再来看看 IBM WatsonAnalytics 所展现出来的对自然语言的分析和认知能力。
如果感兴趣!或者觉得自己要提升!或者想跟我们一起探讨一些问题,扫描下方二维码加好友,发送wa进群,寻找和你一样志同道合的小伙伴!
想了解更多IBM WatsonAnalytics,请点击获取平台试用链接:http://t.cn/RMFW8pD
本文由天善智能原创,原文链接:https://ask.hellobi.com/blog/lvpin/6065。