增强分析引擎
增强分析在未来的作用!洞察力正在发生变化(这是一件好事)
您是否曾经遇到过需要快速生成洞察力的情况,但是由于缺乏资源和信息而损失了大量收入吗?我们生活在数据世界中,不仅是数据,还有大数据。数据集正在以非常大的数量,种类和非常高的速度生成。只需忘记使用传统的BI系统处理此类数据即可。由于资源匮乏,这些传统系统有时无法生成所需的见解。他们无法收集,准备或仅仅理解数据。有多种数据源,例如Amazon,Facebook,Twitter,它们将这些数据与您的偏好混合在一起,并推荐新数据并为您提供产品。
现在,作为区域销售经理,您想展现隐藏在数据中的见解。探索这些数据是一项艰巨的任务,需要大量步骤。但是,为不断变化的数据需求找到解决方案也不难。在本文中,我们将研究传统的BI,当前行业的状况以及增强分析对未来BI的帮助。
下面显示的是传统的BI和Analytics(分析)流程。每一步都将通过增强分析而发生巨大变化。
什么是增强分析?
在继续之前,最好讨论一下“增强分析”的真正含义。根据Gartner,在其2018年10月的研究中,“增强分析是数据和分析的未来”。在Suss上,Bill Su明确表示,增强分析“通过使用高级机器学习和
人工智能算法,[自动]生成洞察力。”
有关分析和商业智能流程的所有内容都将由增强分析提供的人工智能进行更改。这将有助于简化,删除某些步骤并更改/改进其他步骤。
商业智能中的新功能:增强分析
增强分析借助机器学习和人工智能使数据洞察自动化。自然语言处理扮演着最重要的角色,以自动进行数据准备。用户可以获取真正的见解并快速,准确地对数据采取行动。
为什么这对您的组织完全重要?
作为区域销售经理,您知道您的收入比上个月减少了20%。但这对您真正意味着什么?
行业趋势下降?
这是因为您的一个广告频道无法正常工作吗?
还是因为其他原因?
那是您需要深入研究网络分析,电子商务和社交媒体数据的地方,以发现导致收入下降的原因。假设您最终意识到这是由于效果不佳的社交广告所致。因此,您雇用了新的代理商。现在,这种见解是可行的,因为它直接与您的操作相关。
怎么样 ??
可能有一些解决方案可以通过使用AI和ML算法自动进行洞察生成,从而减轻公司对数据科学家的依赖。增强分析引擎可以自动浏览公司数据,清理,分析数据,并将洞察转化为企业所有者的行动步骤。它将很少或没有技术监督。
此处的目标是使分析工具与搜索界面一样简单,其行为类似于与虚拟助手的对话。
用户界面:单击开始按钮后,用户可以说出查询。语音将转换为文本,结果条形图如下所示。
语音用于识别数据并准备数据。使用语音对数据进行验证,以使用一些标准的统计测试来确定数据是否有用。用户可以使用语音将报告/图表可视化,从而快速做出决定。
该应用程序将:
使用语音识别数据并准备数据。
使用语音通过使用标准统计测试来验证它是否有用。
使用“语音”可以在此之上确定报告/图表的类型,以使其进一步可视化以做出决策。
上下文视图:
它包含三个实现部分:
知识库创建,SQL生成。
自然语言处理(TextToSQL),语音到文本的转换。
从第1部分中创建的SQL生成报告/图表。
下面的类从Mysql DB在Neo4J db中创建知识图。
WriteNeo.java
连接到Sql数据库。
getColumnsMetaData并创建JSON。
连接到Neo4J
调用apoc.convert.fromJsonMap并传递Json。它将在Neo4j的图Db中创建节点和子节点。
图--- Mysql Schema的Neo4J图。
假设我们已经准备好以Json形式输出的Seq2Sql:
{“ question”:“显示年度销售”,“ sql”:{“ conds”:[[0,0,0]],“ sel”:[2
“ func”:[2
这些字段表示以下内容:
问题:工人写的自然语言问题。
table_id:要解决此问题的表的ID。
sql:与问题对应的SQL查询。它具有以下子字段:
sel:被选择的列的数字索引。您可以从表中找到实际的列。
agg:正在使用的聚合运算符的数字索引。例如,Group by
func:正在使用的聚合运算符的数字索引。例如date(),month(),year()
conds:三元组的列表(column_index,operator_index,condition),其中:
column_index:正在使用的条件列的数字索引。您可以从表中找到实际的列。
operator_index:正在使用的条件运算符的数字索引。例如。>,<,= condition:条件的比较值,为字符串或浮点型。
另一个类ReadNeo.java
阅读上面的json以获取table_id,Condition列,selection列等。
neo4j中的每个节点都有其标签索引。例如,产品表节点的tabInd =12。因此它被映射为从neo4j获取表名。遍历其他图形以获得列名。
上面的sql(带有tableid和columned)被转换为可以执行的实际sql查询。
结论
世界已经完全改变:数据现在已成为大数据。无数设备和用户每秒都会生成新的数字记录。这些数据以极其复杂的方式持久保存和处理。为了使之有意义,需要更强大和牢固的分析系统。
每个组织,无论是政府组织还是私有组织,都将依赖于增强型分析来了解具有大量数据的多个数据源之间的关系。最后,增强分析将改变用户体验分析和BI的方式。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!