全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1202 0
2015-06-10

  1、获取原始数据

  背景:原始数据是从HBase中定制抽取回到关系数据库中的,一个主键关联的一个指标的原始数据一般都上万条,指标数据量也很大,为了日后抽取时插数据的性能等因素,故将单个指标的原始数据存储在单个字段中,值与值之间通过英文逗号分隔。
  另外,本示例中用到的关系数据库为MySQL,而MySQL中没有内置的函数可以方便地将一个字段的值分隔成多行,尝试过自定义存储过程的方式实现分隔,但效率好像不高,所以本示例通过定制Java查询的方式来获取原始数据。
  新建Java查询对象效果如下:



  Java查询执行效果如下:



  2、计算作图数据
  作图所需数据的计算也是通过Java查询来实现(其中的核心算法需要使用到commons-math3-3.3.jar这个工具包)。
  新建Java查询对象效果如下:



  Java查询执行效果如下:



  3、电子表格出图









  正态分布图作图参考文档:http://jingyan.baidu.com/article/f3ad7d0fffa41509c2345b6e.html
  示例数据:

  test_data(MySQL).sql


  本文源自:http://wiki.smartbi.com.cn/pages/viewpage.action?pageId=11305065

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群