全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SQL及关系型数据库数据分析
1464 0
2014-02-20
问题具体描述:
    1、现在手上有数以十万计个数组,每个数组所包含的元素个数多少不等,而且同一数组内可能有相同的数值。
    2、对数组进行如下操作:首先判断一个数组的变异系数是否大于某一固定值(15%),如果数组的变异系数>15%,则借鉴类似K均值聚类的思想,用迭代算法,剔除数组内一个数值,直到数组的变异系数≤15%,要求算法最大限度的保留了原数组内的数值,而且留下来的数值相似度比较高。
        不知道问题表述清楚没有?比如现在就有一列数:
        25 47 55 20 36 60 38 35 47 50 36

它的变异系数已经超过了15%,如何用迭代算法对其实现上述操作呐?

程序最好用SQL语句写,其他的R或者sas、spss也可以。

先谢谢各位高手了


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群