smile108 发表于 2013-2-16 08:07 
你是要做分组对照分析哒,那就把这些数据全部按照要求分完组别然后看图像的差异咯。【你说:有些地块太小, ...
1. 删除小于10平方米(0.001公顷)面积的原因:第一,数据是工商业用地面积大小,而从实际出发,对于小于10平方米的工商业园区几乎是不可能的。第二,用均值加减标准差来作为分组点,就得算均值,那些小于10平方米的数据也会影响到均值的计算。
2. 删除的数据是0.001公顷,平均值是3.4公顷,标准差是13公顷。90%的数据都分布在0.05公顷到10公顷之间。不好意思,我忘记说单位了。
3. 老师建议我用均值加减标准差的倍数来作为分割点,由于均值比标准差小很多,所以只要是减去,那么那个分割点肯定是负值,而地块的面积是不可能为负值的,在这些负值区域是不可能有地块分布的。所以我觉得这种分组方式不对,想寻求其他分组方式。
4.我也认为数据全部为整数时,也有可能是正态分布。只是我的数据,均数比标准差小很多,做出来的直方图如下,看上去明显不是正态分布。横坐标是面积大小(单位为公顷),纵坐标为频率,这个图是spss自动等距分的组,还有那些小于0.001公顷的值一共有2000多个,不在这个图里。
5.论文其中的一个目的是,利用统计学知识,如何对工商业区域按照面积大小进行分类或者分组。所以想问问大家,大家在处理数据时,还有些什么分组方式。
最后谢谢楼主关注