各位论坛的老师同学们好,想问这样一个问题,我的模拟数据比方说如下:
我想要画sale的标准差sd关于年份year的散点图,使用代码:
scatter sd year
但是虽然画出来看上去只有四个点,(因为year只有4年,而每年虽然有多个样本,但是sd的数值是一样的),但实际上stata应该是画了20个点(即我的全样本,只是说因为很多点重合了)
我的实际问题是,由于我的样本量很大,约8万个样本,而我想画的图实际上类似于上面的例子,可能只需要画20年的散点图,总共也只需要有20个点,但为了得到这20个点的散点图,用scatter命令不得不画8万个点,非常消耗计算机资源,也经常导致我的stata卡死。。。。请问各位老师有什么优化的算法么?万分感谢!