全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1591 1
2010-03-19
学数据挖掘 老师让我们连续做两个作业都是生成随机集 网上找这方面资料很少 首先训练集 验证集 测试集这些概念有查到解释还没理解 有人说就是生成随机数直接分成三份就行了 不过老师说测试集不必产生结果变量不知有什么特别意思

第二次给我们了10W随机数据 然后好像是在里面挑出20000个数据按正态分布生成上述三个数集 说各比率加总值为1  可能是让每个数集的正态分布情况和为1

这方面老师没解释 所以都靠自己了解 生成随机数其实用excel做都挺方便 老师要我们写sql sas c语言生成 搞的很麻烦 而且还有一点就是sql excel的随机数生成都有个random函数 而其他统计软件的random好像是必须安装一定的分布 像随机正态 随机均匀分布 我感觉这样不够随机 那么单纯这个random函数生成的数可能符合均匀分布 可能是正态分布 可能是二项 几何等分布吗

在论坛下了本书叫 随机与蒙特卡洛里面介绍伪随机 那么伪随机是不是就是这种安装正态或者二项分布产生的随机 就这些问题 请高手帮忙解答一下 网上好像很少资料

当然我有了解到说对随机以及测度论应该有些了解 现在突然感觉老师他真是不给解惑啊 从美国回来的台湾人
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-3-20 18:09:37
论坛有一些很强的人 好像有大学教师 留学者 经济学家 拜读过一些文章



不过往往想真的学知识时 除了大量书籍以及一些无良商人式的赚着更多的愚钝贫穷人的论坛币 外真的有专业水平的人好像很少  说重了  0回复是一种很不爽的状况
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群