全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2452 21
2021-08-01
   最近在处理数据时,发现在同时多选变量改变format时(如 format _all %20s )选择所有变量改变格式时会报错:data中同时包含 str 与 byte 类变量时,format  _all 语句会由于变量存储形式不同而报错,想请教一下是否有可以判断变量是数值还是字符型的命令吗,类似matlab 里的is 函数?或 者是否有命令可以选择全部string类型的变量而非 所有变量(_all)?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-8-2 01:49:04
简单循环一下即可
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-8-2 14:10:39
zdlspace 发表于 2021-8-2 01:49
简单循环一下即可
非常感谢,这是一个办法!我在想有没有更好的办法,因为在变量更多的情况下系统会变得很慢,不过还是非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-8-2 14:32:55
azrex 发表于 2021-8-2 14:10
非常感谢,这是一个办法!我在想有没有更好的办法,因为在变量更多的情况下系统会变得很慢,不过还是非常 ...
我很好奇你有多少个变量?怎么会很慢呢?我刚试了一下10000个变量,10000个观测值,只花了0.64秒,一般也不会超过10000个变量了吧
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-8-2 14:34:53
azrex 发表于 2021-8-2 14:10
非常感谢,这是一个办法!我在想有没有更好的办法,因为在变量更多的情况下系统会变得很慢,不过还是非常 ...
0.6秒还慢吗?1秒都不到呀,很好奇你是什么样的数据,居然会很慢,难道有几万个变量吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-8-3 08:48:23
zdlspace 发表于 2021-8-2 14:34
0.6秒还慢吗?1秒都不到呀,很好奇你是什么样的数据,居然会很慢,难道有几万个变量吗
因为写程序的话感觉用循环中用cap会对时间产生影响,这些影响在observation过多的情况下会放大,cap虽然会解决不报错的问题并且让程序继续进行,但是程序报错的时间还是客观存在的,所以在处理大型数据的时候我希望还是能找到减少系统时间的程序(当然在如果的可能下,这个问题可能暂时没办法解决)。我的数据是observation多而不是变量多,几百万的obs我觉得每变更一次就会变得时间很长,而如果报错的话可能对系统计算与优化有影响,很简单的例子,您上述的例子里如果用 format _all %20s 基本不费时间(0.001s,可能是系统误差导致,也有可能是循环导致的),而用循环的话我这边大概是0.2s左右,还是有些差距的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群