【stata 14 中文do file显示问题】

36866

收藏 2015-05-18

求问论坛的盆友们。今天刚装好了Stata 14. 中文变量生成等功能都可以使用，但是在打开已有的do file的时候，发现其中已有的中文注释显示都是乱码，但重新输入中文注释又是正常的。
想问这可能是什么原因造成的？有什么办法可以把乱码重新显示为正常的中文信息？

附件列表

QQ图片20150518212439.png

原图尺寸 45 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

阿狸与桃子

2015-5-18 21:28:47

配了图片说明的哈

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

阿狸与桃子

2015-5-18 22:05:56

我用13和14对比了下
发现13中保存的中文在14中显示会有问题。
然后14中保存的中文用13打开也会问题。
不知道是不是版本支持的问题？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

阿狸与桃子

2015-5-18 22:15:39

另外个人感觉14的界面看起来更清晰，之前的各版本总感觉像有一层磨砂盖在上面的，有一种朦胧的感觉。这点非常喜欢。

然后，前面的问题还有待解答啊。如果真是14的do file对中文支持与之前版本都不一样。那只有忍痛割弃14了啊，毕竟更别人交流code时候需要发送do file等，如果对方没用14那注释就不能看了呀。

求大神出现！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

luckykong

2015-5-18 23:15:00

13和14对非英文字符的处理方式不同。
如果想用14，再和13的人交流的时候，会有很大问题的。
至于你的问题，请看
help unicode_advice
里面有提

You need to translate your .dta files, ado-files, and do-files if you
previously used extended ASCII to include accented characters, special
symbols, or non-Latin characters in your Stata files.

See the new command unicode translate.

再次重复一下，很多问题，help文档，stata配套的pdf文档里，都能找到。。可是大家怎么都不自己动手找一下呢，我觉着这样的习惯不好

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

阿狸与桃子

2015-5-18 23:33:42

luckykong 发表于 2015-5-18 23:15
13和14对非英文字符的处理方式不同。
如果想用14，再和13的人交流的时候，会有很大问题的。
至于你的问题 ...

谢谢回复。
您说得有道理，我确实忽略了这些信息。还是太浮躁了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

lichen8083

2015-5-19 10:12:06

请问楼主的这个汉字在do文件中无法正常显示的问题解决了吗，如何unicode　translate

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

阿狸与桃子

2015-5-19 10:21:15

lichen8083 发表于 2015-5-19 10:12
请问楼主的这个汉字在do文件中无法正常显示的问题解决了吗，如何unicode　translate

你得先进行unicode set

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lichen8083

2015-5-19 10:27:04

阿狸与桃子发表于 2015-5-19 10:21
你得先进行unicode set

具体些吗，比如低版本的do如何在14中应用；14中的do文件如何在低版本中应用。要能互通就好，不然交流肯定不便，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黑桃皇后

2015-5-19 16:12:41

我也遇到类似的问题，Stata13的数据文件使用Stata14打开后，以前英文变量名称（例如，sex）的标签（例如，性别）显示为非法字符。我尝试使用如下方法：
第一步，先分析编码：
. unicode analyze 3_prod_try.dta
(Directory ./bak.stunicode created; please do not delete)
      ------------------------------------------------------------------------
      Some elements of the file appear to be UTF-8 already.  Sometimes elements that need translating can look like UTF-8.  Look at these example(s):
            value-label contents "1001--2000Ԫ"
      Do they look okay to you?
      If not, the file needs translating or retranslating with the transutf8 option.  Type
         . unicode translate "3_prod_try.dta", transutf8
. unicode retranslate "3_prod_try.dta", transutf8
      ------------------------------------------------------------------------
      File needs translation.  Use unicode translate on this file.
  File 3_prod_try.dta needs translation // 提示需要转码

第二步，Unicode重编码。
官方说明是这样说的：我们需要对unicode进行重编码。
选择一种合适的的编码系统，这项工作让人退而却步（daunting），因为Stata约有230多种编码体系。如果旧版本的数据使用的是拉丁字母表（Latin alphabet），那么，编码体系可能是ISO-8859-1（称为latin1）或Windows-1252，这两者差不多一样。如果旧版本的数据基于Windows操作系统，那么，编码体系可能是Windows-1252。如果旧版本数据在互联网上公布，那么，编码体系可能是ISO-8859-1。如果旧版数据使用的是日文扩展的ASCII字符（Japanese Extended ASCII characters），编码体系可能是Shift_JIS、Windows-932、或EUC-JP（最后一个的可能性很小）。
对于以上编码体系，我们需要逐个去尝试，并通过Stata数据编辑器（Stata's Data Editor），或describe命令、codebook命令、或对变量做表分析（tabulate命令）以查看转换后的结果是否是我们所需要的。
如果以上变量都不是，我们还可以使用其他两种搜索方法。第一种是借助help文件功能。方法为：在Stata主菜单EditFind，在结果窗口和命令窗口之间就会多出一个查找工具条。在工具条中输入，例如“Chinese”，这样就可以在结果窗口中查找。
我分别按照上述方法逐个做了尝试，例如：
unicode encoding set Windows-1252
unico translat

但是，都没有成功。

现在送上Stata14支持的UTF-8，有231种。请求高人解决问题。谢谢

附件列表

Stata14_UTF-8.docx

大小:16.47 KB

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

快意沐风

2015-5-31 20:49:50

最简单解决方法，把stata12.1或者stata13与stata14配合着用，从旧版本的do ado dta文件中把东西复制出来，贴到14中去。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

frederick2012

2015-6-9 22:40:19

黑桃皇后发表于 2015-5-19 16:12
我也遇到类似的问题，Stata13的数据文件使用Stata14打开后，以前英文变量名称（例如，sex）的标签（例如，性 ...

cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030
unicode translate 回归处理.do

这是我转码的过程你相应的改下就好啦

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

frederick2012

2015-6-9 22:42:54

cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030
unicode translate 回归处理.do

注：相应的改下就好啦
第一步指定到要改的do文件的位置
第二步分析要改的文件（我这里的do文件名称是回归处理）
第三步设置编码
第四步搞定

再打开就是正常的啦~~~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ahq

2015-7-7 21:50:08

frederick2012 发表于 2015-6-9 22:40
cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030

最麻烦的是第三步，encoding的设置，这个该怎么办？是不是说只要是中文都可以设置成gb18030，还是说这是个特例？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ahq

2015-7-7 21:50:12

frederick2012 发表于 2015-6-9 22:40
cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030

最麻烦的是第三步，encoding的设置，这个该怎么办？是不是说只要是中文都可以设置成gb18030，还是说这是个特例？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

duncaness

2015-7-8 22:50:37

我用的是韩文的资料，在用14打开的时候乱码
问了韩国的stata代理商，提供了下面这个解决办法，问题得到解决。
不知道把下面syntax中的“Korean"换成 ”Chinese“是否能帮助你解决问题？
试试吧~

clear
unicode encoding set Korean
确认自己的数据所在的位置
然后在 file》change working directory》设置为数据所在的文件夹
unicode translate *, invalid
再重新读取数据

*good luck*

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

beijin2008

2015-7-10 14:07:39

frederick2012 发表于 2015-6-9 22:42
cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030

确实可以啊，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

第七品

2015-7-11 09:42:49

大家有没有遇到这样的问题，就是在stata14中，do文件中的中文显示正常，但是直接在do文件中run相关程序时，stata不会按选定的程序处理。将注释的中文去掉后，就可以了。所以我每次必须将do文件的程序粘贴到stata的命令窗口才能跑，而不能直接在do文件的窗口跑

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

futurept

2015-7-13 00:09:47

Please enter " help unicode_advice" and read the help info.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

frederick2012

2015-7-13 23:46:14

ahq 发表于 2015-7-7 21:50
最麻烦的是第三步，encoding的设置，这个该怎么办？是不是说只要是中文都可以设置成gb18030，还是说这是个 ...

gb18030 是国标汉字标准只要是中文就这样就ok

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

heshibiye

2015-8-24 23:13:21

楼上说了一大堆都没提出便捷解决方案。
超简单解决方案如下：
do文档实际是个文本文件，将其用纯文本编辑器（例如系统自动的记事本程序）打开，然后另存为unicode编码格式，推荐选utf-8.
一切OK
不过这样改了以后，在14版本以下打开的就是乱码了，原因你自然懂得。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

heshibiye

2015-8-24 23:15:09

luckykong 发表于 2015-5-18 23:15
13和14对非英文字符的处理方式不同。
如果想用14，再和13的人交流的时候，会有很大问题的。
至于你的问题 ...

很多人有英文阅读困难，并且对编码格式也不懂，看这些自然吃力。
不要对其他人这么苛求。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

iron1992

2015-10-16 12:48:14

https://bbs.pinggu.org/thread-3887085-1-1.html
可以用神级编辑器对高低版本之间的do文档进行转码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

-Nightmare

2015-10-18 21:13:43

frederick2012 发表于 2015-6-9 22:42
cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030

怎么全部转换啊？？？？？？？？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

pcjoshua

2015-11-5 00:31:57

第七品发表于 2015-7-11 09:42
大家有没有遇到这样的问题，就是在stata14中，do文件中的中文显示正常，但是直接在do文件中run相关程序时， ...

我也遇到你说的问题呢
选择哪一行命令的时候，点击执行，然而stata却执行前面的命令
搞不懂怎么回事。
就如你说的，删掉中文后，就ok了，但是有其他解决办法吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

reecyfeng

2015-11-14 23:44:22

frederick2012 发表于 2015-6-9 22:40
cd C:\Users\Thomas\Desktop
unicode analyze 回归处理.do
unicode encoding set gb18030

我按你说的方法处理之后还是乱码，更要命的是在写字板中打开也成乱码了，请问一下我该怎么处理？非常感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

第七品

2015-11-27 12:08:59

pcjoshua 发表于 2015-11-5 00:31
我也遇到你说的问题呢
选择哪一行命令的时候，点击执行，然而stata却执行前面的命令
搞不懂怎么回事。
...

目前一直是在命令窗口跑数据

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

woaimeimei

2015-12-3 00:12:38

第七品发表于 2015-7-11 09:42
大家有没有遇到这样的问题，就是在stata14中，do文件中的中文显示正常，但是直接在do文件中run相关程序时， ...

我在mac用13.1版，也遇到了这个问题，但win上没有此问题。和你的问题一模一样，就是有中文注释，就无法精确选中某一行命令代码。请问你最后解决这个问题了吗? 谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

woaimeimei

2015-12-3 00:14:02

pcjoshua 发表于 2015-11-5 00:31
我也遇到你说的问题呢
选择哪一行命令的时候，点击执行，然而stata却执行前面的命令
搞不懂怎么回事。
...

请问你的问题解决了吗?

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

pcjoshua

2015-12-4 03:45:11

woaimeimei 发表于 2015-12-3 00:14
请问你的问题解决了吗?

nope，sorry

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群