全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
650 2
2023-01-26
我现手中有上千份上市公司年报.txt,我想用文本识别函数识别每份年报中的关键词;所以现在想把每个txt文件中的所有文字分别放入stata的一个格子中,请问应该怎么实现呢!! 谢谢谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-1-26 21:21:03
要看你的文本是怎么分隔的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-2-17 02:00:10
您可以按照以下步骤将多个 txt 文件中的文本导入 Stata 的数据集中:

打开 Stata,然后从“File”菜单中选择“New Do-file Editor”打开一个新的 do 文件。

在 do 文件中使用cd命令设置工作目录,以便 Stata 可以找到您的 txt 文件。例如,如果您的 txt 文件保存在名为 data 的文件夹中,您可以使用以下命令进行设置:

bash
Copy code
cd "C:\Users\YourUserName\Documents\data"
然后,您可以使用以下命令将所有 txt 文件中的数据导入 Stata:
cpp
Copy code
insheet using *.txt, clear
这个命令会将工作目录中所有 txt 文件的数据合并到一个 Stata 数据集中。请注意,Stata 会默认使用第一行作为变量名。

如果您需要对变量名进行修改,可以使用以下命令:
lua
Copy code
rename old_variable_name new_variable_name
最后,您可以使用以下命令将数据集保存为 dta 格式:
Copy code
save mydata.dta, replace
以上是将多个 txt 文件中的文本导入 Stata 的步骤。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群