有感于woodoo回复中应用的post命令:联想到数据管理时有时候会出现这种情况;一个master data,这个数据可能与另外一个暂称之为using data存在着模糊相关,即两者有联系却不很明确,或两者有相关却不能完美的匹配,这些联系大都是以字符串的形式出现,有的表达甚至没有共同的字条串,仅仅依赖于语意,这种没有具体规律的联系用merg,joinby等是不能处理的或者处理大部分,而某些没有规律的却不能处理,比如以下的讨论;
https://bbs.pinggu.org/thread-893472-1-1.html
https://bbs.pinggu.org/thread-1097873-1-1.html
这时候如果同时参考using data对master data操作,可能会更好些。
正如版主所言:“这里首先有一个逻辑上的问题。”
“若master data与using data的数据结构(比如变量名、变量数、样本量等)很不一样,同时操作两data就可能受到很多限制(甚至没有意义)。”
“同时操作两data(两data同时成为操作对象),应该要求两data有某种内在的逻辑联系,而merge等恰好利用并表现了这种联系。”
stata设计者们的初衷也许就认为一个处理对象就足矣,如果多个有联系的对象可以用merg,jjoinby,append,cross等命令合并成一个对象来处理,如果没有联系的数据就没有必要同时操作。(一个猜想)
问题的关键就是两个数据有不是确切明确的联系,其实这种问题的出处在于原始数据的整理缺乏规范。网上有个reclink命令好像处理这种相关,却在具体应用上不太清楚。
type可以显示未打开(未导入内存)的数据库(以文本方式存在)的内容。