先將一下一開始我遇到的問題
| date | 1101 | 1102 | 1103 |
2012/12/28 | 115,034,923 | 123,278,231 | 23,171,713 |
2012/9/28 | 112,042,034 | 121,429,460 | 22,624,991 |
2012/6/29 | 112,213,937 | 125,323,946 | 23,613,683 |
2012/3/30 | 107,742,951 | 124,763,698 | 24,768,219 |
2011/12/30 | 108,064,151 | 123,243,525 | 24,119,087 |
(1101 1102 1103 為股票代碼,裡面的數值為資產值)
問題一:
這是我一開始在excel的資料
而當我轉CSV檔,insheet 到STATA的時候
這時全部變成了字符變量
本來是想說,如果透過destring或encode的話
還可以繼續往下整理數據
但是我的公司有一千四百多家
也就是輸入到STATA的時候 變數高達一千四百多個
若用destring或encode的話 我不知道該怎麼去整理
問題二
如果我想整理成以下這種格式(panel data)
| date | ID(股票代碼) | 資產 |
2012/12/28 | 1101 | 115,034,923 |
2012/9/28 | 1101 | 112,042,034 |
2012/6/29 | 1101 | 112,213,937 |
2012/3/30 | 1101 | 107,742,951 |
2011/12/30 | 1101 | 108,064,151 |
2012/12/28 | 1102 | 123,278,231 |
2012/9/28 | 1102 | 121,429,460 |
2012/6/29 | 1102 | 125,323,946 |
2012/3/30 | 1102 | 124,763,698 |
2011/12/30 | 1102 | 123,243,525 |
2012/12/28 | 1103 | 23,171,713 |
2012/9/28 | 1103 | 22,624,991 |
2012/6/29 | 1103 | 23,613,683 |
2012/3/30 | 1103 | 24,768,219 |
2011/12/30 | 1103 | 24,119,087 |
那我應該如何從原始的資料下手
已經從版上看了很多文章了,但絲毫無頭緒
望高人可以指點迷津