现在的数据结构如下,数据条数有十万多,想问问是否有比较方便的程序可以实现下列3种目的(尤其是第1/2两个问题),万分感谢。
stkcd year name post
000001 2010 a1 总经理、董事长
000001 2011 a1 副总经理
300243 2011 a3 董事长、总经理、财务总监
300243 2012 a3 财务总监、董事长、总经理
300243 2013 a4 财务总监、总经理助理
300244 2014 a5 总经理、董事、总经理
300245 2014 a6 总经理
希望可以在变量post中进行如下两种处理:
1. 筛选出含有“总经理”(精准的,不含副总经理、总经理助理之类)
2. 原数据Post变量中会出现重复字符,如“总经理、董事、总经理”,有没有什么方法,可以把这些重复字符删除,整理为“总经理、董事”这样的格式
3. 调整post 字符内变量顺序,是否有方法使得,如果post变量中字符的顺序调整为:董事长、董事、总经理、...(其他职位)