现有n个人(以4个人为例,分别为sub001-sub004),每个人各有m*s个文件(以3*4个文件为例,分别以编号01-03和类型A/B/C/D表示),以sub001为例,文件名分别为sub001_A_01.txt, sub001_A_02.txt, sub001_A_03.txt, sub001_B_01.txt, sub001_B_02.txt和sub001_B_03.txt,类型C和D的以此类推,文件按上述规则命名,所有文件的路径名为/analysis/sample/。
每个文件中是一列数字,每个人相同类型对应3个文件的数字行数是相同的,但是不同人之间以及ABCD间可能是不同的(如sub001_A为120行,sub001_B为180行,sub002_A为180行,sub002_B为160行)。另有这4个人的行为数据的字符代码分别为‘L R R L’。
想解决的问题是:
首先,提取每个文件中的这1列数字,对每个人相同类型(如本例中的A/B/C/D)对应的m个文件(本例为3个)中的数字作相关分析,比如sub001_A_01.txt和sub001_A_02.txt中的一列数值作相关,sub001_A_01.txt与sub001_A_03.txt,sub001_A_02.txt与sub001_A_03.txt以此类推,这样会各自产生每个人的相关矩阵(即n*s个m*m矩阵,本例为4*2个3*3的矩阵);
然后,分别提取A/B/C/D类型的矩阵中相同的某列某行(如第1列第3行)的相关系数,并组成新的一列数,接着分别计算字符代码为L和R的人在该列该行的均值以及标准差(如例中L为sub001和sub004,R为sub002和sub003),另外再提取另一组的某行某列(如2行3列)的数值,计算同上,最后在一张图上同时显示这两列系数的A/B/C/D四种类型的线图,并加上标准差;
最后,提取代号为L的1行3列的数值,以及代号为R的2行3列的数据,并将两者合并成一个新列,另外将代号L的2行3列与代号为R的1行3列合并成新列,接着计算合并后A/B/C/D四种类的这列数的均值和标准差,并在同一张图上画出这两列数A/B/C/D四种类型的线图,加上标准差。