多谢你们了,很抱歉没有把问题讲清楚。
基因表达的变化是通过信号强度表示的,数据格式如下:
gene 1h 6h 12h 18h 24h 30h 36h 42h 48h
1 0.14 0.15 0.13 0.12 0.13 0.96 4.19 3.19 1.04
2 0.29 0.21 0.25 0.24 0.14 0.15 0.51 4.03 3.77
3 0.18 0.17 0.16 0.17 0.19 3.42 4.46 1.74 0.65
4 7.59 1.48 0.96 0.77 0.42 0.27 0.28 0.88 1.63
5 0.63 0.50 0.26 0.18 0.14 0.18 0.25 3.03 3.86
6 0.40 0.25 0.19 0.12 0.34 3.21 2.44 0.94 0.61
7 0.24 0.22 0.19 0.17 0.18 0.18 0.24 3.24 4.12
8 0.31 0.26 0.22 0.20 0.21 0.43 2.67 4.83 2.08
9 0.17 0.18 0.16 0.16 0.19 1.95 3.58 2.06 0.88
10 0.19 0.21 0.19 0.17 0.22 2.38 3.86 1.94 0.72
......
在此基础上有如下数据操作,我不明白:
1 每一行转换成一个time series, imputing the missing data with locally weighted smooth(<=12%)?
2 每一行进行fft()变换,padded with 0~64 measurements?
3 每一行使用spectrum()?
4 得到power at each frequency(), the total power()(P_tot), the frequency of maximum power()(F_max)?
5 periodic score=power[(F_max-1)+(F_max)+(F_max+1)]/P_tot 用来分组?
6 the most frequent value of F_max across all profiles was deemed the major frequency(m) and used in determing phase information?
7 the phase of each profile was calculated as atan2[-I(m)],R(m);
8 profiles was ordered in increasing phase from -pi to pi;
完成以后的效果是将基因排列成附图(transcriptome01.png)格式。
再次感谢你们的帮助!
