有这样一个数据集,研究某健康结局与某暴露因素之间的关系。数据集中提供了7年(2557天)逐日的某暴露因素测量值,变量名分别day1,day2,......,day2557。现在已知各研究对象与研究的健康结局之间相关的某事件发生的日期,该日期对应于这7年中的某一天(dayx),每一研究对象这一事件发生的日期都可能不同,变量date_of_event即是该事件发生的日期(已转换为一个数值(=事件发生日期-day0对应的日期))。现在欲探讨该事件发生之前和之后一定时间内暴露对健康结局的效应,首先需要计算各暴露期间的平均暴露水平。假定我们需要计算事件发生前1个月,事件发生后1个月,2个月,3个月等不同时期的平均暴露水平,如何编程实现。因为逐日测量值中缺失值的存在,在计算平均暴露水平的时候要求有效测量值的数量需达到该期间总测量值个数的75%以上(如每月按30天计算,计算月均暴露水平时至少要有23个有效测量值),否则记为缺失值。谢谢!