# 数据集
时间序列分类、短期/长期预测、插补、异常检测、少样本和零样本预测。
其他研究则更专注于时间序列预测的特定方面。例如,TEMPO专注于时间序列预测,但结合了额外的时间序列分解和软提示等精细设计。还有研究利用LLMs进行时间序列预测,采用两阶段的微调过程:首先使用有监督的微调引导LLM朝向时间序列数据,随后转向针对时间序列预测的下游微调。另有研究通过新的嵌入方法激活了LLM在时间序列上的能力,该方法通过实例、特征和文本原型对齐的方式进行数据的token化和编码,然后创建提示传递给LLMs来执行任务。
## 1.1. Forecasting
long-term
ETT (4 subsets) Electricity, Traffic, Weather, Exchange, Illness
short-term
M4 (6 subsets)
## 1.2. Imputation
ETT (4 subsets), Electricity, Weather
## 3. Classification
UEA (10 subsets)
## 4. 时序异常检测
SMD (Server Machine Dataset) 服务器机组数据集
数据集收集的是28个机器连续5周的数据,相邻两组数据间间隔一分钟。
总共收集28个机器的数据,每个机器收集38个维度(变量)的信息。
训练集与测试集的数据量是1:1的,训练集无label,测试集有label。
时间信息是隐匿的
MSL, SMAP
SWaT (Secure Water Treatment) 安全水处理
PSM (Pooled Server Metrics)
WADI (Water Distribution) 配水
EPIC (Electric Power and Intelligent Control) 电力与智能控制
CISS (Critical Infrastructure Security Showdown) 关键基础设施安全对抗
Blaq_0 上交Blaq_0黑客马拉松
BATADAL (BATtle of Attack Detection Algorithms) 攻击检测算法对抗
IoT 物联网网络流量数据集
UCRArchive_2018
KPI异常检测
微服务应用系统故障发现和根因定位
UTSD
ERA5
Time-300B
## 多模态
TETS