时间序列异常检测方法是什么?
在第一部分,每一条时间序列都会被按天切分成很多子序列(subsequence),然后将其聚集起来,把相似的时间序列放在一类,不相似的放在另外一类;在第二部分,新来的时间序列会根据其具体的日期,分入相应的聚类,然后用该类的时间序列异常检测方法来进行异常检测。 从上图可以看到 Period 的核心思路(core idea)。
深度学习时间序列异常检测算法有哪些?
基于深度学习的时间序列异常检测算法,主要可以分为以下这么几种 a) 针对正常数据进行训练建模,然后通过高重构误差来识别异常点,即 生成式(Generative) 的算法,往往是无监督的,如自编码器(Auto Encoder)类 或者回声状态网络(Echo State Networks)。 b) 对数据的概率分布进行建模,然后根据样本点与极低概率的关联性来识别异常点,如DAGMM [1] 。
时序数据异常检测数据集如何标注?
时序数据异常检测数据集的标注需要昂贵的专家成本,尤其是详细标注了异常发生的开始和结束时刻的数据集。 这类数据集规模通常较小,因此检验算法效果存在一定偶然性。 基于重建误差的异常检测,要求模型在输入正常数据时重建误差较小,输入异常数据时重建误差较大;下面我们可以看一下孟恒宇同学在他的论文里对不同工况的存储数据集进行重建效果的对比:
时间序列异常检测中的“节假日效应”是什么?
在时间序列异常检测中,通常有一个较为常见的场景就是“ 节假日效应 ”。 所谓节假日效应,指的就是在节假日的时候,其时间序列的走势跟日常有着明显的差异性,但是又属于正常的情况。 从国内 2020 年的节假日安排可以看出,一年中有好几个关键的假日: