基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

学术 2024-11-19 17:02 北京

来源：Deephub Imba
本文约2400字，建议阅读5分钟
本文提介绍了受大脑自然信息处理过程启发而提出的一种脉冲神经网络。

Liquid State Machine (LSM) 是一种脉冲神经网络 (Spiking Neural Network, SNN) ,在计算神经科学和机器学习领域中得到广泛应用,特别适用于处理时变或动态数据。它是受大脑自然信息处理过程启发而提出的一种脉冲神经网络。

设想你正处于一片平静的湖面,四周环绕着高山,你向水中投入一块石头。涟漪开始形成,向四周扩散。此时,在附近再投入一块石头。第二块石头产生的涟漪与第一块s石头产生的涟漪相互交叠,在水面上形成复杂多变的图案。这种图案并非随机产生;它包含了每块石头落水的位置、时间、大小,甚至每次撞击释放的能量等信息。
利用这种涟漪效应来理解和解决问题。在某种程度上,这就是 Liquid State Machines (LSMs) 的工作原理。

由于其处理时间信息的独特方法和特殊的网络结构,Liquid State Machine (LSM) 模型与传统神经网络存在显著差异。

LSM简介

标准神经网络,如前馈网络,本身并不处理时间信息。循环神经网络(Recurrent Neural Network, RNN),如长短期记忆网络(Long Short-Term Memory, LSTM),通过反馈回路捕获序列信息,但需要对每一步进行显式训练。相比之下,LSM使用随机连接的神经元储备池("液体")将输入数据转化为高维动态状态。储备池的设计目的是随时间"回响"输入信号,被动捕捉时间模式而无需直接训练。这种结构以稀疏、高效的方式捕获输入数据的时间依赖性。

传统模型如RNN、LSTM和GRU(Gated Recurrent Unit)依赖于通过时间的反向传播(Backpropagation Through Time, BPTT)算法进行训练,这可能计算量很大 ,而且经常出现梯度消失和梯度爆炸等问题。在LSM中,只对读出层进行训练,通常使用线性回归模型(例如岭回归),而储备池保持固定不变。这种方法降低了计算负荷 ,简化了训练过程,因为只需要优化输出层的参数。

尽管RNN和LSTM可以对时间模式进行建模,但除非经过明确调优和多次迭代训练,否则这些模型在处理高度混沌或非线性系统时表现欠佳。得益于储备池的随机连接和丰富的非线性内部动力学,LSM可以有效处理高度复杂和混沌的数据。这种结构特别有利于需要对时间输入的微小变化保持敏感的任务,例如语音识别或混沌时间序列预测。

RNN主要用于顺序预测任务,而LSM则可以同时执行分类和预测任务。

代码实现

我们将使用Python构建一个时间序列数据的预测模型。

安装必要的库


 !pip install reservoirpy matplotlib numpy

导入库并加载数据集

 import numpy as np   import matplotlib.pyplot as plt   from reservoirpy.nodes import Reservoir, Ridge   from reservoirpy.datasets import mackey_glass      # 加载Mackey-Glass数据集 data = mackey_glass(n_timesteps=1000, tau=17)      # 可视化时间序列数据 plt.plot(data)   plt.title("Mackey-Glass Timeseries Data")   plt.xlabel("Time Step")   plt.ylabel("Value")   plt.show()

Mackey-Glass数据集是一个在非线性系统建模和预测研究中经常使用的混沌时间序列。它模拟了一个生理反馈回路,根据延迟参数的不同可以表现出混沌特性。这使得它成为评估需要捕获复杂时间依赖性模型的理想数据集。

数据预处理

 # 对数据进行归一化处理 data = (data - np.mean(data)) / np.std(data)划分训练集和测试集 # 将数据集划分为训练集和测试集 split_ratio = 0.8   split_idx = int(split_ratio * len(data))   train_data, test_data = data[:split_idx], data[split_idx:] 定义储备池参数 # 构建并配置Liquid State Machine(储备池) reservoir_size = 500 # 储备池中的神经元数量

LSM模型由一个储备层和一个读出层组成。储备池在高维空间中捕获时间动力学信息,读出层对这些动力学信息进行回归。


    # 创建储备池和读出层    reservoir = Reservoir(units=reservoir_size, lr=0.1, input_scaling=0.5, sr=0.9) # 将'spectral_radius'参数简写为'sr'    readout = Ridge(ridge=1e-6)

通过将数据输入到储备池神经元,可以生成高维状态,捕获输入数据的时间依赖性。线性回归读出层(Ridge)将储备池状态映射到下一个时间步的值。

现在,创建完整的LSM模型。


    # 连接各层,构建LSM模型    model = reservoir >> readout

使用训练数据的储备池状态训练模型,目标是预测下一个时间步的值。


 # 调整数据形状以适应训练 X_train = train_data[:-1].reshape(-1, 1) # 输入数据 y_train = train_data[1:] # 目标数据(下一个时间步的值)    # 训练模型 model = model.fit(X_train, y_train, warmup=100)

使用训练好的模型对测试集进行预测,并将预测结果与真实值进行对比。


 # 生成预测结果 X_test = test_data[:-1].reshape(-1, 1)   y_test = test_data[1:]   predictions = model.run(X_test) #绘制预测结果与真实测试数据的对比图 plt.figure(figsize=(12, 6)) plt.plot(y_test, label="Actual", color='b') plt.plot(predictions, label="Predicted", color='r') plt.title("Mackey-Glass Prediction with Liquid State Machine") plt.xlabel("Time Step") plt.ylabel("Value") plt.legend() plt.show()

通过观察储备池神经元的激活情况,可以深入了解储备池如何将时间序列输入转化为高维状态。


    # 通过观察部分神经元的激活情况来分析储备池动力学    plt.figure(figsize=(10, 6))      states = reservoir.run(X_train)      for i in range(5): # 绘制前5个神经元的激活情况        plt.plot(states[:, i], label=f"Neuron {i+1}")      plt.title("Reservoir Neuron Activations (Subset)")      plt.xlabel("Time Step")      plt.ylabel("Activation")      plt.legend()      plt.show()

LSM最初的设计灵感来自脉冲神经元,它对于需要实时处理和高时间精度的任务非常有效。在计算效率和训练复杂度要求较高的场景下,LSM也是一种强大的技术选择。

总结

这篇文章介绍了一种基于Liquid State Machine (LSM)模型的时间序列预测方法。LSM是一种脉冲神经网络,特别适用于处理时变或动态数据。与传统的神经网络模型相比,LSM通过随机连接的储备池捕获时间依赖性,并且只需训练读出层,大大降低了计算负荷。文章详细阐述了LSM的工作原理,并使用Python和ReservoirPy库实现了一个完整的时间序列预测案例。以Mackey-Glass数据集为例,展示了数据预处理、模型构建、训练和预测的完整流程。同时,通过可视化储备池神经元的激活情况,直观地展现了LSM将时间序列转化为高维状态的过程。文章表明,LSM模型在处理复杂时间序列和实时预测任务方面具有显著优势,为时间序列预测提供了一种高效、可扩展的新思路。

编辑：王菁

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU

数据派THU

清华大数据研究中心官方平台，发布团队科研、教学等最新动态及大数据领域的相关信息~

最新文章

深入理解多重共线性：基本原理、影响、检验与修正策略

类GPT化学语言模型，9秒生成100种化合物，微软AI药物设计平台登Nature子刊

【阿姆斯特丹博士论文】优化、博弈与泛化界

独家｜ChatGPT搜索如何为AI代理铺路

普林斯顿王梦迪团队提出蛋白水印方法，助力AI蛋白生成的版权保护与安全

【NeurIPS2024】注意力迁移对视觉Transformer的惊人有效性研究

报名 | 揭秘AI科研神器，解锁跨学科创新密码！

独家｜在大型语言模型中对于 “涌现属性 ”的合理性检查

清华软件论坛 | 清华大学杰出访问教授樊文飞院士分享“AI = 机器学习 + 逻辑推理”

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

NeurIPS 2024 || GLBench: 面向大模型的图学习基准测试集

Token化一切，甚至网络！TokenFormer，Transformer从来没有这么灵活过！

【阿姆斯特丹博士论文】科学模拟的机器学习：推理与生成模型

基于LLM Graph Transformer的知识图谱构建技术研究：LangChain框架下的文本-图谱双模式转换机制实践

为什么卷积现在不火了：CNN研究热度降温的深层原因分析

【NeurIPS2024】SAFE: 慢速与快速参数高效调优用于基于预训练模型的持续学习

TSMamba：基于Mamba架构的高效时间序列预测基础模型

【阿姆斯特丹博士论文】在视觉挑战条件下的多模态学习

大数据系统软件国家工程研究中心共同主办首届北京数字人才发展大会

NeurIPS 2024 | 重新审视时间戳信息在时序预测中的作用

通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

基于MCMC的贝叶斯营销组合模型评估方法论：系统化诊断、校准及选择的理论框架

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

【NeurIPS2024】通过超球面能量最小化 CKA 增强贝叶斯深度学习中的多样性

数据派志愿者招募 | 寻找最志同道合的你！

综述 | 时空图神经网络模型在时间序列预测和分类中的应用

LoRA、完全微调到底有何不同？MIT 21页论文讲明白了

【NeurIPS2024】强化学习梯度作为在线微调决策变换器的维生素

报名 | 全球证书项目Innovation and Entrepreneurship for the Al Economy

NeurIPS 2024 | 经典GNNs是强有力的节点分类基线模型

从哈佛哲学系到蛋白质设计大师，David Baker：AlphaFold令我深刻认识到深度学习的力量

【CMU博士论文】交错离散搜索与连续优化用于运动规划中的动力学运动规划

IoTDB 航空航天解决方案：从制造到试飞，助力国之重器翱翔长空

深度学习工程实践：PyTorch Lightning与Ignite框架的技术特性对比分析

【CMU博士论文】使用数据不确定解释的可信学习

通知 | 清华大学大数据能力提升项目“RONG”奖学金开始申请啦！

一文解读：时序基础模型的缩放定律

基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

【NeurIPS2024】通过分解编码和条件控制增强文本到视频生成中的运动效果

原创 | 展望大语言模型在AGI时代的发展前景

10种数据预处理中的数据泄露模式解析:识别与避免策略

【阿姆斯特丹博士论文】缓解多任务学习中的偏差

清华软件论坛 | 樊文飞：AI = 逻辑推理 + 机器学习

勾股定理还能这样证明？高中生一连发现10种证明方法，陶哲轩点赞

基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例

【CELL】用AI智能体推动生物医学发现

科普之旅｜大语言模型与量子计算的融合

Github上的十大RAG(信息检索增强生成)框架

【NeurIPS2024】将连续潜在变量模型扩展为概率积分电路

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉