LSTM 的计算过程

张开发

• 2026/6/3 11:53:43 • 15 分钟阅读

分享文章

1. 为什么把 MLP 改成 LSTMMLP 更适合处理固定长度、一次性输入的数据。当任务变成序列建模时模型需要记住“前面发生过什么”这时 LSTM 更合适。因此这里把前面的 MLP 示例改成一个标量版 LSTM用 Excel 展示每个时间步的门控计算过程。配套文件LSTM计算过程.xlsx—## 2. 示例设定- 序列长度3- 每个时间步输入维度1- 隐藏状态维度1- 细胞状态维度1- 最后再接一个输出层得到预测值y_hat输入序列| 时间步 | 输入值 ||—|—:|| x1 | 0.5000 || x2 | 0.8000 || x3 | -0.1000 |初始状态| 变量 | 数值 ||—|—:|| h0 | 0.0000 || c0 | 0.0000 || y_true | 1.0000 |—## 3. LSTM 核心公式对每个时间步t-i_t σ(W_ix*x_t W_ih*h_(t-1) b_i)-f_t σ(W_fx*x_t W_fh*h_(t-1) b_f)-g_t tanh(W_gx*x_t W_gh*h_(t-1) b_g)-o_t σ(W_ox*x_t W_oh*h_(t-1) b_o)-c_t f_t*c_(t-1) i_t*g_t-h_t o_t*tanh(c_t)最终输出层-z_y W_y*h_T b_y-y_hat σ(z_y)—## 4. 参数设置### 门控参数| 参数 | 数值 ||—|—:|| W_ix | 0.7000 || W_ih | 0.5000 || b_i | 0.1000 || W_fx | -0.4000 || W_fh | 0.2000 || b_f | 0.3000 || W_gx | 0.6000 || W_gh | -0.1000 || b_g | 0.0000 || W_ox | 0.9000 || W_oh | 0.4000 || b_o | -0.2000 || W_y | 1.2000 || b_y | 0.0500 |—## 5. 逐时间步计算结果| t | x_t | h_(t-1) | c_(t-1) | i_t | f_t | g_t | o_t | c_t | h_t ||—|—————————:|| 1 | 0.500000 | 0.000000 | 0.000000 | 0.610639 | 0.524979 | 0.291313 | 0.562177 | 0.177887 | 0.098962 || 2 | 0.800000 | 0.098962 | 0.177887 | 0.670286 | 0.499948 | 0.438283 | 0.636356 | 0.382710 | 0.232307 || 3 | -0.100000 | 0.232307 | 0.382710 | 0.536473 | 0.595431 | -0.083039 | 0.450890 | 0.183329 | 0.081747 |—## 6. 最终输出-z_y 0.148097-y_hat 0.536957-L 1/2 * (y_hat - y_true)^2 0.107205—## 7. Excel 文件说明工作簿中包含 4 个工作表1.说明模型背景与使用方式 2.参数设置输入序列、初始状态、各门参数 3.时序计算逐时间步展示 i_t、f_t、g_t、o_t、c_t、h_t 4.结果解读解释为什么 LSTM 比 MLP 更适合序列任务 —## 8. 这个表格适合怎么用- 修改参数设置中的蓝色单元格- 查看各时间步门值如何变化- 观察c_t与h_t如何在时间维度上传递- 对比 MLP 与 LSTM前者一次处理输入后者逐步保留和更新记忆这样就能直观看到MLP 是静态映射LSTM 是带记忆的动态映射。

更多文章

前端开发 2026/5/7 5:49:27

如何配置RMAN使用第三方备份软件接口_NetBackup或Commvault的MML层整合

Oracle与第三方MML库兼容需满足版本、架构、glibc、TLS等严格对齐，通过ldd检查依赖、bpgetconfig/qlogin验证注册与连通性，并正确配置SBT_LIBRARY、PARMS及超时参数。确认 Oracle 和第三方 MML 库是否兼容oracle rman 通过 sbt（system backup…

张开发

前端开发 2026/5/10 7:40:48

如何利用Python脚本在业务低谷期自动整理MongoDB碎片_定时发送compact命令并监控释放的存储空间

compact命令仅支持WiredTiger引擎且须在副本集主节点显式启用；PyMongo调用需禁用retryWrites并设socketTimeoutMS0；释放空间看storageSize而非dataSize；执行前须校验主节点状态、引擎类型、权限及业务负载。compact 命令不能直接在副本集主节…

张开发

前端开发 2026/5/6 4:05:54

Go语言怎么嵌套结构体_Go语言结构体嵌套教程【深入】

Go嵌套结构体需警惕字段冲突、nil panic、JSON tag不继承、零值误判四大陷阱：应显式命名避冲突，检查nil再访问，内层写json tag，敏感字段用指针或Valid标记。Go 语言嵌套结构体不是“要不要用”的问题，而是“怎么嵌套才…

张开发

前端开发 2026/4/21 14:31:12

雀魂AI辅助工具完整指南：免费开源实时麻将策略分析神器

雀魂AI辅助工具完整指南：免费开源实时麻将策略分析神器【免费下载链接】Akagi 支持雀魂、天鳳、麻雀一番街、天月麻將，能夠使用自定義的AI模型實時分析對局並給出建議，內建Mortal AI作為示例。 Supports Majsoul, Tenhou, Riichi City, Amat…

张开发

前端开发 2026/5/29 4:50:02

语言必学算法：冒泡排序超详细讲解，从原理到优化一次吃透

学 C 语言，绕不开的第一个算法就是冒泡排序。它简单、经典、面试常问，也是所有新手建立 “算法思维” 的第一道门。今天我把冒泡排序从原理→代码→优化→场景一次性讲透，看完你再也不会忘。一、什么是冒泡排序？为什么叫 “冒泡…

张开发

前端开发 2026/5/21 4:13:09

深度解析：中兴光猫设备管理工具的逆向工程实现机制

深度解析：中兴光猫设备管理工具的逆向工程实现机制【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 在网络设备管理领域，中兴光猫设备管理工具通过逆向工程实现机…

张开发

前端开发 2026/5/3 14:10:41

深度解析UnityLive2DExtractor：高效提取Live2D Cubism 3资源的专业方案

深度解析UnityLive2DExtractor：高效提取Live2D Cubism 3资源的专业方案【免费下载链接】UnityLive2DExtractor Unity Live2D Cubism 3 Extractor 项目地址: https://gitcode.com/gh_mirrors/un/UnityLive2DExtractor UnityLive2DExtractor是一款专门用于从U…

张开发

前端开发 2026/4/21 7:39:05

Shopee商品数据API解析与Java实现

1. Shopee API接口概述与合规调用指南 Shopee作为东南亚领先的电商平台，其公开API为开发者提供了获取商品数据的合法途径。与直接爬取网页数据不同，API调用具有明确的权限控制和访问频率限制，更符合平台规则。在开始技术实现前，有…

张开发

前端开发 2026/5/4 3:30:09

机器人时间最优轨迹规划：toppra如何解决工业自动化中的运动约束挑战

机器人时间最优轨迹规划：toppra如何解决工业自动化中的运动约束挑战【免费下载链接】toppra robotic motion planning library 项目地址: https://gitcode.com/gh_mirrors/to/toppra 在工业机器人自动化领域，轨迹规划面临的核心挑战是如何在满足…

张开发

前端开发 2026/4/22 16:35:31

Visual C++ Redistributable AIO：一站式解决Windows DLL依赖问题的最佳方案

Visual C Redistributable AIO：一站式解决Windows DLL依赖问题的最佳方案【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经在运行某些软件时…

张开发