x0结果输出时,不仅会直接输出h0,还有一部分会与x1进行融合从而输出h1,x2时也同理,这样网络就会考虑到时间的前后信息
但如果输入信息很多,到x10000,那么x0的信息还需要考虑吗,有可能就根本不重要,所以就引入了LSTM(长短时记忆网络)
C为控制参数决定什么样的信息会被保留什么样的会被遗忘
⊗⊕是门,是一种让信息选择式通过的方法
x0结果输出时,不仅会直接输出h0,还有一部分会与x1进行融合从而输出h1,x2时也同理,这样网络就会考虑到时间的前后信息
但如果输入信息很多,到x10000,那么x0的信息还需要考虑吗,有可能就根本不重要,所以就引入了LSTM(长短时记忆网络)
C为控制参数决定什么样的信息会被保留什么样的会被遗忘
⊗⊕是门,是一种让信息选择式通过的方法