CNN适合识别模式,固定长度的俗语,他是一种前馈网络模型,而RNN适合句子,适合sequence的生成,在机器翻译任务中扮演重要角色.总的来说,神经网络伴随着大数据将之前10多年的马尔可夫假设变得过时....
[Read More]
表示论
Frankel的那本数学科普书籍不能...
[Read More]
范畴论
数学不是铁板一块,如果需要软性的饮料,那么每年的欧拉图书奖正是为此而准备的....
[Read More]
Transformer,你所需要的只有注意力
除了回顾历史RNN外,我们直接研究Attention...
[Read More]
理解LSTM 网络
如果算法可以记忆,哪怕是很小的一段时间,那么根据这一段记忆能否做点什么工作?...
[Read More]