博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
受限的波尔兹曼机的简单了解知识
阅读量:5806 次
发布时间:2019-06-18

本文共 799 字,大约阅读时间需要 2 分钟。

如果万一大家不小心检索到了本篇文章,为了不浪费大家的时间,请大家直接看  , 写在很好,太好好好!!!(本篇内容仅仅用于我的自我复习)

 

长什么样?

它长这样子:

 

它的特点: 在给定可见层单元状态(输入数据)时,各隐层单元的激活条件独立,反过来看,在给定隐层单元状态时,可见层单元的激活条件也是独立的。

其中的参数:可见层用V表示,隐含层用H表示,可见层的偏置用a表示,隐含层的偏置用b表示,权值矩阵用W表示。

它是什么东西:它就是一个随机网络模型, 给定输入层,一定的条件概率下映射到隐含层;然后再根据一定的概率映射出来,结果尽可能与原始的输入相同。  一切都是建立在概率上!!!!

   说实话,这是什么玩意啊,它能干什么啊。 我目前真的不是很清楚啊。

 

它的概率是如何定义的?

它的概率的定义借鉴了基于能量的统计学分布。  当系统处于状态 i 时,它的能量用Ei 来表示,那么请问处于状态 i 的概率为多少呢??用下式表示:

,  其中

所以呢,把我们把这个统计学的分布应用于我们的受限的波尔北曼机时,如何定义它的能量函数是很重要的了。

下面是能量函数的定义公式,为什么这么定义呢?不是很明白啊。我感觉吧:可能怎么定义都可以吧,能够自圆其说就可以吧。反正就是自己定义的了。定义不同的能量函数,最后训练出来的网络的参数不同嘛,最后的分布应该是不变的,因为我们就是朝着它的分布而去训练的网络啊。。

利用这个能量函数,定义出受限有波尔兹曼机的状态概率:给定状态(v,h), 它的联合概率为:

,其中,

 

一些相关的概率:(来自:,很清晰的推导过程,写的太棒了,

其中的一个推导过程:

 

 

如何训练的问题:

 

 

 

 

 

为什么我感觉对比散度算法与Gibbs采样没有区别啊就是把随机的初始值变为了样本值了吧(意思就是现在的样本是符合平稳的马尔可夫链的分布的)。

 

 

不先写了,有一些问题想不明白。。不先写了,有一些问题想不明白。。

 

参考资料:

 

转载地址:http://ewubx.baihongyu.com/

你可能感兴趣的文章
centos7安装cacti-1.0
查看>>
3个概念,入门 Vue 组件开发
查看>>
没有JS的前端:体积更小、速度更快!
查看>>
数据指标/表现度量系统(Performance Measurement System)综述
查看>>
GitHub宣布推出Electron 1.0和Devtron,并将提供无限制的私有代码库
查看>>
Angular2, NativeScript 和 React Native比较[翻译]
查看>>
论模式在领域驱动设计中的重要性
查看>>
国内首例:飞步无人卡车携手中国邮政、德邦投入日常运营
查看>>
微软将停止对 IE 8、9和10的支持
查看>>
微服务架构会和分布式单体架构高度重合吗
查看>>
如何测试ASP.NET Core Web API
查看>>
《The Age of Surge》作者访谈
查看>>
测试人员的GitHub
查看>>
Spring Web Services 3.0.4.RELEASE和2.4.3.RELEASE发布
查看>>
有关GitHub仓库分支的几个问题
查看>>
无服务器计算的黑暗面:程序移植没那么容易
查看>>
云原生的浪潮下,为什么运维人员适合学习Go语言?
查看>>
Webpack入门教程三十
查看>>
EAServer 6.1 .NET Client Support
查看>>
锐捷交换机密码恢复(1)
查看>>