最新消息:非无江海志,潇洒送日月

科学研究

马尔可夫链蒙特卡洛(MCMC)采样详解

江海志 3周前 (07-03) 59浏览 1评论

这几天在看有关multimodal learning(多模态学习)的一些内容,随之就牵扯出了boltzman机,mcmc(马尔可夫链蒙特卡洛)采样等一系列内容。总之mcmc采样是ml领域非常重要的一个理论,此外,目前能找到的书籍或网络资源很多说的都不是很清楚。所以我决定为此专门写一篇博客。 要去讲清楚一个算法或一个模型,通常首先得明确两点,一是使用它的背景,二是更具针对性的该...

马尔可夫链及吉布斯抽样(Markov Chain Monte Carlo and Gibbs Sampling)详解

马尔可夫链及吉布斯抽样(Markov Chain Monte Carlo and Gibbs Sampling)详解

江海志 3周前 (06-29) 54浏览 0评论

马尔可夫链及吉布斯抽样(Markov Chain Monte Carlo and Gibbs Sampling)详解 理解MCMC及一系列改进采样算法的关键在于对马尔科夫随机过程的理解。更多详尽的讨论请参见 重温马尔科夫随机过程。 对于给定的概率分布 ,我们希望能有便捷的方式生成它()对应的样本。由于马氏链能收敛到平稳分布,于是一个很nice的想法(by Metropolis,...

极大似然算法maximum likelihood 以及 EM算法详解

极大似然算法maximum likelihood 以及 EM算法详解

江海志 4周前 (06-25) 46浏览 0评论

机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光。 我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明...

什么是P问题、NP问题,NPC问题和NP-hard问题

江海志 1个月前 (06-19) 56浏览 0评论

这或许是众多OIer最大的误区之一。 你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所说的NP问题其实都是指的NPC问题。他们没有搞清楚NP问题和NPC问题的概念。NP问题并不是那种“只有搜才行”的问题,NPC问题才是。好,行了,基本上这个误解已经被澄清了。下面的内容都是在讲什么是P问题,什么是NP...

详细分析HTTPS 原理以及为什么要这么做

详细分析HTTPS 原理以及为什么要这么做

江海志 4个月前 (03-31) 209浏览 0评论

前言 HTTPS(全称:HyperText Transfer Protocol over Secure Socket Layer),其实 HTTPS 并不是一个新鲜协议,Google 很早就开始启用了,初衷是为了保证数据安全。 近两年,Google、Baidu、Facebook 等这样的互联网巨头,不谋而合地开始大力推行 HTTPS, 国内外的大型互联网公司很多也都已经启用了全...

关于泊松分布的理解

江海志 4个月前 (03-16) 329浏览 0评论

首先必须由二项分布引出: 如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数有可能是 0 次、1 次 …… n次。成功 i 次的概率是: ( n 中选出 i 项的组合数) * p ^ i * (1-p)^ (n-i) 以上公式很容易推导,用一点概率学最基本的知识就够了。因为每一特定事件成功的概...

GPG的生成随机数的原理思考

江海志 4个月前 (03-14) 311浏览 0评论

“随机数”不等于“随便产生的数”。 用于密码学的“真随机数”必须满足其分布为平均分布(uniform random distribution)这个要求。而这个,在技术实现上是很难的,采样、启动噪声源都是导致随机bit产生的速度远远慢于“随便弄个数”的原因。 “伪随机”(pseudorandom)的字面意思是说,“看起来像真随机”。 学界已经有很多怎么把...

stack frame栈帧简介

stack frame栈帧简介

江海志 4个月前 (03-13) 339浏览 0评论

0x01 栈帧是什么 “IA32 programs make use of the program stack to support procedure calls”. “IA32程序使用程序栈帧来支持子程序调用”(出自CSAPP,即《深入理解计算机系统》) 个人理解,栈帧就是内存的一段数据,在内存栈区域,对子程序的数据进行一个临时保存。 什么是栈? 栈和堆类似,都是操作系统中...

程序或-内存区域分配(五个段)

程序或-内存区域分配(五个段)

江海志 4个月前 (03-13) 298浏览 0评论

一. 在学习之前我们先看看ELF文件。 ELF分为三种类型:.o 可重定位文件(relocalble file),可执行文件以及共享库(shared library),三种格式基本上从结构上是一样的,只是具体到每一个结构不同。下面我们就从整体上看看这3种格式从文件内容上存储的方式,spec上有张图是比较经典的:如上图: 其实从文件存储的格式来说,上面的两种view实际上是一样...

ELF文件格式解析

ELF文件格式解析

江海志 4个月前 (03-13) 313浏览 0评论

1. ELF文件简介 首先,你需要知道的是所谓对象文件(Object files)有三个种类: 可重定位的对象文件(Relocatable file) 这是由汇编器汇编生成的 .o 文件。后面的链接器(link editor)拿一个或一些 Relocatable object files 作为输入,经链接处理后,生成一个可执行的对象文件 (Executable file) 或...

动态链接库中的.symtab和.dynsym

江海志 4个月前 (03-13) 327浏览 0评论

shared library (.so) “Program Library Howto-Shared Libraries“是很好的材料, 下面的内容多是据此整理的. 定义: Shared libraries are libraries that are loaded by programs when they start. 使用shared librar...

英特尔SGX侧信道攻击 (side-channel attacks) 综述

英特尔SGX侧信道攻击 (side-channel attacks) 综述

江海志 5个月前 (03-03) 586浏览 0评论

Intel SGX 技术是一种新的基于硬件的可信计算技术。该技术通过CPU的安全扩展,对用户空间运行环境(enclave)提供机密性和完整性保护。即使是攻击者获得OS,hypervisor,BIOS 和SMM 等权限,也无法直接攻击enclave。因此,攻击者不得不通过侧信道的攻击方法来间接获取数据(比如隐私数据,加密密钥等等)。得益于enclave 的强安全假设和工作模型,攻...

Intel SGX 新技术学习研究资料总结

江海志 5个月前 (03-03) 345浏览 0评论

SGX是Intel开发的新的处理器技术,可以在计算平台上提供一个可信的空间,保障用户关键代码和数据的机密性和完整性,从SGX提出后,其吸引了一批系统和网络安全的研究者,NCCGroup的博客对SGX方面的资料进行了一个初步的总结,对研究者学习SGX技术具有很好的引导作用。这里主要根据该博文对SGX进行简单的整理。 目前并没有基于SGX的产品出现,不过学术界已经给出了一些应用来说...

HTTP/2之服务器推送(Server Push)实例分析

HTTP/2之服务器推送(Server Push)实例分析

江海志 5个月前 (03-02) 334浏览 0评论

HTTP/1.X出色地满足互联网的普遍访问需求,但随着互联网的不断发展,其性能越来越成为瓶颈。IETF在2015年发布了HTTP/2标准, 着重于提高HTTP的访问体验, HTTP2优势主要包括: 二进制传输、头部压缩、多路复用和服务器推送(Server Push)。 截止目前, 大部分CDN厂商已经宣布支持HTTP/2,然而”支持”大多省略了服务器推送(ServerPush)...