分类
成长之路

比特币的入门教程

比特币bitcoin诞生于2008年的一篇论文。

一个署名为中本聪的人,提出革命性的构想:让我们创造一种不受政府或其他任何人控制的货币!这个想法堪称疯狂:一串数字,背后没有任何资产支持,也没有任何人负责,你把它当作钱付给对方,怎么会有人愿意接受呢?

但是,狂想居然变成现实。随后几年,在全世界无数爱好者支持下,比特币网络运行起来了,越来越多的人、资本参与,星星之火,终成燎原。刚刚过去的2017,比特币迎来了爆发式的增长,从年初1000美元,最高涨到2万美元,全世界都为之震动,上到政府,下到普通百姓都在关注。事实是比特币已经并将继续改变世界。

新闻媒体们往往只关注它的火爆表现,忽视或无法回答一些基本的问题。

  • 比特币原理是什么?
  • 为什么这个无人管理的体系可以成功运作?
  • 比特币交易流程是怎么回事?
  • 它与区块链是什么关系?

下面,笔者尝试回答这些问题,希望能帮助大家理解比特币。抛开技术细节,还是很容易解释的。

提前说明,本文只讨论技术性问题,不涉及如何投资比特币,更不会预测价格的走势。事实上我也不知道,如果笔者知道怎么发财,可能就不会在这里写博客了。

非对称性加密

首先,要理解比特币,必须先理解非对称加密。

大家可能听说过这个词,所谓的非对称加密,其实非常简单,就是加密、解密需要两把钥匙:一把公钥、一把私钥。

公钥是公开的,任何人都可以获取。私钥是保密的,只有拥有者才可以使用。他人使用你的公钥加密信息,然后发送给你,你用私钥解密,取出信息。反之,也可以用私钥加密信息,别人使用你的公钥解开,从而可证明这个信息确实是你发出的,并且未被篡改,这就叫做数字签名。

现在请设想下:如果公钥加密的不是普通的信息,而是加密了一笔钱,发送给你,这会怎样?

首先,你可以解开加密包,取出里面的钱,因为私钥在你手里。其次,别人偷不走这笔钱,因为他们没有你的私钥。因此,支付可以成功。

这就是比特币及其他数字货币的原理:非对称加密保证了支付的可靠性。

由于支付的钱必须通过私钥取出,故你是谁并不重要,重要的是谁有私钥。只要拥有私钥,才能取出支付给你的钱。

比特币的钱包

对比特币来说,钱并不是支付给个人的,而是支付给某一把私钥。这就是交易匿名性根本原因,因为没人知道,那些私钥背后主人是谁。

所以,比特币交易的第一件事,就是必须拥有自己的公钥和私钥。

你去网上那些比特币交易所开户,它们会让你首先生成一个比特币钱包。这个钱包并不是用来存放比特币,而是存放你的公钥、私钥。软件会帮你生成这两把钥匙,然后放在钱包里面。

根据协议,公钥的长度是512位。这个长度不太方便传播,故协议又规定,要为公钥生成一个160位指纹。所谓指纹,就是一个比较短的、易于传播的哈希值。160位是二进制,写成十六进制,大约是26-35个字符,如1BvBMSEYstWetqTFn5Au4m4GFg7xJaNVN2。这个字符串就叫做钱包地址,且它是唯一的,即每个钱包的地址肯定都是不一样的。

向别人收钱时,只要告诉对方你的钱包地址即可,对方向你给的地址付款。由于你是这个地址的拥有者,所以会收到这笔钱。

而你是否拥有某个钱包地址,是由私钥证明,所以一定要保护好私钥。这点是极其重要的,如果你的私钥被偷,你的比特币就等于没了,因为他人可以冒用你的身份,把钱包里面的钱都转走。

同样,向他人支付比特币,千万不能写错他人钱包地址,否则你的比特币就支付到了另一个不同的人了。

交易过程

下面,把整个流程串起来,看看比特币如何完成一笔交易的。

一笔交易就是一个地址的比特币,转移到另一个地址。由于比特币交易记录全部都是公开的,哪一个地址拥有多少比特币,是可以查到的。因此,支付方是否拥有足够比特币,完成这笔交易,是可以轻易验证的。

问题是怎么防止其他人,冒用你的名义申报交易。举例来说,有人申报一笔交易:地址A向地址B支付10个比特币。我怎么知道这个申报是真的,申报人就是地址A的主人呢?

比特币的协议规定,在申报交易的时候,除了交易金额,转出比特币的一方必须提供以下数据。

  • 上一笔交易的Hash你从哪里得到这些比特币;
  • 本次交易双方地址;
  • 支付方的公钥;
  • 支付方私钥生成的数字签名。

验证这笔交易是否属实,需要三步。

  1. 找到上笔交易,确认支付方比特币来源;
  2. 算出支付方公钥的指纹,确认与支付方地址一致,从而保证公钥属实;
  3. 使用公钥解开数字签名,保证私钥属实。

经过上面三步,就能认定这笔交易是真实的。

交易确认与区块链

确认交易的真实性后,交易不算完成。交易数据必须写入到数据库,才算成立,对方才可以真正收到钱。

比特币用的是一种特殊的数据库,叫做区块链blockchain。

首先,所有的交易数据都会传送到矿工那里。矿工负责把这些交易写入区块链。

根据比特币的协议,一个区块大小最大是1MB,而一笔交易大概500字节左右,因此一个区块最多可以包含2000笔交易。矿工负责把这2000多笔交易打包在一起,组成一个区块,然后计算这个区块的Hash。

计算Hash的过程叫做采矿,这需要大量的计算。矿工之间也在竞争,谁先计算出Hash,谁就能第一个添加新区块进入区块链,从而享受这个区块全部收益,而其他矿工将一无所获。

一笔交易一旦写入了区块链,就无法反悔了。这里需要建立一个观念:比特币不存放在钱包或其他别的地方,而是只存在区块链上面。区块链记载了参与的每一笔交易,得到过多少比特币,你又支付了多少比特币,因此可以算出来你拥有多少资产。

矿工收益

交易的确认离不开矿工。为什么有人愿意做矿工?

比特币的协议规定,挖到新区块的矿工获得奖励,开始(2008年)是50个比特币,然后每4年会减半,目前(2018年)是12.5个比特币。这是比特币的供给增加机制,流通中新增的比特币都是这样诞生的。

可能看出来了,每4年奖励会减半,那么到了2140年,矿工将得不到任何奖励,比特币的数量也将停止增加。这时,矿工的收益就完全依靠交易手续费了。

所谓的交易手续费,就是矿工可以从每笔交易中抽成,具体金额由支付方自愿决定。完全可以一毛不拔,一分钱也不给矿工,但是那样的话,你的交易就会没人处理,迟迟无法写入到区块链,得到确认。矿工们总是优先处理手续费比较高的交易。

目前由于交易数量猛增,手续费已经水涨船高了,一个区块2000多笔交易的手续费总额可以达到3-10个比特币。如果你的手续费给低了,可能过了一个星期,交易还没确认。

一个区块奖励金12.5个比特币,再加上手续费,收益是相当可观的。按照目前价格,可达到100-200万人民币。想想看运气好的话,几分钟就可以挖到一个区块,拿到这样一大笔钱,怪不得人们对挖矿趋之若鹜。

区块扩容

比特币的协议规定,平均10分钟会诞生一个区块。区块的大小只有1MB,最多能包含2000多笔交易。也就是说,比特币网络的每10分钟,最多能处理2000多笔交易,换算一下,就是处理速度3-5笔每秒。

全世界的比特币交易这么多,可是区块链每秒最多能处理5笔,这就成为制约比特币发展的一个瓶颈。

很早有人呼吁,改革比特币的协议,提升处理速度。这件事在2017年8月有了一点眉目,当时区块链发生了一次分叉,诞生了一个新协议,称为Bitcoin Cash简称BCH。这种新货币其他方面都与比特币一致,就是每个区块的大小从1MB增加到了8MB,因此处理的速度提升了8倍,手续费低得多。该协议是对原有区块链分叉,故当时持有比特币的人,等于每个人获赠了一份同样数量的BCH。

BCH等于创造了一种新的货币,而且有人提议,原始比特币的区块大小提升到2MB,这称为SegWit2x。这个建议原定2017年11月实施,但是最后一刻由于缺乏共识,被取消了,而目前还在讨论中。

点对点的网络

比特币是一个全世界的开放网络,只要有服务器,就能加入这个网络,成为一个节点。每个节点都包含整个区块链,并且节点之间时刻不停地在同步信息。

当发生了一笔支付,你所在的节点就会把这笔交易告诉另一个节点,直至传遍整个网络。矿工从网络上收集各种新发生的交易,将它们打包写入区块链。一旦写入成功, 矿工所在节点的区块链,就会成为最新版本,其他节点都会来复制新增的区块,保证全网区块链都是一致的。

最后,你所在的节点也拿到了最新的区块链,从而得知你早先的那笔交易,已经写在里面,至此交易确认成功。

分类
成长之路

区块链的入门教程

区块链是眼下的大热门,新闻媒体大量报道,宣称它将创造未来。

可是,简单易懂的入门文章却很少。区块链到底是什么,有何特别之处,网络上很少有解释。

毕竟它不是很难的东西,核心概念非常简单,几句话就能说清楚。希望读完本文,你不仅可以理解区块链,还可以明白什么是挖矿、为什么挖矿越来越难等问题。

需要说明的是,笔者并非这方面的专家。虽然很早就关注区块链,但是仔细地了解区块链,还是从今年初开始。文中的错误和不准确的地方,欢迎大家指正。

区块链的本质

区块链是什么?简单的一句话,它是种特殊的分布式数据库。

首先,区块链主要作用是储存信息。任何需保存的信息,都可以写入区块链,也可以从里面读取,所以说它是数据库。

其次,任何人都能架设服务器,并加入区块链网络,成为一个节点。区块链的世界里面,没有中心节点,每一个节点都是平等的,并且保存着整个数据库。你可以向任何一个节点,写入或是读取数据,因为所有节点最后都会同步,保证区块链的一致。

区块链的最大特点

分布式数据库并不是新发明,市场上早已有此类产品。但是,区块链有一个革命性的特点:区块链没有管理员,它是彻底无中心的。

其他数据库都有管理员,但区块链没有。如果有人想要对区块链添加审核,也实现不了的,因为它设计目标就是防止出现居于中心地位的管理当局。

正是因为无法管理,区块链才能做到无法被控制。否则一旦大公司大集团控制了管理权,他们就会控制整个平台,其他使用者就都必须听命于他们。

但是,没有了管理员,人人都可以往里面写入数据,怎么才能保证数据是可信的?被坏人改了怎么办?请接着往下读,这是区块链奇妙的地方。

区块

区块链由一个个区块block组成。区块很像数据库的记录,每次写入数据,就是创建一个区块。

每个区块包含两个部分。

  • 区块头Head:记录当前区块的特征值;
  • 区块体Body:实际数据。

区块头包含了当前区块的多项特征值。

  • 生成时间;
  • 实际数据即区块体的hash;
  • 上一个区块的哈希.

这里,你需要理解什么叫哈希,这是理解区块链必需的。

所谓哈希就是计算机可以对任意内容,计算得出一个长度相同的特征值。区块链哈希长度是256位,这就是说,不管原始的内容是什么,最后都会计算出一个256位二进制数字。而且可以保证,只要原始内容不同,对应哈希一定是不同的。

举例来说,字符串123的哈希值是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0十六进制,转换成二进制就是256位,而且只有123能得到这个哈希。

因此,就有两个重要推论:

  1. 每个区块哈希都是不一样的,可以通过哈希标识区块;
  2. 如果区块的内容改变了,它的哈希一定跟着改变。

Hash不可修改性

区块与哈希是一一对应,每个区块的哈希都是针对区块头Head计算的。也就是说,把区块头的各项特征值,按照一定的顺序连接在一起,组成一个很长的字符串,再通过这个字符串计算哈希。

Hash=SHA256区块头

上面就是区块哈希计算公式,SHA256是区块链的哈希算法。注意,这个公式里面只包含区块头,不包含区块体,也就是说,哈希由区块头唯一决定。

前面说过,区块头包含了很多内容,其中有当前区块体哈希,还有上一个区块的哈希。这意味着,如果当前区块体的内容变了,或者上一个区块的哈希变了,一定会引起当前区块的哈希改变。

这一点对区块链有重大意义。如果有人修改一个区块,该区块哈希就变了。为了让后面区块还能连到它,该人必须依次修改后面所有区块,否则被改掉的区块就脱离区块链。由于后面要提到的原因,哈希的计算很耗时,短时间内修改多个区块几乎不会发生,除非有人掌握全网51%以上的计算能力。

正是通过这种联动机制,区块链保证了自身的可靠性,数据一旦写入,就无法被篡改。就像历史一样,发生了就是发生了,从此无法改变。

每个区块都连着上一个区块,这也是区块链这个名字由来。

采矿

由于必须保证节点之间同步,所以新区块的添加速度不能太快。试想一下,你刚刚同步了一个区块,准备基于它生成下一个区块,但这时别的节点又有新区块生成,不得不放弃做了一半的计算,再去同步。因为每一个区块的后面,只能跟着一个区块,永远只能在最新区块的后面,生成下个区块。所以,别无选择,听到信号,必须立刻同步。

所以,区块链的发明者中本聪故意让添加新区块,变得非常困难。他的设计,平均每10分钟,全网才可以生成一个新区块,一小时就六个。

这种产出速度并不是通过命令达成的,而是故意设置了海量的计算。也就是说,只有通过极其大量计算,才可以得到当前区块的有效哈希,从而把新区块添加到区块链。因计算量太大,所以快不起来。

这个过程就叫做采矿mining,因为计算有效哈希值的难度,就好比在全世界的沙子里面,找到一粒符合条件沙子。计算哈希的机器就叫做矿机,操作矿机的人叫做矿工。

难度系数

读到这里,可能会有一个疑问,人们都说采矿很难,可是采矿不就是用计算机算出一个哈希吗,这正是计算机的强项啊,怎么变得很难,迟迟算不出呢?

原来不是任意一个哈希都可以用,只有满足条件的哈希值才会被区块链接受。这个条件特别苛刻,使得绝大部分哈希都不满足要求,必须重算。

原来,区块头包含一个难度系数difficulty,这个值决定计算哈希的难度。举例来说,第100000个区块的难度系数是14484.16236122。

区块链的协议规定,使用一个常量除以难度系数,可以得到目标值target。显然,难度系数越大,目标值就越小。

哈希的有效性跟目标值密切相关,只有小于目标值的哈希是有效的,否则哈希无效,必须重算。由于目标值非常小,哈希小于该值机会极其渺茫,可能需计算10亿次,才会算中一次。这就是采矿如此之慢的根本原因。

前面说过,当前区块的哈希由区块头唯一决定的。如果要对同一区块反复计算哈希,就意味着,区块头必须不停地变化,否则不可能算出不一样的哈希值。区块头里面所有的特征值都是固定的,为了让区块头产生变化,中本聪故意增加了一个随机项叫做Nonce。

Nonce是个随机值,矿工的作用其实就是猜出Nonce的值,使区块头的哈希可以小于目标值,从而能够写入到区块链。Nonce是很难猜的,目前只能通过穷举法一个个试错。根据协议,Nonce是一个32位二进制值,即最大可以到21.47亿。第100000个区块的Nonce值是274148111,可理解成,矿工从0开始,一直计算了2.74亿次,才得到了一个有效Nonce值,使算出的哈希能够满足条件。

运气好的,也许一会就找到Nonce。运气不好的话,可能算完了21.47亿次,都没有发现Nonce,即当前区块体不可能算出满足条件的哈希。这时,协议会允许矿工改变区块体,开始新的计算。

难度系数动态调节

正如上节所说,采矿有随机性,没法保证正好每十分钟产出一个区块,有时一分钟就算出来了,有时几个小时可能也没结果。总体来看,随着硬件设备提升,以及矿机数量增长,计算的速度一定会越来越快。

为了能将产出速率恒定在十分钟,中本聪还设计了难度系数的动态调节机制。规定难度系数两周(2016个区块)调整一次。如果在这两周里面,区块平均生成速度是9分钟,就意味着比法定速度快了10%,因此接下来的难度系数要调高10%;如果平均生成速度是11分钟,就意味着比法定速度慢了10%,因此接下来的难度系数要调低10%。

难度系数越调越高,导致采矿越来越难。

区块链的分叉

就算区块链是很可靠的,现在还有一个问题没有解决:如果有两个人同时向区块链写入数据,也就是说,同时两个区块加入,因为它们都连着前一个区块,就形成了分叉。这时应该采纳哪一个区块呢?

现在的规则是,新节点总是采用最长的那一条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块称为六次确认。按照每10分钟一个区块计算,一小时就可以确认。

由于新区块生成速度由计算能力决定,所以这条规则是说,拥有大多数计算能力的那条分支,就是正宗的区块链。

总结

区块链作为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。这证明它是可行的。

但是,为了保证数据的可靠性,区块链也有自己的代价。一是效率,数据写入到区块链,最少要等待十分钟,所有节点都要同步数据,则需要更多的时间;二是能耗,区块生成需要矿工进行无数无意义的计算,这是非常耗能源的。

因此,区块链的适用场景,其实非常有限。

  1. 不存在所有成员都信任管理当局;
  2. 写入的数据不要求实时使用;
  3. 挖矿的收益能够弥补本身的成本。

如果无法满足上述条件,那么传统的数据库是更好的解决方案。

目前,区块链最大的应用场景,就是以比特币为代表的加密货币。