陈利人:深入以太坊精髓

2018 年 6 月 8 日 乌镇智库


以太坊是比特币的全面改进, 以太坊从2014年初次开始众筹,其主要卖点就是”智能合约”。所以”智能合约” 是主导以太坊设计架构的核心理念,沿着这个核心理念出发, 我们就很容易厘清整个以太坊的设计脉络。


首先”智能合约”的最终目标是实现去中心化应用(DAPP),就决定了底层是构建在传统区块链的基础设施之上。



乌镇智库CTO

卡内基梅隆大学计算机科学硕士

前奇虎360移动搜索技术负责人

盘古搜索CTO

人民搜索CTO

前Google搜索CJK(中日韩)技术负责人和软件工程师

——

陈利人



智能合约与账户类型/账户状态转换

...


Merkle Tree

首先 Merkle Tree 的天然属性就使得在新旧区块之间的只用存储变化了状态子树,而不是重新存储整个结构。

为了防止构造恶意的数据结构,使用Keccake256散列值做为树的键值, 这一就导致了使用Patricia Tree做为优化的必要性。

于是Secure MPT这个拧巴的数据结构就诞生了。

i. 比特币以及其变种, 使用了一种特殊的账户状态转换模型 UTXO unspent transaction outputs。整个系统的收支状态信息都保存在所有这些UTXO中。在每一个交易中都会消耗一部分UTXO,然后再产生一些新的UTXO, UTXO 是和用户地址绑定的。

ii. UTXO 带来一个问题,智能合约需要一个执行的主体.在UTXO模型中,同一个主体可以拥有多个地址,对于智能合约而言, 最简单直接的方案还是使用单一账户模型而不是UTXO,尤其是在引入Gas来限制计算工作量之后,如果智能合约还需要去实时计算(和解锁)多地址的UTXO可用token数量来判断合约是否可以继续执行,就太繁琐低效了。最终以太坊采用的是合约账户这一单一的执行主体,同时为了配合合约账户, 外部账户也使用单一的账户记账模式,简化了设计。因为执行合约时,同样外部账户需要转账支付Gas以执行合约。

iii. 同时还要考虑到节省空间,UTXO本身就非常占用空间,因为同一个用户可能需要引用多个UTXO,以太坊加入了智能合约,那么增加了很多其它的metadata要存储(例如输入数据,log)必须要找到一个节省空间的方案。

iv. 单一账户模式需要引入nonce来防止重放攻击,所以这里也做了防御性的设计。

v. 引入了单一账户模式后, 整个存储状态的数据结构得设计也就自然而然的引入了基于Secure Merkle Patricia Tree的设计。



智能合约要求图灵完备的解决方案

...

图片|来源网络

i. 灵活的智能合约编程语言当然最好是图灵完备的。但是图灵完备就需要计算每一个指令消耗的计算资源(防止滥用,例如deadloop),于是Gas的设计就应运而生。

ii. 考虑到合约间调用等各种复杂场景,引入了非常多的规则来规范Gas的消耗量计算。(整套规则非常复杂,例如合约suicide 这个场景)

iii. 合约执行会在中途失败,也需要引入各种log以备回滚。

iv. 同时这个Gas必须要和token链接起来,所以Gas还有一个价格,当然是以ether来计算的。

v. 同时也导致整个块的大小不是固定的,而是由这个块整体所能包含的Gas数量来决定的。



智能合约执行的虚拟机

...

图片|来自网络

    因为智能合约一个最终的主要作用就是根据特定的编写的逻辑,来更改对应的全局存储,例如余额。但是同时还是需要许多临时的状态来辅助。(临时状态访问比较快捷)

i. 为了执行智能合约就需要区分全局存储和临时存储。临时存储的生命周期只限于虚拟机实例开始执行到执行结束。永久存储以每个账户为划分单位存在于区块链上(storage trie)。

ii. 要负责进行所有的Gas规则的检查。

iii. 要向智能合约编程语言提供所有的全局状态量查询结构。

iv. 需要提供特定的密码学计算接口,比如keccak。



智能合约的编程语言除了基本的功能以外

...

i. 理所当然的,这个编程语言需要是面向合约的。

ii. 合约也理所当然的应该有一个创建人和所有人。

iii. 合约应该可以接收转账,也可以向其它合约和外部账户转账。

iv. 该编程语言需要区分全局存储和临时存储。

v. 该编程语言需要一个便捷的对外接口ABI。

vi. 该编程语言的设计必须是安全的, 合约是可以形式化验证的。

综上所述,智能合约的概念影响到以太坊所有关键组件的设计,渗透到了每一个具体的设计之中,只要抓住这一个核心理念,提纲携领,顺藤摸瓜,就会大大加速你对以太坊设计框架的理解。


乌镇智库 资讯推荐

CVPR2018:剑桥大学等研发“暴力行为”检测系统,用无人机精准识别人群暴力

【万字长文深度解读】IIoT工业互联网的下一站,通过场景智能PI连接数据和未来

NAACL2018|最佳论文:艾伦人工智能研究所提出新型深度语境化词表征


推荐阅读

比人工智能威胁更可怕的是,那些曾被你抛弃的互联网软件

尼克谈人工智能的历史、现实与未来


登录查看更多
0

相关内容

【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
35+阅读 · 2020年4月26日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
130+阅读 · 2020年3月25日
专知会员服务
59+阅读 · 2020年3月19日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
78+阅读 · 2020年3月4日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
防代码泄漏的监控系统架构与实践
FreeBuf
5+阅读 · 2019年4月30日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
17+阅读 · 2018年12月21日
OLAP引擎这么多,为什么苏宁选择用Druid?
51CTO博客
12+阅读 · 2018年12月20日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
【动画连载】3分钟了解什么是区块链(中文动画)
Arxiv
6+阅读 · 2020年2月15日
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
Arxiv
4+阅读 · 2018年2月19日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
12+阅读 · 2018年1月28日
VIP会员
相关VIP内容
【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
35+阅读 · 2020年4月26日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
130+阅读 · 2020年3月25日
专知会员服务
59+阅读 · 2020年3月19日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
78+阅读 · 2020年3月4日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
相关资讯
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
防代码泄漏的监控系统架构与实践
FreeBuf
5+阅读 · 2019年4月30日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
17+阅读 · 2018年12月21日
OLAP引擎这么多,为什么苏宁选择用Druid?
51CTO博客
12+阅读 · 2018年12月20日
Flink 靠什么征服饿了么工程师?
阿里技术
6+阅读 · 2018年8月13日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
【动画连载】3分钟了解什么是区块链(中文动画)
Top
微信扫码咨询专知VIP会员