月亮链 月亮链
Ctrl+D收藏月亮链
首页 > MATIC > 正文

PRY:以太坊Medalla测试网“崩溃”事件始末_EDA

作者:

时间:1900/1/1 0:00:00

译者注:

请运行Prysm客户端的用户尽快升级到Alpha.23版本:

https://github.com/prysmaticlabs/prysm/releases

本期是wnie2计划之外的更新,将针对周末Eth2Medalla测试网发生的插曲进行回顾和分析。

我们在差不多两周前启动了Medalla,也就是8月4日,这是一个大型的、公开的多客户端测试网,运行Eth2主网规范。关于Medalla测试网的介绍,可以参阅上期。

测试网平稳运行了10天,即使验证者参与率比我们预期中要低(70%-80%的验证者保持长期在线)。但这无伤大雅,测试网完全能应付。

然而周五的傍晚,我在控制板中目睹了验证者参与率突然断崖式下降。在几分钟之内,活跃验证者从22000降低到5000左右,网络中约80%的验证者都消失了。

因此,本文将对此事件进行回顾,包括其后果和下一步的措施。

究竟发生了什么?

前以太坊开发者Virgil Griffith因违反国际制裁法被判入狱63个月:金色财经消息,美国纽约南区地方法官Kevin Castel周二对前以太坊开发者Virgil Griffith做出判决,Griffith被判入狱63个月并支付100,000美元的罚款,该判决低于检方建议的量刑标准。2019年11月,Griffith在朝鲜首都平壤发表关于加密货币和区块链技术的演讲后于2019年11月被捕,美方指控Griffith教唆朝鲜人如何逃避制裁,从而违反了《国际紧急经济权力法》,去年9月份,Griffith对违反国际制裁的指控认罪,目前被关押在纽约布鲁克林大都会拘留中心。(CoinDesk)[2022/4/13 14:21:07]

我们发现,网络中每个运行Prysm客户端的验证者都突然消失了。由于Prysm是使用度最高的客户端,其后果严重性可想而知。

Prysmatic团队在此次事件中开放了一个文档报告,并且持续在其中更新事件细节以及团队响应。以下是一些重点内容以及我的注释。

事件起因是时钟同步(clocksync)出现问题。Prysm客户端的配置使用了Cloudflare的Roughtime来计算时间。(在我看来)其起因还不是非常明确,但很显然Roughtime将时间推移到了未来的四小时,并且持续了一个多小时。Prysm客户端验证者们突然发现他们的时间快了四个小时,并且继续为尚不存在的区块链生成区块和证明。

Ontology发布以太坊虚拟机,并宣布1000万美元基金以支持基于Ontology构建的Web3开发者:3月1日消息,官方消息,本体(Ontology)宣布发布其以太坊虚拟机 (EVM),无缝连接Ontology和基于EVM的生态系统,增加跨链互操作性,使基于EVM的区块链开发者能够轻松跨生态迁移,在Ontology上无缝构建应用。

Ontology还宣布了一项价值1000万美元的EVM基金,以支持开发人员在Ontology上构建Web3/Metaverse去中心化应用程序(dApps)。[2022/3/1 13:30:49]

就其本身而言,还不足以造成灾难性的后果。即使有许多区块丢失,并且面临大量来自未来的证明,剩下的客户端仍然能够在原链上进行建设。渐渐地,随着Prysm节点的时钟调整回来,他们开始回到网络中,并且验证者参与率也开始回升。网络似乎在恢复正常。

但几小时之后,情形又急转直下。

在初始时间发生的四小时之后,又发生了两件事。首先,所有Prysm客户端在未来生成的证明都开始具备有效性。其次,重新加入网络的Prysm节点又开始消失了,原因是为了防止他们生成任何相悖的证明,罚没保护机制被触发了。

Messari分析师:“通缩”的以太坊可能会超过比特币,成为最大的加密资产:加密分析公司Messari高级研究分析师Ryan Watkins推测,一旦Eth2和PoS彻底完成,以太坊可能会取代比特币成为最大的加密资产。3月18日,Watkins在Youtube节目“FinTech Today”上指出,虽然他不知道以太坊“是否或何时”会超过比特币,但他相信以太坊可能会因Eth2而成为未来最主要的加密资产,他表示:“比特币作为价值存储资产,比以太坊更有卖点,归根结底是它的货币政策是可预测的,而且比特币区块链是非常安全的。我认为,随着向Eth2和PoS的转变,以太坊实际上可能比比特币更安全。”[2021/3/18 18:56:58]

这两件事同时发生,让网络陷入了混乱。剩下的客户端仍在努力地处理他们所接收到的信息,信标链变成了不停分支的丛林。(Prysmatic团队的Raul告诉我,Prysm首次修复中的一个bug使得情况恶化)

在一段时间之内,网络中的信息仍处于可控范围内。但在接下来的24小时左右,要导航愈加复杂混乱的分叉,所需的内存和CPU变得难以负担。我看到一个Lighthouse客户端使用了30GB内存(约为通常情况下的100倍),对于Teku客户端来说,即使使用12GB的Java内存堆并最大化处理器,也遇到了麻烦。

以太坊钱包Gnosis Safe Multisig推出智能合约交互功能:非托管以太坊钱包Gnosis Safe Multisig推出一个前端“智能合约交互(Contract Interaction)”功能,允许用户直接与以太坊智能合约进行交互。Gnosis表示该功能旨在提高使用智能合约的灵活性,并允许以太坊智能合约和应用程序直接交互,并支持尚未添加到Gnosis界面中智能合约,例如用户可以使用该功能与ENS交互并定义部分参数。Gnosis同时表示宣布推出桌面版钱包,并“增加额外的安全性”。[2020/5/20]

请注意,这一切都发生在周末。感谢所有奋战在一线的客户团队们,为了使节点能够应对混乱的网络,他们需要不停地优化内存和效率。

到目前为止,网络正在逐渐恢复。用户报告不尽相同,但是Prysm和Lighthouse的新版本刚好能够找到正确的链头并继续构建信标链。?Eth2Stats当前显示链头或附近的Lighthouse、Prysm和Teku节点的一些节点。我们会继续优化Teku,减少其在同步时所需的资源。

金色财经现场报道 EEA发布以太坊企业规范1.0:金色财经现场报道,今日在Coindesk 2018共识会议上,以太坊企业联盟(EEA)的执行董事Ron Resnick公布了以太坊企业规范1.0。Resnick表示,以太坊企业规范是此技术委员会内领先的企业,技术和平台成员之间长达18个月密切合作得出的结果,这个EEA开源的跨平台框架将得到广泛的采用,其深度和广度是在个人企业孤岛中无法达到的。此次发布的标准将帮助实现互操作性。[2018/5/16]

没有发生共识失败

有一点需要明确的是,客户端之间没有发生共识失败,也就是说网络恢复时,所有客户端都能就链头状态达成共识,也就意味着信标链不会从根本上失败,也不需要进行任何硬分叉。

经验

我们将会花更多时间对这个插曲进行全面反思和总结,以下是我个人的一些陋见。

时间同步的重要性

高度依赖第三方时间服务对于网络来说是一个致命点。碰巧的是,ConsenSysTX/RX研究团队的AlexVlasov之前就撰文详尽阐释了时间同步及其在以太坊2.0网络中的重要性。他的工作在飞速进展当中,或许这也是一次让大家关注到这个方面的契机。此处是他的相关文章和ethresear.ch贴文。

客户端多样性的意义

理想情况是我们会有四个及以上独立客户端,每个客户端节点所占比例不超过网络的30%。如此一来,即使有一个客户端出现了问题,而影响都不足以引起我们的注意。

就算我们无法达到这种理想情况,但是降低单个客户端的极高使用率也能使得网络更加强健。假设这次只有50%的验证者下线而非80%,网络也会更容易恢复。这是因为当客户端出现问题时,会影响网络的区块产生、证明打包、广播效率、点对点通信以及同步,而这些因素也会对剩余的验证者产生连带效应。

备用方案的有效性

一些质押者能够切换签名密钥到其他客户端的热备份节点。这无疑使非常棒的安全网络,虽然需要当心避免被罚没:新验证者可能对于既有验证者的投票历史一无所知,因此可能做出相悖的投票。

在将来,一旦我们完成了新的API,应该可以实现在不同的信标节点之间切换验证者客户端的能力,而不仅仅是密钥。例如,一个Prysm验证者能够轻易地脱离Prysm信标节点,并且重新连接到Teku信标节点。这能够解决上面提到的罚没问题。

质押者的责任感

目前参与Eth2并不是“一劳永逸”的事。质押者们需要保持一定注意力,游走于论坛之间,为开发者提供反馈并且能够在短时内更新客户端。我非常支持大家运行自己的个人验证者,但前提是对自己应承担的责任有所意识。

欲速则不达

为什么总是在周五傍晚出岔子?

即使发生在这个时间,Prysmatic团队做出的响应令人惊叹。详情请参阅该团队的事件报告。我以下的表述并非意在给Prysmatic团队带来不良影响,他们的工作的确非常出色,而是为Teku团队在面临相似处境的时候提供经验。

当有这么多用户失去资产的时候(即使只是测试币),并且网络处于高压状态下,自然而然会想要做出迅速的反应,但是有时可能欲速则不达。

这次事件中有两件事是可以避免的。首先,在初始修复版本Alpha.21中有一个缺陷,导致要求用户在17小时后进行回滚。

据Prysmatic团队Raul的说法,此缺陷是造成随后出现网络混乱的原因。其次,团队在处理情况时无意中删除了其1024个验证者的防罚没记录数据库,导致大部分验证者被罚没。

任何一个客户端都可能会发生类似情况。所以即使处于高压状态下,无论是开发者还是用户,我们所有人都要沉稳应对,不能一味追求速度。因此当我们在尝试恢复网络时,遵循了慢工出细活的方式。

暴露问题以绝后患

最后,这次插曲其实是有必要的。如果测试网中什么都没测试出来,那它有何意义?一直处于顺滑运行的状态显然是不现实的。

这次是一场了不起的考验!这也许是网络所能遭受的最严重的一类冲击,就算让我们自己来设计,可能也设计不出这样的测试。让测试网遭受这种程度的冲击正是我们强化客户端所需的必备条件。

上周TheBlock在文章中引用了我的陈述:

在邮件中,PegaSys工程师BenEdgington写道Medalla“是首个具备主网规模和配置的测试网”。

“这是首次大规模试验,而之前只是屏幕上的规范,或是玩具网络。点对点网络中有许多方面需要进行测试和优化。到目前为止,一切都在正常运行中,但是在我们能确保无误之前,还需要更多的时间,更广的规模以及更大的网络压力”。

说实话,还真是盼啥来啥。

下一步是什么?

目前,所有客户端团队都在致力于强化客户端,使其能够应对极端的网络情况。问题不大,我们应该在接下来的几天内就能使Medalla恢复到正常状态,可能会对所有验证者的余额产生影响,也会有一些验证者面临罚没。

如果在这之后,即使网络能正常运行,但验证者参与率还是无法回升,那么我们可能会考虑从头开始,重新部署存款合约(重新创世或许也是一个不错的选择)。但这只是现阶段的一个备选方案。

Medalla万岁!

原文链接:https://hackmd.io/@benjaminion/wnie2_200817

来源:What'sNewinEth2?

作者:BenEdgington

标签:PRYEDAMEDADALPRYZEDAO币MEDA价格dal币发行时间

MATIC热门资讯
比特币:交易者赚了1100万美元股票交易技巧,提供建议_加密货币

这位交易员在接受交易平台bitFlyerJapan采访时讲述了他的故事,根据电子邮件发送的版本,他被描述为“活跃发布信息的杰出交易员”中“最著名的”之一.

1900/1/1 0:00:00
SIP:关于ZT下架SIPC/CNT交易对的公告_SIP币

尊敬的ZT用户:因SIPC/CNT交易对交易量相对较小,ZT决定对SIPC/CNT交易对进行下架处理。下架后用户可在SIPC/USDT交易对进行自由交易.

1900/1/1 0:00:00
RED:一文了解打响以太坊扩容「前哨战」的 Reddit 社区积分扩容大赛_以太坊

了解参与Reddit社区积分扩容大赛的22个项目及其扩容实力。撰文:小毛哥今年6月底,Reddit宣布与以太坊基金会合作,计划将Reddit积分带入以太坊主网,并发帖向开发人员征集以太坊扩容解决.

1900/1/1 0:00:00
EFI:解读DEFI之后可能的炒作热点_以太坊价格今日行情走势分析

从6月份到8月份,DEFI的炒作热度已经持续了将近两个月,这是一个阶段性的爆发时期,但是众所周知,DEFI项目都有一个特点,就是先出产品,后才能进行炒作,这和以往的1CO和或IEO的先发币炒作.

1900/1/1 0:00:00
加密货币:Capital One申请加密货币市场AI预测系统专利_TAL

美国主要的金融服务公司CapitalOne已为加密货币分析和交易系统申请了新的专利申请,该系统将尝试预测加密货币市场趋势并使用人工智能生成交易决策.

1900/1/1 0:00:00
BTC:币圈冯博毅:8.19BTC阴跌不止、日内高空为主_MAC

币圈冯博毅:8.19BTC阴跌不止、日内高空为主投资大师索罗斯说过,投资本身没有风险,失控的投资才有风险.

1900/1/1 0:00:00