主页 > imtoken钱包最新版下载 > AI算法跨界参与比特币挖矿?基于机器学习的最优挖矿策略 | 火星科技邮报

AI算法跨界参与比特币挖矿?基于机器学习的最优挖矿策略 | 火星科技邮报

imtoken钱包最新版下载 2023-02-08 07:11:50

我们知道激励是无许可区块链(公共链)的核心:它们激励参与者运行和保护底层共识协议。

然而,设计与激励机制相适应的激励机制实际上是相当具有挑战性的。 具体来说,用户要么是拜占庭式的,要么是诚实的,具有强大理论安全保证的系统也常常排除对可能被激励偏离诚实行为的理性用户的分析。

因此,目前大多数公链所采用的激励机制的安全属性都不是绝对的,很多都没有经过测试。

矿工投入计算资源来解决 PoW 问题。 早期,人们认为最赚钱的挖矿策略是诚实挖矿。 一旦矿工解决了 PoW 问题,他们就会尽快广播新生成的区块。

后来在13年,康奈尔大学的Emin Gün Sirer教授和助理教授Ittay Eyal提出了一种挖矿策略,称为自私挖矿(selfish mining)。 诚实的挖矿产生更高的回报。 从那时起,对激励攻击的研究如雨后春笋般涌现。

使用自私挖矿的矿工不会立即广播他们挖出的区块,他们会秘密地将他们未来开采的区块与扣留区块连接起来,然后实施扣留攻击。

比特币挖矿教学_挖矿莱特币好还是比特币好_比特币挖矿

2015 年,微软研究院和以色列耶路撒冷希伯来大学的研究员 Ayelet Sapirshtein 将挖矿问题描述为具有大状态行为空间的一般马尔可夫决策过程 (MDP)。 但是,挖矿MDP的目标并不是像标准MDP一样是reward的线性函数,因此比特币挖矿教学,挖矿MDP无法使用标准MDP解码算法求解。 为了解决这个问题,研究人员首先将非线性目标的挖掘MDP转化为线性目标的MDP,然后在这个MDP上使用标准的MDP解码算法来寻找最优的挖掘策略。

在这种方法中,在建立MDP之前,必须知道各种参数值,而在真实的区块链网络中,准确的参数值很难获得,并且可能会随着时间的推移而变化,从而阻碍了该方案的实际采用。

论文一:《当区块链遇上人工智能:基于机器学习的最优挖矿策略》

香港中文大学教授、IEEE Fellow(院士)刘少强,深圳大学助理教授、博士后王涛涛,深圳大学教授、博士生导师张胜利近日发表了一项新研究纸。

论文链接:

在这篇题为“当区块链遇见人工智能:基于机器学习的最佳挖掘策略”的论文中,研究人员使用强化学习(RL)算法通过观察和与网络交互来动态学习性能。 一种接近最优挖矿策略的挖矿方法。

比特币挖矿教学_挖矿莱特币好还是比特币好_比特币挖矿

强化学习 (RL) 算法是一种机器学习范例,在该范例中,代理学习成功的策略并通过环境试错来最大化长期回报。

目前,Q-learning是最流行的强化学习(RL)算法,它可以通过更新状态-动作-值函数来学习好的策略,而不需要环境的操作模型,强化学习(RL)算法已被成功应用在许多具有挑战性的任务中,例如玩电子游戏、围棋和控制机器人的运动。

然而,原始的强化学习 (RL) 算法无法处理挖掘问题的非线性目标函数。

因此,论文作者提出了一种新的基于 Q-learning 的多维强化学习算法,可以成功找到最优挖掘策略。

比特币挖矿_比特币挖矿教学_挖矿莱特币好还是比特币好

仿真实验表明,通过这种强化学习(RL)算法进行挖矿比传统的自私挖矿和诚实挖矿更有利可图。

比特币挖矿教学_比特币挖矿_挖矿莱特币好还是比特币好

自由评论:这是跨学科研究的最新例子。 也提醒加密货币世界的原住民,新技术的发展也会带来新的问题。 我们应该太担心这个吗? 不急,先看下一篇研究论文。

论文 2:“SquirRL:使用深度强化学习自动发现区块链激励攻击”

来自卡内基梅隆大学、北京大学、康奈尔理工学院和斯坦福大学的多位研究人员近日发表了一篇题为《SquirRL:使用深度强化学习技术实现区块链激励攻击的自动发现》的论文。

论文链接:

标题似乎有点啰嗦,但大意是:利用深度强化学习(Deep-RL)算法实现区块链激励攻击的自动发现。

在上一篇论文中,我们提到了强化学习(RL)算法,那么什么是深度强化学习(Deep-RL)算法呢?

挖矿莱特币好还是比特币好_比特币挖矿_比特币挖矿教学

深度强化学习是一类使用神经网络学习策略的强化学习 (RL) 算法。

深度强化学习 (Deep-RL) 算法在解决具有以下两个属性的问题时特别成功:

区块链激励机制符合上述性质。 事实上,区块链激励机制还有一个额外的优势,那就是区块链奖励是连续处理的。 以下是论文的主要摘要:

论文作者:Charlie Hou、Mingxun Zhou、Yan Ji、Phil Daian、Florian Tramèr、Giulia Fanti、Ari Juels

一些实验细节

使用提出的 SquirRL 框架,研究人员比较了比特币、以太坊和 GHOST 的区块链激励机制。 他们对每个区块链协议进行了 100 次试验,每个试验包含 10,000 次试验。 状态转换和主链至少 5000 个区块,然后进一步分为单代理和多代理进行评估。

比特币挖矿_挖矿莱特币好还是比特币好_比特币挖矿教学

以下是本实验涉及的 4 个组件:

下面是单个代理的实验结果的可视化:

比特币挖矿教学_比特币挖矿_挖矿莱特币好还是比特币好

我们可以看到,当攻击者算力(或权益)α小于25%时比特币挖矿教学,SquirRL不采用“自私挖矿”策略,而是恢复诚实挖矿策略,而当攻击者算力(或α)较大时超过 25%,SquirRL 优于其他方案。

最后,SquirRL 的结果表明,在存在多个攻击者的情况下,针对比特币的经典自私挖矿攻击是无效的。

这些结果揭示了为什么自私挖矿虽然在理论上可行,但在现实世界中可能是一种糟糕的攻击策略。

洒脱点评:也是利用AI算法的区块链课题研究。 与之前的论文不同,本次研究的目的是识别相关的区块链激励攻击,同时也证明当网络中存在多个代理人(即攻击者)时,相对激励攻击效果会减弱,这意味着网络最终会达到一个平衡的状态,所以我们不用太担心。