失效链接处理 |
区块链数据分析:(x)现状、趋势与?xi)?nbsp; PDF 下蝲
本站整理下蝲Q?nbsp;
链接Q?a target="_blank">https://pan.baidu.com/s/1I-dBrE6oDXvl3ZiD2h-nBQ
提取码:(x)ntyw
相关截图Q?/strong>
![]()
主要内容Q?/strong>
区块链数据分析:(x)现状、趋势与?xi)?/div>
陈伟?郑子?/div>
Q中山大学数据科学与计算机学?q州 510006Q?Q国家数字家庭工E技术研I中?q州 510006Q?1Qchenwli9@mail2.sysu.edu.cnQ?Blockchain Data Analysis: A Review of Status, Trends and Challenges
Chen WeiliQand Zhen Zibin
QSchool of Data and Computer Science, Sun Yat-sen University, Guangzhou 510006Q?QNational Engineering Research Center of Digital Life, Sun Yat-sen University, Guangzhou, 510006Q?/div>
Abstract Blockchain technology is a new emerging technology that has the potential to revolutionize
many traditional industries. Since the creation of Bitcoin, which represents blockchain 1.0,
blockchain technology has been attracting extensive attention and a great amount of user transaction
data has been accumulated. Furthermore, the birth of Ethereum, which represents blockchain 2.0,
further enriches data type in blockchain. While the popularity of blockchain technology bringing
about a lot of technical innovation, it also leads to many new problems, such as user privacy
disclosure and illegal financial activities. However, the public accessible of blockchain data
provides unprecedented opportunity for researchers to understand and resolve these problems through
blockchain data analysis. Thus, it is of great significance to summarize the research problems
existed, the results obtained, the possible research trends, and the challenges faced in blockchain
data analysis. To this end, a comprehensive review and summary of the progress of blockchain data
analysis presents. The review begins by introducing the architecture and key techniques of
blockchain technology and providing the main data types in blockchain with the corresponding
analysis methods. Then, the current research progress in blockchain data analysis is summarized
in seven research problems, which includes entity recognition, privacy disclosure risk analysis,
network portrait, network visualization, market effect analysis, transaction pattern recognition,
illegal behavior detection and analysis. Finally, the directions, prospects and challenges for
future research are explored based on the shortcomings of current research.
Key wordsQ?blockchain; data analysis; Bitcoin; Ethereum; smart contract
摘要 区块链是一具有颠覆许多传l行业的潜力的新兴技术。自以比特币Z表的区块?1.0 诞生以来Q区
块链技术获得了(jin)q泛的关注,U篏?jin)大量的用户交易数据。而以以太坊ؓ(f)代表的区块链 2.0 的诞生,更加丰富
?jin)区块链的数据类型。区块链技术的火热Q催生了(jin)大量Z区块铄技术创新的同时也带来许多新的问题,?/div>
用户隐私泄露Q非法金融活动等。而区块链数据公开的特性,为研Ih员通过分析区块链数据了(jin)解和解决相关
问题提供?jin)前所未有的机?x)。因此,ȝ目前区块链数据存在的研究问题、取得的分析成果、可能的研究势
以及(qing)面(f)的挑(xi)战具有重要意义。ؓ(f)此,全面回顾和ȝ?jin)当前的区块链数据分析的成果Q在介绍区块链技术架
收稿日期Q?018-02-**Q修回日期:(x)2018-**-**
基金目Q国安点研发计划(2016YFB1000101Q;q东省高{学校珠江学者岗位资助项?2016)Q国家自然科学基?61722214)Q广东省创新
团队目(2016ZT06D211).
The work described in this paper was supported by the National Key Research and Development Program (2016YFB1000101), the
Guangdong Province Universities and Colleges Pearl River Scholar Funded Scheme 2016, the National Natural Science Foundation of China
(No.61722214), and the Program for Guangdong Introducing Innovative and Enterpreneurial Teams(2016ZT06D211).
通信作者:(x)郑子彬(zhzibin@mail.sysu.edu.cnQ?/div>
????I????2018 q?/div>
构和关键技术的基础上,分析?jin)目前区块链pȝ中主要的数据cdQȝ?jin)目前区块链数据的分析方法,q就
实体识别、隐U泄露风险分析、网l画像、网l可视化、市(jng)场效应分析、交易模式识别、非法行为检与分析
{?7 个问题ȝ?jin)当前区块链数据分析的研I进展。最后针对目前区块链数据分析研究中存在的不分析和展
望了(jin)未来的研I方向,以及(qing)面(f)的挑(xi)战?/div>
关键?区块链;数据分析Q比特币Q以太坊Q智能合U?/div>
中图法分cd TP391
0 引言
区块链技术是一U新型的分布式̎本技术,它可
以在互不信Q的环境下实现MM介的可信交易?/div>
与传l数据库技术相比,区块链技术具有防伪造、不
可篡改以?qing)能方便实现合约{特点,被誉ZU?/div>
引发社?x)变革的新型技术[1]。国务院印发的《十?/div>
五国家信息规划》将区块铄相关技术列入强化超?/div>
布局的战略性前沿技术。著名信息技术研I分析公?/div>
GartnerQwww.gartner.comQ连l?2 q?(2017?018)
区块链?qing)其相关技术列入十大战略科技?/div>
区块链技术是比特币等新型数字货币的底层支
撑技术。由于要在分布式环境中实现可信的交易Q区
块链技术大量用密码学技术隐藏用户信息,同时所
有交易信息则由分布式|络共同验证、存储。区块链
技术可Ҏ(gu)应用场景和网l加入许可机制的不同?/div>
分ؓ(f)公有链、联盟链和私有链[2]
。比特币[3]
、以太坊
[4]
{对节点的加入与退出没有Q何限Ӟ是典型的?/div>
有链。传l数据库中的数据通常隶属于某家企业或?/div>
构,只有内部人员能够查看和分析,而公有区块链?/div>
为可以自由加入与退出,其中的数据即区块链数据可
以方便地获取。这为数据分析h员通过获取公有铄
交易数据Q进而分析系l中的各U行为提供了(jin)前所?/div>
有的Z(x)?/div>
当前Q各U公有链如比特币、以太坊{获得了(jin)?/div>
量用L(fng)参与Q积累了(jin)大量交易数据。以比特币ؓ(f)例,
一?ARK 投资公司?Coinbase 联合发布的研I报?/div>
指出Q截?2016 q底Q全球有过 1000 万用h?/div>
比特币,每天比特币的交易量达?2 亿美元[5]。大?/div>
用户的参与和z跃的用户交易得基于区块链的数
据分析成Z个重要且有h(hun)值的研究问题。随着区块
链技术的发展Q各行各业将区块链技术作为底层技?/div>
引入Q势必导致大量的数据以区块链数据的Ş式存
在,因而研I基于区块链的数据分析问题具有重要的
理论和现实意义?/div>
与典型数据Ş式相比,区块链数据具?2 个重?/div>
的特炏V首先,在区块链pȝ中,其是在公有链中Q?/div>
用户都是匿名的,各种用户的属性数据(如性别、年
龄等Q都无从获得。其ơ,区块铄l中用户通过?/div>
易Ş成联l,构成各种|络Q数据之间彼此互相关联?/div>
因而,Z匿名|络的数据分析技术将成ؓ(f)区块链数
据分析的重要技术?/div>
目前Q由于区块链技术尚处于初始阶段Q缺乏大
量成熟的区块铑ֺ用项目,因而基于区块链的数据分
析亦处于探烦(ch)阶段。区块链数据分析相关的文献主?/div>
针对目前相对成熟且已有够数据的区块铑֦比特
币、以太坊{。其中,又以比特币区块链因其创立?/div>
间较ѝ广受关注而成为区块链数据分析研究的重?/div>
对象?/div>
目前Q已有大量针对区块链技术不同角度的文献
lDQ如技术架构[6]、共识机制[7]、安全和隐私的问
题[8, 9]、攻击问题[9]、应用现状[10, 11]、研I方向与?/div>
战[2]、研I热点[12]{,但尚~Z对区块链数据分析技 术的q展的相x(chng)道,为I补这一~失Q本文对目前
区块链(主要是比特币、以太坊Q数据分析的相关?/div>
献进行了(jin)Ҏ(gu)分析Q概括出 2 cd型的区块链数据和
相应的分析方法,qȝ?jin)区块链数据分析?7 大研
I题和q展Q希望能够给当前区块链技术的相关?/div>
I提供一定的参考与帮助?/div>
1 区块铑֟介绍
当前Q我们处于一个信息泛滥的时代Q各U数?/div>
充斥我们周围。然而,数据是否真实可信却不得而知?/div>
区块链技术因其特D的机制Q其中的数据h“可信”
的宝늉征,q得基于区块链数据分析的信息具?/div>
重要的h(hun)倹{ؓ(f)理解Z区块链数据具有可信的?/div>
征,本章介l区块链的基本架构,q点分析?/div>
区块链数据可信的关键技术?/div>
1.1 区块链架?/div>
2008 q_(d)化名?ldquo;中本?rdquo;(Satoshi Nakamoto)
的学者在密码学邮件组发表比特币奠基性论文[3]
Qƈ
?2009 q?1 月实C(jin)比特币的最初版本。在l过一
D|间的q行之后Q比特币开始走q大众的视野。由
于比特币h许多优良Ҏ(gu),其迅速成为金融市(jng)场的
宠儿。区块链技术正是指比特币等加密货币的底层支
撑技术?/div>
目前Q尚未Ş成行业认可的对区块链技术的l一
定义。在 2016 q?10 月由中国工业和信息化部发布的
《中国区块链技术和应用发展白皮书》将区块链技?/div>
描述为分布式数据存储、点对点传输、共识机制、加
|