暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

分布式内存图计算系统之Pregel(一)

图计算 2017-12-05
471

        在提出创新之前最重要工作就是阅读图计算系统相关的文献了。接下来一系列的内容将会对文章中提到的各类图计算系统(paper)逐一剖析,并给出我的阅读观点供大家参考,甚至去运行测试相应的系统。可以结合文中提到的思路作为指导。首先分析谷歌在SIGMOD 2010年发表的Pregel[1]分布式内存(Distributed In-Memory)图计算系统。


 

        Pregel: A System for Large-Scale GraphProcessingSIGMOD’10, June 6–11,首先看论文的出处是SIGMOD’10,可以大概了解下[2]ACM SIGMOD数据管理国际会议(Special Interest Group on Management Of Data.)是由美国计算机协会ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。2007年的第26届会议收到论文480篇,录用了70篇,录用率为14.6%。再看下作者/团队是Google公司,所以文中的质量和权威性是绝对有保证的。最后再看看文章题目,本文描述的是一个系统,它是用来处理大规模图的,我们至少知道了Pregel是个什么东西,它能做什么,解决什么样的问题。文章的关键字和类目能帮助你快速搜索到其它相关的文献。



        我们先看看文章的结构,显然可以获得比较多的信息:(1ABSTRACT是简要高度概括本文的部分,一般会简单的描述碰到的问题,提出解决的创新方法,方法的表现情况等。(2INTRODUCTION一般会描述下问题的背景和研究的意义。罗列一些当前最先进和具体代表性的解决方案及其优缺点,依此提出自己的创新思路并进行简略的描述。还会一一着重总结出本文的重要贡献点及后文结构。(3MODEL OF COMPUTATION是讨论图计算模型的章节,一定会重点说Pergel所用的模型。(4THE C++ APIIMPLEMENTATION两章都有较多的篇幅(小节),固然是本文的重点,一定是对系统具体实现的角度描述的,显然分别是从图计算引擎接口和系统核心架构方面。(5APPLICATIONS可以看出是具体介绍了4个典型的图算法。(6EXPERIMENTS部分就是对Pregel进行多方面的测试,一般是对上文提到过的创新点和新特性做对照试验来佐证创新工作。至于如何设计试验,需要测试哪些指标则就得多总结和参考了。(7RELATED WORK 一般会从更高更全面的角度去讨论图计算系统(问题),简要对比并重申本系统的创新工作和优势。(8CONCLUSIONS AND FUTURE WORK基本算做总结了,一般会提一下本文所未考虑到的方面和接下来的研究工作重点。(9)其余ACKNOWLEDGMENTSREFERENCES部分不再赘述。



        按照文中所述的步骤,我们先做第一遍的快速阅读,其中摘要和介绍非常关键。本文甚至本领域的生词基本都会在这两部分出现,反复出现的陌生单词就查一下看多了也就记住了。一定要努力克服这第一个障碍,之后你就会发现英文的描述是多么的朴素易懂了。

[ Pregel各章的具体内容将在后面的分篇(二,三,四.....)中解读 ]

 

 

[1] SIGMOD’10Pregel: A System for Large-Scale Graph Processing

[2] https://baike.baidu.com/item/ACM%20SIGMOD/11016548?fr=aladdin

 

 

本文内容仅个人观点,如有错误和不足之处还望大家雅正,如果对您有所帮助则是我的荣幸,如需本文相关资料请发邮件到zhangguoqingas@gmail.com或留言!

 


文章转载自图计算,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论