暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

福尔摩斯点评POC,猜猜哪家赢?

51CTO技术栈 2021-02-06
691


直击POC现场

福尔摩斯跨界当评委


关键信息


中心事件:伦敦警察局数据中心POC测试

出场人物福尔摩斯 华生 麦克唐纳


三家厂商,谁会笑傲全场?



1

贝克街221号公寓


一阵敲门声把我叫醒,原来已经天色大亮。

打开卧室门,福尔摩斯先生站在门口:“早上好,华生!快来吃早餐吧,十点钟我们要到达伦敦警察局。”

我还有点迷糊:“早啊,夏洛克。去警察局干啥?”

“你昨晚喝得不多吧,华生,怎么都忘了,伦敦警察局的亚力克·麦克唐纳先生请我们去当评委呀。”

“哦,对了,他们的大数据分析系统要上第二期,今天做方案测试。我马上就来。”


2

餐厅

在餐厅里,我喝着咖啡,问道:“夏洛克,你只是个侦探,警方为啥请你去当评委呢,你真的懂大数据、云计算什么的吗?”福尔摩斯吸了一口烟斗:


亲爱的华生,现在是二十一世纪了,我们这一行,只靠放大镜还能破什么案?虽然莫斯亚蒂教授早就呜呼了,但高智力高科技的犯罪层出不穷,没有更好的技术手段,怎么对付他们?我研究IT技术很久啦,警方的系统有许多不错的工具。中国人有句话:魔高一尺道高一丈。我们总是需要比罪犯更有手段。


“可是,夏洛克,我还觉得警方请你去主要还是因为你的名望。”

福尔摩斯笑了笑:“肯定有这方面的因素,何况麦克唐纳先生是多年的老朋友。其实呢,他们请我很合理的,我也是半个甲方,对他们的系统有一些了解。”

这让我好奇了:“嗯?警方让你使用他们的保密系统吗?总不可能给你接入系统的账户和密码吧?私人侦探和警方虽然都打击犯罪,但互相还是很隔阂的啊。”

“哈哈,当然,华生,他们没给我任何权限,但是,他们的防火墙对我是不存在的。”

“原来是这样!你这叫黑客吧,夏洛克,哈哈!”

“低调、低调。时间差不多了,我们出发吧。”


3

伦敦警察局

在伦敦警察局数据中心的会议室门口,壮硕的亚历克·麦克唐纳先生笑脸相迎。寒暄过后,亚历克带领我们到前排就座。玻璃墙另一边,几个并排的机柜里放了很多设备,一些技术人员在周围做最后的测试准备。



“亚历克,说实话吧,你对这次扩容怎么想的?华生也不是外人。”福尔摩斯开门见山。


“之前给你的文档里有说明啊,你肯定都看过了,高性能部分100TB,大容量部分3PB。”


我是说你想用什么规格的设备?以前你这里都是旗舰级的产品,近些时期越来越中端甚至低端化了嘛。你这分管IT的副局长,权力没前任大了?


“我们花的都是纳税人的钱,不能浪费啊,夏洛克,必须要物美价廉……”


“说人话,亚历克。”


好吧。地主家也没有余粮啦!真心手头紧!预算总不见涨,要求做的事还越来越多。监控的数据原来只存一个月,现在要3个月,数据采集点又加了20%。反恐压力大啊!但是不能为了便宜搞些不好用的玩意,业务系统已经很复杂了,我们真没精力管基础架构平台,越简单易用越好。另外,供应商也最好别弄太多,怕扯皮。


“懂啦。你去忙别的吧,我们知道怎么评了。我跟华生在这先看看。”

麦克唐纳警长点头离去。




我望着玻璃墙那边开始运转的几个机柜中闪烁的LED灯,开始提问题:“夏洛克,一共有3家来参与测试,对吧?3个机柜里的设备相差很大呢,长得不一样、数量也不同。”



的确是3家。左边的A公司用的是经典的存储架构,你看那边中心机房里大量的服务器也是A公司的。B公司也是经典存储,就是中间那个自带炫酷机柜面板的。右边满满一柜子服务器的是C公司,用的是软件定义存储的方案,简称SDS


这次测试的配置不要求与采购内容完全相同,那样太多了这里放不下,每家只要求提供1/3的配置,或者装满一个标准机柜。


“都是经典架构,中间那个炫酷机柜很抢眼啊,有什么特别的作用吗?”

“让你心甘情愿多掏点钱。” 福尔摩斯笑了。

“哦,装X不是白装的。”

“总有人吃这一套。”




“夏洛克,你现在能看出来,哪家会在今天的POC中胜出吗?”我从桌上的文件中学会了一些业内术语。



“华生,这种POC只是表演而已,不是比赛。”


我吃了一惊:“你是说已经内定了优胜者?”


福尔摩斯把空烟斗摇了摇,会议室里并不能吸烟:


这可不是足球比赛。你见过许多名人的求婚仪式吧,华生,媒体上经常报道。有哪次你会担心他精心准备、耗资不菲的求婚被拒绝呢?


“从不担心。他们只是在炫耀而已。”


“对的。POC就像‘求婚’,大多是成功者的炫耀行为,而不是竞争者的冲刺尝试。甲方需要用POC来证明自己选择的厂家及方案是正确的,也为将来万一出了问题推卸责任。”



“可是他们怎么保证心仪的方案能够在测试中比别人表现得更好呢,夏洛克?”


“这不写着嘛,你看啊,” 福尔摩斯拿起桌上的POC方案说明:


测试场景在这几页,看起来很平常吧,其实大部分是对某个厂家有利的设置


“我看不出来,当然啦,我是外行。可是其它厂家也看不出来吗?”



“华生啊,其它厂家看出来又能如何呢?甲方一句‘这就是我的实际应用需要’,就足够打发了。”


“套路啊!可是来‘求婚’的不止一位呀。”


“总有人想碰碰运气。”


“但是你已经知道谁被内定了?”


“我不会承认的。” 福尔摩斯往椅子背上靠了靠。




“我知道这些花样都瞒不过你,夏洛克,说说看嘛,反正那些机器还在跑,结果不会马上出来吧?”


“估计到下午才会跑完所有项目。这个POC方案说明是公开的,提前几天就发给厂家和评委了,” 福尔摩斯又用烟斗指了下桌上的文件,“这个写的还是有些巧妙的。”


“比如说?”


比如这一项,要求B公司的存储设置上始终打开写缓存。因为B公司在方案论证阶段强调他们的存储上控制器多、缓存大,所以性能高。于是甲方就要求他们验证一下。但其它厂家没要求缓存怎么用。


“夏洛克,写缓存是什么玩意?”


“写缓存就是哈德森太太。”福尔摩斯微微一笑。


“我们贝克街221号公寓的房东兼管家哈德森太太?”


“正是。当年最快的通讯方式就是电报了,电报谁送来的,华生?”


“邮差啊。”


“嗯,邮差把电报交给哈德森太太,就可以转身离开了。至于哈德森太太何时上楼来给我们电报,邮差不用关心。”


“这跟存储有什么相似呢?”


主机把数据发送到存储的缓存,就认为数据已经写入存储系统,可以继续做后面的操作了。主机不用关心数据是否真正落盘。这样较慢速的硬盘不会有太差的性能表现。



“哦,写缓存起到了哈德森太太的作用,不需要让邮差上楼找我们送电报,节省了他的时间。”


“不过呢,那是一百多年前的事了,现在的情况已经不同。我们都在用手机联系,直接看手机就好了,哪还用得着哈德森太太转交?闪存盘本身性能很高,没必要通过缓存中转。特别是大流量负载连续写入的情况下,缓存反而来不及清空,不如直接写盘更快。A公司在白皮书中就明确说明此类场景下关闭写缓存性能高好几倍。”


“那B公司岂不是给自己挖了个坑?”



“再看这一项,高性能全闪存这部分,要求达到一定的实际可用空间,写入性能越大越好。你知道吗,同样数量和容量的盘,不同的RAID方式下容量和性能此消彼长、不能兼顾。RAID5或RAID6方式容量大,但写入性能差,因为有写惩罚的问题——‘写惩罚’不懂?回头你自己上网查吧。而RAID10方式正相反,容量减半、但写入性能好


这一项的写入性能门槛定的比较高,B公司只能让所有SSD跑RAID10才能达到性能要求,需要配置2倍容量,成本就上去了。而A公司的‘读写分离’技术能让数据用写入RAID10,过些时候数据冷却了自动转成RAID5或RAID6,既不损失写入性能、又节省了很多容量。


插播一条小广告:文中提到的“读写分离”是戴尔易安信SC存储特有的一项技术哦~心动想下单?别急,更好的选择在等你👉戴尔易安信PowerStore融合了戴尔科技旗下XtremIO、Unity、SC等多款存储产品中的先进技术,是中端存储的不二之选。


“真的能省空间吗?会不会数据一直冷不下来呢?”


“华生,一个路口每天能发生多少事情值得警方调出采集的数据来分析呢?”


“应该很少吧。”


“对啊,所以绝大部分写入的数据都不再有人关心,过不了几天就是冷数据了。”


“可是不会所有数据都是这情况吧?夏洛克,这套全闪存系统,应该主要放的是比较常用的数据。”


你很细心,华生。A公司的快照和自动分层可以默契配合:自动地每天做一些快照,快照把数据变成只读属性;自动分层功能把只读属性视为冷数据,定时转存到RAID5或RAID6的低速层上。这相当于主动冷却数据。


“你对A公司的技术很熟悉啊。”


福尔摩斯压低声音:“要不我说是半个甲方呢,他们这里运行着许多A公司存储。”




“那A公司的确会节省不少容量。C公司的呢?”


SDS都是用多副本方式存放数据,两副本就相当于RAID10。”


“也就是说,这一项上,A公司可以配更少的固态硬盘,占了上风。”


华生,闪存(Flash)作为存储介质的驱动器(drive)叫固态盘(Solid State Drive),简称SSD,它不是硬盘;旋转的磁盘片为存储介质的驱动器才叫硬盘(Hard Disk Drive),简称HDD。它们都是驱动器,但不是都叫硬盘。


福尔摩斯严谨地抠了一遍字眼。


“OK,我只是个军医。”我把手一摊。


“你倒是可以用你的医生的角度,来看看C公司方案的问题。”


“你刚才说了,夏洛克,C公司需要配置双倍的裸容量。可是他们应该还是有成本优势吧,SDS都是些普通的x86服务器加上存储软件,C公司用的还是开源软件,没什么软件成本。这有什么医学问题呢?”


“请问军医华生,人体哪些地方受伤很致命?哪些地方受伤不太会死?”


“头部和身体的内脏器官最不能中弹,四肢被打中一般是有救的。”


“为什么呢?”


“头和内脏对维持生命不可缺少,每一个都是唯一的,没有备用,受损了难以修复、也几乎没办法更换,至少现在的医学水平下内脏移植成功率很低。而手脚都成双成对,缺胳膊少腿还能活下来,断了能接,换假肢也不难。”



“是啊。你看A公司和B公司的经典存储系统,所有部件都是冗余的,每个模块可以热插拔,就像全都是四肢,坏了随时可以替换,不影响正常使用。”




“C公司的SDS不也是一堆基本相同的模块吗,夏洛克,它们之间是互相冗余的吧?”


对,但是你单独看一个节点,其实就是一个通常的x86服务器,它那个核心的身体里有些唯一的、没有备用替代的内脏。


“你是说服务器主板吗?”


“没错。主板的身体上有许许多多元器件,包括每个电容电阻,都无法在线更换,主板一旦有一点点故障,整个节点瘫痪。”



“少一个节点也不会整体停机或者丢数据的。”


“也没错。可是接下来会发生什么呢?华生。”


“我翻一下他们的方案啊……掉线的那个节点上的数据,会在其它节点上复制出来。”



“一个节点有好几十TB的数据,于是节点间的网络上持续涌入大量需要复制的数据。”


“那就是网络躺枪了,夏洛克。”


“并且当这个节点修复重新上线后,这样的网络拥挤还会再来一次——数据要恢复回来。”


“网络躺枪两次。”


是的,而且即使节点没坏、只要有一个驱动器故障——机械硬盘或SSD——这个驱动器上的数据在本节点没有一个字节的冗余,还是都需要从其它节点复制过来。你看这些节点里,硬盘都是10TB的大容量盘,通过万兆网络传送10TB也不是件轻松的事。反正节点出问题就是要让网络背锅。


“另外两家没这个问题?”



经典存储的RAID重建都在存储内部运行,没网络的事。而且A公司的那个存储不需要在热备盘上重建故障盘的数据,它利用剩余空间提供热备,故障盘上失去的数据会均匀地重建在剩余盘的空间里,速度比传统热备盘快很多倍


“也就是说,最后一项failover测试,C公司肯定会比较被动了。而且,为了达到标书要求的1/3容量,他们居然塞满了一整个机柜,这太占地方了。另外两家的高密度盘柜省了空间。”


“华生,通用的服务器和专用的存储盘柜,在大容量需求的场景下,差距就这么明显。你要是有兴趣可以走到C公司那个机柜后面看看,线缆多如牛毛。另外,开源软件的维护,这个甲方搞不定的,你看C公司多来了好些人,恐怕调软件的就占一半。”


“这么说来,这个POC的结果真是没什么悬念了。”




福尔摩斯换了个姿势靠在椅背上:“现在还不能下定论。所以今天来这里还有另一个目的。”说着用烟斗往肩膀后面指了指。


我低声问:“后面那几个评委怎么了?有新的案子?”



“两周前,一个大公司测试、招标,POC结果大幅度落后的供应商最后中标了。”


“还有这种操作!‘求婚’失败了?”


垂涎新娘的家伙会不择手段,尤其新娘是大美人——一个金额很大的标。后面那些人中,有三个参加了那次的评标。


“原来你要调查他们。我们现在也接经济类案件了吗?”


“经济类比刑事类的市场更大哦!等下我们去会一会那三位‘绅士’。”


“OK!这才是有意思的事嘛,看着机器运转太无聊了。先来杯茶还是咖啡?夏洛克。”


“你知道的,我的朋友。”



END

点击“阅读原文”了解更多数字化转型解决方案

文章转载自51CTO技术栈,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论