AWS 技术峰会

我应该怎么说呢?AWS被AWS的市场部害惨了。

这次活动是AWS的市场人员组织的吧。说出来是谁组织的吧。说出来,我们大家保证不打死他/她。

开场气氛不错。但是为什么这么口渴。渴的我到处找水喝。我没有亲见AWS兑换礼品处的争吵。只是听说那块快打起来了。像码农这样温和的物种竟然也要打人,这组织的真不
错。另外为什么需要网上报名,网上报名也就罢了,还给个编号。给我打电话的人员说没有编号进不去,没编号也不让去。那,为什么还开设现场报名!另外下午那动手课排了好
长好长的队伍。竟然一节课听完要全部清场,还要出去重新排队。你们在网上报名的地方限死就好了呀。其实这些课程只要在网上公开可用,pdf可以下载就好了。为啥一个普
及的课程,还要代币。 我实在想不通。我也想不通AWS这个策略是什么. 本来就是个API文档教程,还收个费。那课程里面都是基本的API文档介绍。

另外那课程响应速度极慢,我很难想象AWS基础服务会快到哪里去。嗯。这课程难道不是搭在AWS服务上的吗?AWS这是自己在抽自己耳光吗?还是说程序写的烂和AWS
基础服务无关?反正动手训练课不是充满惊喜和愉悦。加上清场和排队以及糟糕的网速和网站响应速度,周围总是充斥着:“**CK, 网页又打不开”…

只有一点比云计算大会稍好些:就是中午的饭能吃饱。

好吧。吐槽了这么久。“**CK”了无数,现在开始写正文:

开场,胖胖的CTO做了各种讲,各种赞。然后引用glu和其他应用做了说节约成本。其实为啥大家用你的服务,还不就是因为省力省钱。很明显的原因。但是这些公司有一个
共同点:数据是隐私无关,或者需要特殊专业知识才能研读。因为除非那个黑客是跨专业的。否则数据对他来说基本上看不懂的。即使是基因这么隐秘的数据。黑客看不懂的话,
也完全没有意义。某副总裁说可以根据某人基因研发出来特殊病毒。嗯,细细想来也不对劲。因为制造病毒杀人成本太高,而且副作用也很大。这特殊病毒还要在其他人身上做试
验没有问题以证明其特殊性?

好吧,不八卦了。真正开始写正文:

AWS 的确给中小创业公司带来了福音。因为中小公司的新项目不知道效果好不好。可能开发了两个月,推一下市场。看看效果,行就继续,不行就换方向。如果走正常的采购
机器,部署机房的流程。那不知道拖了几个星期了。所以对于中小公司来说,快是重要的策略。因为对于已经发展了多年的应用来说,背了很多包袱和假设,根本快不起来。想清
楚方向的快是胜利,想不清楚的快是找死。对于中小公司来说,即使是找死最好代价也小一些。所以云计算平台是最好的选择。AWS, 腾讯,京东,阿里几家云计算的来说。
AWS又可以带点国际化的梦想。如果定价和腾讯/京东/百度/阿里基本持平。我觉得AWS一家独大不是梦。当然如果AWS能解决将被墙的国际节点限定到小范围内,并且
国际上的CDN再给力些。我觉得国内几家云计算公司连粥都分不到。嗯,应该说到那时,国内的互联网公司连粥都喝不到了。(所以说墙还是好的,养活了大量的国内的互联网
人士。)

AWS的基础组件的确比较齐全。M/R, search, mq, db 等等。基本上对于一般的互联网应用来说也就足够了。

看了一下AWS的组件:

EC2 , 这个是弹性计算云(Elastic Compute Cloud)。是最核心的部分。没有这东西,基本上就啥也不能玩了。
S3, Simple Store Service.
简单存储服务。我当年研究的时候,觉得这个是个玩具。现在也是这么认为的。相比于RDB,这个简单太多了。这个对于某些应用来说就够了。例如key-value,
特别是value极大的情况。例如图片,视频,音频服务等。 这个是每个AZ上部署一份。找三个AZ分别部署。
AET(Amazon Elastic Transcoder) 媒体转码用的。这让我想到百度云的 流畅/原文 模式。
M/R (Map, Reduce) MR计算 kv 这种关系的还是很给力的。想想因为kv这种很符合现在的互联网场景。数据不断增长,刷新和重置。建立复杂索引的
速度跟不上数据变更的速度。另外一方面,数据经过简单筛选就可以变成真正有用的数据。所以kv这种模型才大行其道。而与KV相符合的MR才是有用的。
Kinesis 这个和spark是类似的。咋说呢?就是计算当前固定small时间段比较给力的工具。你可以认为是[curr-fix_interval,
curr] 这个区间的数据运算。
RDS  (relation Database service)
听起来是好东西。所有的代码都不需要变化,就可以平滑的迁入云端。不过你的应用是使用mysql, postgreSQL, 或者oracle。看起来是mysql
Wapper, postgreSQL  wapper, and Oralce  Wapper。 不过很可惜,我们的核心应用这几种数据库都没有用到。
Analytics(这个好像单独为mobile而生的)。这东西看起来应该是App Annie的竞争对手。和我们Google Analyzer,
JiaThis, 百度分析啥的基本无太多差别。
Zocalo 企业存储和共享服务。这个如果在做强大一些,就是我们的竞争对手了。不过现在看来功能还比较简单。
ElastiCache (Elastic 这里的c略写了)这个是memcache/redis wapper.
Dynamo DB 这个东西是好东西,而且是Amazon的原创。Cassandra是抄袭者。外面一般都用CS.  但是CS是免费的。这个是付费的。
CloudSearch 这个也是好东西。不过现在是否支持中文,我没有细看,最近才支持日文,另外说支持34种语言。不过我觉得中文现在可能是不支持的。(2014
-12-12)。另外这个没有在中国region中部署。
SWF(simple workflow service) 我记得我有一篇论文是关于workflow的. 知道设计模式中的 Chain Of
responsebility吧? 这个基本上可以类比。
RedShift  这个是用于数据仓库的。看起来不错。最大数据量能达到 16TB*100.
嗯。所以这东西也只能用于中小公司。因为公司再大些,数据量再大一下,自己建立数据中心其实更省钱。
Code Pipeline/commit/deploy  这个就是提交代码=> merge=> 发布自动化的工具。
Lambda  基于事件驱动的计算服务。 从底层看,依旧是消息流。不过可能编程上会有改进。
Cognito 用户身份和数据同步服务。 sso(single sign on) 知道吧。那就不多说了,就是这个服务。
再说说AZ(avaliable zone), datacentor, region之间的关系。 AZ 是由一个或者一组datacentor组成。 多个AZ+
transit构成了region. 而不同的AZ说明这两个AZ中的server相聚甚远,可以达到容灾的目的。
在同一个datacentor中的server一般不超过8w. 如果超了一般会再建一个datacentor. Why?

AZ之间的传输延迟一般为2ms, 通常小于1ms. 峰值25Tbps.
对于实例不停变换ip的问题,AWS使用ELB(elastic load balance) 方案进行解决。听起来好像起了一堆nginx.
最后说一句:
AWS免费套餐不适用于AWS中国(北京)区域。具体适用地区请参见本页最后的说明。
这一句话令我非常不爽。因为除了中国区,其他地区都可以免费使用一段时间。这让我想到了植物大战僵尸这款游戏。有异曲同工之妙。
我一向反感这种所谓的差别对待。所以,最后再对AWS 说一句 “**CK”。