鱼羊起源于奥飞寺
量子位报告|公众号
“现在不限速,以后也不限速。”
“不管你是不是会员,都不会限速。”
这样一种“破坏和谐”的声音,来自于阿里网盘。
内测刚刚开始,有用户实测5G下传输速率可以跑50-100MB/s。
内测期间,免费存储空间也相当可观——用户最多可获得2TB的免费存储空间。
国外用户长期以来一直饱受云盘限速之苦,但说实话什么是物理带宽,云盘的存储和带宽成本实在是承受不起。
阿里就这样举起了“速度不限”的大旗。 是不是开放市场的权宜之计?
真的可靠吗?
为什么阿里网盘指出不限速
自然,从网盘用户的角度来看,上传下载的流畅度是目前一大核心痛点。
过去的产品方并没有意识到这一点,而是在经过十多年的市场探索后选择了妥协:作为商业产品,无论如何,带宽和存储的巨大成本都摆在那里。
正如阿里网盘团队所说,我们尊重过去的市场探索,但要走一条新的路。
想要坚持不限速,资源的投入肯定是少不了的。
那么,阿里网盘为什么要点出“不限速”呢?
阿里巴巴网盘产品负责人祁俊元给出的答案是:
只做传统云盘的单一机型很难开发。
祁俊元直言,如果只按照传统云盘的商业模式运营,“实在是太贵了”。
如何另辟蹊径? 公测阶段用户的反馈验证了阿里网盘团队的愿景:在保证最基本的不限速用户体验后,更多的玩法出现了。
阿里巴巴网盘团队名为“你的数字世界”。 无法证明的是,此时此刻,化学世界和数字世界正在越来越深入地融合。
随着数字化变革的不断变革,越来越多的数据被存储在云端,越来越多的用户行为也会发生在云端。
就像明天一样,你似乎习惯于使用在线协作文档而不是 word 进行文本编辑,所以如果数字内容触手可及,没有长时间上传和下载等待的折磨,基于云的图像和视频协同创作也将成为常态?
这有悖于以限速为中心的商业模式。
事实上,人类历史上存储信息的媒介仍在不断变化,而变化的目的多半是为了更快的共享和使用。
使用分布式存储,但传输是拨号网络的速度——起点似乎不对,市场发展停滞不前。
从这个角度来看,不限速可以说是进入数字世界的入场券,并在其中创造了更多的可能性。
这也是为什么在公测阶段,阿里网盘率先推出了可以一键同步图片的相册功能。 齐俊元还进一步透露,下一步将不仅推出基于文本的协作模块。
未来五年,我们将这样看待网盘的衰落:
第一,我们认为用户会真正投入内容,可能是别人分享的,也可能是自己创作的。 而且我们认为会有更多的创作元素。
第二,我们认为网盘将从个人消费走向多人消费场景,比如家庭、工作场景。
其实,从阿里网盘主要开发成员的构成,我们也可以窥见未来个人云的布局:不仅是智能存储,还有联通协同、云网、视觉智能……
数字资产的存储和传输只是阿里巴巴网盘乃至“个人云”的第一步。
不限速不靠谱的阿里网盘
意见是这样的,那么从技术层面来说,阿里网盘能做出什么保证来证明它的可持续性呢?
(虽然没人想在内测结束后开始迁移数据~)
和往常一样,让我们来看看产品背后的这些东西。
行业领先的对象存储
简单来说,用户存储在阿里网盘的数据,会经过哈希函数打散,分布到阿里云对象存储(OSS)和表存储(OTS)中。
下载时,通过5层数据一致性校准和就近多地存储能力,可以快速合成。
而这个阿里云对象存储技术值得细说。
根据《阿里云存储蓝皮书》,基于分布式存储文件系统盘古,阿里云的对象存储还可以提供99.%(12个9)的数据可靠性和99.995%的可用性SLA。
这个数据已经超过了云服务领域老大AWS的11个9。
△来源:云栖社区
怎么做? 以多重冗余架构设计为例:
OSS中存储的每个文件每5MB部分进行分片,分别存储在数据中心的不同c盘中,以降低硬件故障导致数据丢失的概率,防止数据泄露风险。
值得一提的是,盘古系统采用了纠删码技术()。
简单理解,为了保证数据的可靠性,原本需要三份备份,这显然对网络和c盘空间造成了沉重的负担,同时在维护副本间数据一致性时也会造成较大的资源消耗。
使用冗余纠删码算法,如Reed,假设原始数据为8个大小相同的数据块,通过编码生成4个冗余块。 只要整体数据丢失不超过4个block,就可以恢复所有数据。 . 也就是说,只需要150%的存储空间,4个c盘就可以容忍死掉了。
这样,在保证可靠性的同时,可以大大减少所需的存储空间。
此外,据阿里云智能存储产品经理余家伟介绍,阿里云OSS提供的存储是分层的,可以分为标准存储、低频存储和归档存储。
其实很多归档数据在很长时间内都不会被调用,所以可以放在最底层的冷备份之前。 对于这样的数据,存储的大部分成本来自电费。
对此,阿里云自主设计了瓦片式莱州C盘柜,结合智能开关机算法,平衡存储性能和煤耗,进一步降低成本。
云、边、端同步做大,力求“极速”
说完在保证稳定可靠的前提下增加存储成本的技术思路,我们还是回到“速度”本身。
“不限速”的潜台词其实就是跑多快就跑多快。
为了在技术上实现快速传输什么是物理带宽,接入过程分为端(如手机端)、云端(数据中心)和中间传输网络三部分。
那么阿里云在这三点上有什么样的技术积累呢?
在传输网络方面,阿里巴巴自身拥有国外最大的CDN内容分发网络,以及全球加速的虚拟云网络——阿里云拥有21个区域、63个可用区、120多个POP点、2800多个Edge节点提供全球网络服务。
阿里云盘可以集成阿里云VPC、全球加速、未来5G边缘节点优化等一系列特性。
用户大量分享的内容将智能存储在最近的内容分发网络(CDN)节点中。
在服务器端,阿里云存储在混合存储和QoS能力的项目上积累了很多经验:可以保证数据存储和读取访问的低延迟,以及访问延迟的稳定性。 同时,可以复用阿里云公有云的大规模能力,在高并发、海量数据访问的情况下提供稳定的服务能力。
借助阿里云多区域部署和分布式机房架构的优势,阿里网盘可以就近存储数据,缩短用户与数据存储中心的距离,缩短数据传输时延。
此外,对于图片、视频等数据,阿里网盘优化了转码能力,通过FPGA服务器进行编解码。 在不增加图像质量的情况下,可以提高图像的压缩率,从而减少数据传输量,减少带宽,也减少传输时间。
最后,在手机端,阿里网盘通过分片传输、断点续传等方式提高传输效率,降低传输时延。 例如,通过将照片进一步切分,可以加速更多相邻的数据。
同时在本地优化缓存,让用户体验更加“极速”。
据媒体报道,在公测中,部分用户在5G条件下下载时可以跑满1Gbps带宽。
事实上,虽然阿里巴巴网盘的内测才刚刚开始,但其背后的技术基础早已在实战中得到检验。
不仅在内部,阿里云的智能存储技术体系已广泛应用于生物基因、自动驾驶、天文观测、智能交互等大数据存储前沿领域。
例如,基因数据分析需要每晚产生数百TB的数据,需要TB级的数据处理能力。
在传统的估计方法下,需要3-5天的时间才能输出一个人的基因分析结果。
而引入基于阿里云平台设计的云平台架构,包括估算资源弹性伸缩、多级存储、海量存储估算、数据安全等,可以在22小时内完成100人的基因组分析。 .
中国天眼 (FAST) 也使用阿里云的存储服务。
在射电望远镜的应用场景中,每晚都会产生极其大量的数据,需要实时处理。 更大的困难在于,射电望远镜地处偏远,受地域限制,无法就地建设数据中心。
因此,阿里云提供了专线架构服务来保证其带宽。 同时,通过集成带宽技术和TBS处理能力,为FAST实现了端到端的估计和存储解决方案。
说了这么多,看来阿里网盘有“纯不限速”的魄力,在技术层面也是相当有魄力。
阿里网盘模式的通过,无疑将为个人云的发展开辟一条新的道路,为基于云的数字生态拓展toC的可能性。
而这样的发展规划,也指向了一个真正的数字时代,不再受数据存储和传输的限制。
这也是齐俊元说的原因:“过去,这个行业有很多陷阱,但我们很高兴能做这件事。”
目前,阿里网盘在2.0.5版本中,对相册手动备份、文件保险箱、影音播放等功能进行了优化升级,分享功能也正式开放。
内测第一步已经迈出,你看好吗?