云计算简史(下)

阅读前文:云计算简史(上)- 15分钟读完15年


前面我们提到了云计算公司的竞争将向应用开发和部署环境迁移。那么它具体指的是什么呢?它有关于围绕云计算相关的四个技术领域。Tom Siebel 把他们概括为云计算本身、大数据、人工智能和物联网。


接下来,我们会逐一介绍这十五年来,伴随云计算发展起来的数字化技术领域。正是因为云计算服务的普及,才催化了这些新兴的技术领域,反过来,这些技术领域的发展也让现代云服务更加完善,当然也更加复杂。正是这些复杂性,让企业数字化转型工作变得阻力重重。相较于更早前的基础信息化工作,企业届要认知和掌握的技术范畴要比宽广得多。因此,我们介绍云计算的发展简史,就必须要把关联技术域的发展也一并介绍。


云计算相关的技术领域


大数据(Big Data)


在大数据概念出现之前,数据存储、处理和分析的技术早已存在。随着存储成本的下降和云计算提供的弹性计算能力增强,越来越多的数据场景已经不能被传统的数据库技术所处理。这些新场景可以被概括为高数据量(Volume),高频度(Velocity)和多数据类型(Variety)三个特点。比如在电子商务、金融和物联网领域,系统往往在很短的时间内会产生大量的数据。这些数据甚至在存储的过程中就会产生瓶颈,更不用说实时性很强的计算和分析。所以,从搜索引擎时代开始,大数据相关的技术就开始孕育。

 

MapReduce 和 Hadoop

 

搜索引擎的霸主 Google 成立于 1998 年,几年以后,Google 的搜索服务所承载的数据量已经是一个天文数字,而且还在以光速增加。传统的数据处理技术完全依赖硬件算力的铺陈,这会让 Google 在未来的发展中不堪重负。2004 年,Google 在内部推出了 GFS 分布式文件系统和分布式计算框架 MapReduce。前者解决了单一硬件资源的限制,后者通过一系列数学原理,将多类型的数据进行切片并分散存储在特定的分区中,这个设计能够让未来的计算和分析大幅提效。MapReduce 的技术原理是大数据技术发展的最重要基础。

 

很快,开源软件领域开始响应这项技术方案,Lucene 项目创始人 Doug Cutting 在 2006 年正式独立出 Hadoop 开源项目,在其中包括了分布式文件系统,在集群资源上的调度工具,以及最核心的大数据并行处理开发框架。有了 Hadoop 以后,那些面对海量数据分析难题行业从此有了更好的解决方案。只是在 2006 年前后,主要的应用行业还是互联网行业本身。Yahoo,中国的百度等都很快应用了 Hadoop 来解决海量数据的存储和检索问题。

 

任向晖1.png


Hive,Spark 和流式计算

 

在随后的几年中,Hadoop 相关的大数据处理技术继续得到增强。Facebook 开源的 Hive 分析工具用更高层和抽象的语言来描述算法和数据处理流程,能够用 SQL 语句进行大数据分析,这大大降低了使用者门槛,也提升了大数据技术的应用效率。不要小看这项改进,它让全世界大多数现有的数据分析人员可以轻易掌握大数据技术。

 

2009 年,加州大学伯克利分校的 AMP 实验室开发了 Spark 开源集群计算框架,通过完善 API 和库,提供更完善的能力和通用性。而且 Spark 的特色是能够将数据存储在内存中,所以数据处理和查询效率要比利用硬盘存储的 MapReduce 框架快百倍。目前,Spark 已经加入 Apache Software Foundation,成为 Apache 开源项目中的明星项目,被大数据技术领域作为最重要的工具框架。

 

至此为止的技术栈基本解决了针对海量数据批量进行处理和分析的需求。比如零售业企业如果需要研究顾客和交易数据,从而对顾客群进行特征细分,这些技术就足够了。但是,数字化技术的发展总是会刺激出更高级的需求。比如,在线上零售中,商品和顾客的行为数据是永续不断在发生的,我们希望在数据发生的时刻就立即进行计算,及时地给顾客推送一张个性化的优惠券,而不是定时进行某种批量计算,这时候就需要大数据技术的一个分支—流式计算。

 

流式计算的常用框架包括 Storm 和 Spark Stream 和 Flink,他们在零售和电子商务行业中的交易分析、金融风控、物联网中的态势监控、车联网中的自动驾驶等领域都被广泛应用。2019 年,阿里巴巴用 1 亿美元收购了 Flink,是因为我们用的淘宝天猫中的搜索、商品推荐,包括双 11 的实时监控大屏数据都是由 Flink 来驱动的。Flink用几乎无延迟的速度截获双十一最后一秒钟结束后的 GMV 数值,可见它在实时处理数据方面的性能。


NoSQL 数据库

 

与大数据技术同步发展的还包括 NoSQL(非关系型)数据库市场。在上个世纪,大多数商业数据库都是关系数据库,通过 SQL 语言进行数据处理和查询。当大数据技术发展起来后,技术专家们发现数据库完全可以用不同的形态来存储数据,这样可以大幅减少数据分析过程中的预处理工作量。所以,从 2009 前后开始,各种 NoSQL 数据库开始进入市场。

 

下图是维基百科上针对 NoSQL 数据库类型的分类方法:

 

任向晖2.JPG


读者可以忽略其中的细节技术语言,只需要了解不同类型的 NoSQL 数据库会有利于特定场景的应用开发。比如文档数据库采用 JSON 格式存储,可以随心所欲定义不同的数据结构,而且横向扩展性很强(数据规模增大后可以保证查询效率)。我们明道云的工作表就是利用了文档数据库 MongoDB 作为存储方案。

 

NoSQL 数据库普遍支持分布式文件系统,所以都具备很强横向扩展性。和关系数据库相比,NoSQL 数据库大多不具备事务一致性,但是这个牺牲交换得到数据处理的效率,因而作为大数据技术相关的常见存储方案。

 

云计算平台上的大数据服务

 

以上我们介绍了大数据技术发展依赖的各个重要技术栈。很显然,和传统的应用开发相比,大数据技术相对更加复杂。它不仅涉及复杂的编程框架,还需要一个专业的运维体系。这使得大部分普通企业用户很难自己来搭建大数据开发环境。所以云计算平台在基础云服务之外,也开始结合云计算资源提供大数据服务。阿里云上的 MaxCompute 是一个全托管的大数据 SaaS 服务,用户甚至无需管理主机基础设施,直接按照大数据计算任务量付费。


顺便说一下,这种直接将计算服务提供给开发者的模式被称为“无服务器”(Serverless)计算,它的目的是为了简化开发工作中的运维任务,让开发者聚焦在应用开发上。不仅仅是大数据领域,在 AI、物联网等其他技术领域,无服务器服务模式正在日益成为主流。E-MapReduce 则是一整套大数据相关的 PaaS 服务,用户可以选择利用现成的服务在自己控制的云主机上完成部署,客户主要支付的是基础云的资源费用。和阿里云类似,亚马逊 AWS 等其他云计算平台也提供丰富的大数据相关平台服务。

 

应用领域

 

我们前面提到大数据技术起源于搜索引擎应用。在随后的十多年中,它的主要应用场景依然还是在互联网领域。最常见的应用包括计算广告(依据用户和内容数据动态决定广告投放策略和定价),内容检索和推荐(百度、头条),商品推荐和营销活动优化(淘宝、拼多多)。不要小看这几个场景,它们几乎和互联网用户上网过程中的每一分秒都有关系,所以创造了巨大的经济价值。

 

数据的价值当然不仅仅局限于互联网行业,几乎每个产业都有机会在大数据技术的帮助下发掘出数据的价值,或者改善运营效率,或者发现出新的业务机会。金融行业是较早的受益者。银行贷款业务中的风险控制、零售和结算业务中的欺诈发现、保险业务中的精算和保单个性化定价、证券行业中的期货定价和股价预测等都实实在在在创造出财富。

 

大数据在研究和开发领域也在大显身手。在生物医药领域,大数据技术在帮助缩短药物研发的周期和提高成功率;合成化学行业也在利用大数据和机器学习技术来加快发现新材料。有人甚至认为数据科学将成为实验、推演和仿真以外的一种新的科学研究方法,成为“第四范式”。

 

大数据在城市交通、社会治理、能源传输、网络安全、航空航天等领域也都已经有了现实的应用。但在这些资本投入密集的领域之外,大数据在一般行业和企业中的应用依然道路曲折。这不是因为大数据技术不够完善,而是诸多行业尚未能够明确抽象出大数据应用的价值以及可付诸实施的方法论。正如前面提到的,云计算和大数据对于普通中小企业来说依然是一个模糊的技术工具,一般企业也很难雇佣大数据专家,而专业服务企业目前还没有找到利用自己的技术专长提供普遍服务的有效机会。通用领域中的大数据应用还停留在理念阶段。所以,在过去几年出现的大数据技术公司大多都还在服务金融、公安、交通、能源等大客户集中的行业。

 

突破的关键点可能在两个方面,一是大数据技术栈本身十分复杂,当下的工具还依赖专门训练的计算机专家,产业还没有抽象出一个通用领域的应用模型,也无法提供一个类似 SaaS 这样友好的应用界面。这值得数据技术领域和企业应用领域中的跨界专家来探索。二是企业数字化建设还刚刚开始,很多企业缺失稳定和可靠的数据采集和记录的过程。如果没有数据流,自然就不会有大数据应用。因此大数据技术被广泛应用可能还需要五到十年的时间。

 

人工智能(Artificial Intelligence)


人工智能的概念和基本原理起源早至 1950 年代。早期的人工智能研究集中在加州大学伯克利分校,麻省理工,斯坦福和南加州大学等计算机实验室中。今天已经商业化的神经网络算法就来自于半个世纪多前麻省理工大学的明斯基教授发表的《感知元》论文,但是计算机算力在当时实在是太弱了,以至于任何计算理论上的假设都很难付诸于现实。因此,在长达五十年的时间内,人工智能技术都停留在理论研究和一部分不成功的实践上。

 

虽然人工智能领域经历了漫长的冬天,但它所提出的机器向人类学习,并最终在特定领域能够做得比人类更好的假设却是千真万确的。

 

千禧年后的 AI 复苏

 

2000 年以后,有几大动因推动了人工智能概念的复兴。首先,因为摩尔定律的存在,计算机的运算速度和单位存储成本均用指数速率发展到一个新的阶段。云计算和大数据技术也允许计算机用很快的速度处理 TB 甚至 PB 级的数据。其次,网络服务的兴起在诸多领域生产出丰富的数据,Google,Netflix和Amazon的业务就像数据机器一样,每分每秒都能产生海量的用户行为数据。


第三,在人工智能的数学方法研究中,AT & T 贝尔实验室的三位科学家(Tin Kam Ho, Corinna Cortes, 和 Vladimir Vapnik)在机器学习领域取得了突出的进展。机器学习技术可以将复杂和不确定的非线性问题通过线性的数学公式来解决。在解决不同的问题的过程中,机器学习理论方法和实践被明确验证。最早的一批互联网企业,包括 Google,Facebook,Linkedin 等在这个过程中既提供了海量数据,也从研究过程中获得了巨大的成果。尤其是 Google,它是机器学习及其分支深度学习领域最重要的信奉者和推动者。2010 年,Google 成立了 Google 大脑,一个专注人工智能研究的内部组织,后来又收购了英国企业 DeepMind。后者在 2016 年 3 月击败了人类围棋冠军李世石。

 

下图是 Tom Siebe l在 Digitlal Transofrmation 一书中对 AI 技术进化史的一张插图,显示了从 1950 年代开始到现在的主要技术迭代历史。


 任向晖3.jpg


机器学习(Machine Learning)

 

机器学习是推动 AI 复苏的最重要动力。它的兴起标志着人工智能很长时间弯路的终结。要想让机器比人做得更好,并不是依靠人来教机器规则,而是让机器从历史数据中学习。比如最常见的机器学习场景——物体识别,要想让机器从各种照片中找出“猫”,只要让机器学习各种各样猫的照片对象。机器学习算法会将训练用的猫图像背后的向量特征总结为一个预测模型,让这个模型预测任何一张新图片中包含猫的概率。同样的道理,语音识别、语言翻译、人脸识别等都是使用的类似的原理。喂养算法的数据量越大,通常预测的准确率就越高。

 

机器学习应用可以分为有监督学习和无监督学习。前者需要人工参与训练数据的标识,后者则通过数学方法自动聚类出存在相似性的对象。在缺少训练数据的情况,无监督机器学习就会起到更大的作用。

 

机器学习的一个分支被称为深度神经网络(DNN),它的设计已经高度参照了人类大脑神经元的连接结构。在深度神经网络中,数据被输送到输入层,结果则从输出层产生,在输入层到输出层之间存在多个隐藏层,每一层会对输入数据的各个特征进行推断,最终能够得到更为准确的预测结果。打败李世石的 AlphaGo 就是一个基于深度神经网络的算法。但是,DNN 对于用户来说依然是一个黑盒子。设计者并不需要也不会知道神经网络中的每一层到底在判断什么具体特征,以及它是如何分解特征的。它背后都是高度抽象的数学方法。不管它有多么玄妙,深度神经网络的确厉害,它不仅具备高超的自学习能力,而且还简化了传统机器学习中大量复杂和耗时的特性工程(Feature Engineering,通过行业专有知识来调优机器学习算法的过程)。

 

TensorFlow

 

2015 年,Google 开源了内部的 TensorFlow 框架,开始将人工智能计算框架作为一项云计算服务向外界提供。在核心开源库之后,TensorFlow 还陆续推出了 Javascript 版本,满足在浏览器和 Node.js 上开发和训练机器学习模型,以及在移动设备和 IoT 设备上部署的 Lite 版本。另外,TensorFlow Extended 是一个端到端的机器学习生产平台,它连带提供了编程环境和数据处理工具。

 

当然,TensorFlow 并不是唯一的机器学习框架,Caffe,Torch,Keras 等都是。它们无一例外都是开源的。在云计算的前沿领域,软件开源是一个普遍的策略。为什么如此复杂和高级的软件都会义无反顾地选择开源呢?一方面因为框架性产品本身并不直接包含商业价值,价值需要开发者进行二次创造,另一方面,在云计算服务的商业模式大前提下,通过 API 来提供封装好的人工智能服务是一个非常容易实现的商业手段。这些开源产品的运营者没有必要对框架进行收费。

 

人工智能服务

 

事实上,即便你不使用这些机器学习框架,也能直接使用人工智能服务。国内外云计算平台都已经在通过 API 提供各色各样的人工智能服务。这些服务已经完全封装成应用开发接口,开发者完全不需要了解和处理复杂的机器学习过程,只要把自己当作用户就可以了。

 

但是这些服务都非常具体和专向,并不存在任何通用的 AI 接口,每个接口只能为用户解决一类具体问题。以下是阿里云 AI 类目下的服务分布。你可以看出这些服务都和用户的某一个具体需求有关。比如语音识别可以让移动开发者开发出让用户直接通过语音来控制功能的应用。人脸识别可以识别出影像中的人脸对象和实现身份对比验证。

 

任向晖4.jpg


提供一次此类服务要收多少钱呢?在云计算平台上,这类 AI 应用开发接口大多按照次数或者每秒次数级别(QPS)进行收费。比如识别一张身份证上的信息大约要收取 1-5 分钱,听起来不少吧?

 

实际上,从事人工智能技术的企业并不仅仅是云计算平台提供商。比如中国市场中,Face++,科大讯飞、商汤科技、寒武纪、优必选等都分别在计算机视觉、语音、机器人等领域有专长。但是它们的专向定位让这些企业很难提供普遍的开发者服务。因为开发者往往希望在一个云计算平台上获得一揽子服务,而且用户的基础云资源也是从云计算平台购买的。作为开发者来说,拥有一个统一和完善的应用开发环境是非常重要的。

 

所以,在人工智能的商业化中,还有不少企业利用自己的专向技术优势来解决更加细分的问题。比如科大讯飞主要通过自己在语音和自然语言处理方面的技术积累为教育和司法等行业提供解决方案,中国法院的庭审文字记录现在很多都是通过自动化的语音转录而实现的。商汤科技和旷视科技则主要在智慧城市和安防领域提供软硬件一体化方案。还有一组创业企业专注于解决高价值的自动驾驶问题,并从中派生出更细分的 AI 芯片设计和制造企业。

 

技术栈和人才

 

AI 相关的技术栈是前面介绍的大数据技术的一个扩展。也就是说,没有离得开数据获取和处理的人工智能项目。要把如此众多的开发框架和微服务组合在一起,对于非云计算专业企业来说是非常困难的。除了技术栈的复杂性以外,开发者还需要搞定大规模训练数据的获取和处理过程,这个成本在短时间内一定会成为牵制企业投入的因素。

 

成本还是相对容易克服的问题,因为只要问题足够值钱,有长期主义价值观的企业总是愿意投入。但是更致命的问题在于 AI 相关人才的激烈竞争。能够从事 AI 应用开发的团队需要包含大数据相关的数据库专家,深谙数学建模的算法专家,以及熟练掌握 C++ 或 Python 等编程语言的高级程序员,同时还离不开有技术素养的业务专家参与。而在当下阶段,云计算巨头企业和专业企业像吸铁石一样吸引走了绝大多数专长人才,让普通企业根本无从获取。

 

考虑到 AI 技术的复杂性和专业度,它极可能像云计算服务一样,大多数企业都只会成为用户级别的角色,这就给专业开发者留下了创新的空间,看谁能够进行足够合理的抽象,组合出更加易用,面向通用业务场景的 AI 服务。

 

物联网(Internet of Things)


消费产品引爆的物联网普及

 

云计算服务的普及不仅为用户提供了弹性伸缩的经济性,还提供了一个泛在的可连接性。任何计算设备只要连上互联网,就彼此通过 TCP/IP 协议能够相互访问。这个互联价值在物联网技术发展之前还仅仅限于传统计算设备,也就是服务器和个人计算终端。在个人、家庭和企业世界,还有大量非传统计算设备并没有联入这个数字化世界。

 

汽车、家电、个人穿戴设备、工厂的制造设备现在都已经有接入互联网的条件,市场上流通的这些互联智能产品也越来越多。当连接的设备丰富到一定程度的时候,各种智能化场景才能真正实现。IHS Markit 预测到 2025 年,全球联网设备总数量将达到 750 亿个。万物互联,正是物联网技术所追求的愿景。

 

具有数字化连接能力的非常规计算设备在上个世纪 90 年代就已经出现,比如可以无线连接的摄像头。真正具备中长距离连接能力的设备首先出现在零售和工业制造领域,包括西门子,通用电气等企业开发的工业设备互联协议(M2M)。在当时,这些设备已经可以通过低速的无线局域网使用IP协议连接到工厂的控制中心。这样的网络被成为工业以太网。但当时商业互联网并没有开始发展起来,所以M2M的出现只能算作是物联网技术的局部发展。

 

物联网开始成型还是通过消费产品市场来推动的。2000 年代初期,LG 率先推出了可以接入互联网的家电产品,一台联网冰箱售价高达 20000 美元,这显然无法真正带动市场。在随后几年中,像 Garmin GPS 和 Fitbit 智能手环这样的消费电子产品开始获得更大的产销量,从而带动相关的低功耗芯片行业发展。到了 2011-12 年,消费电子领域出现了更多的明星级产品,这其中包括后来被 Google 收购的家用传感器 Nest,Philip 推出的 Hue 智能灯泡等。在中国市场,以小米为代表的智能手机厂商开始扩展到物联网产品领域,推出了一系列围绕个人和家庭的智能设备和家庭网关产品。苹果也于 2015 年正式进入可穿戴产品市场,推出了 Apple Watch,后来还推出了智能音箱 HomePod。Google 和国内的互联网巨头企业也都加入了这场通过新型个人数字设备争夺用户和数据的竞争。目前,全球可穿戴产品市场已经多年保持了 40% 以上的年度增长率。

 

个人和家庭智能设备的量产促进了和物联网相关的协议发展和元器件成本的降低。在这期间,蓝牙 5.0,WiFi-6,IPv6,NFC 和 RFID 等关键传输和通信协议得到进一步发展,让设备能耗和连接速率都进一步提升。在同一时间,云计算基础服务和大数据处理技术也起到了关键作用。物联网设备往往在短时间内会产生大量数据,如果没有前文提到的大数据技术栈,传统的数据库工具是无法承载的,同时云计算也是设备数据汇聚的海洋,今天几乎所有的物联网技术平台都架构在云计算平台上,他们是典型的互生行业。

 

物联网的技术栈

 

物联网相关的技术栈非常综合。它横跨软硬件,既包含感知探测相关的硬件技术,也包含网络传输和应用构筑的软件技术。直至今天,物联网相关的技术栈都没有完全稳定下来,甚至很可能长期保持多元的特征。但是概括起来,整个技术栈还是有一些层次特征。

 

行业一般把物联网相关的技术架构分解为四层,分别定义为和物理环境相关的设备感测层、和数据传输和通信有关的网络层,IoT 相关的平台管理层,以及最终实现用户价值的业务应用层。无论是针对消费市场还是企业市场的物联网系统都会有这四个层次。

 

设备感测层是由各种类型的传感器和可交互访问的硬件模块及其嵌入式软件而组成的。例如温度湿度传感器、摄像头、电源开关和插座和网关等。感测层设备不仅是单向获取数据,还可能从外界接受指令改变硬件状态(比如智能锁)。行业内一般把这个层次称为“边缘”(Edge)。

 

设备感测层的技术栈主要由软硬件协同开发的嵌入式系统构成。我们用的智能手机本质上也是一个嵌入式系统,只是它的嵌入度非常完整,甚至不亚于一台标准计算设备。嵌入式系统开发经历了早期的单片机和嵌入式操作系统/CPU 阶段,目前最前沿的是 SoC(片上系统),把一个专用系统的所有嵌入式软件完全整合在一个集成电路上。今天的智能手机、智能电视等都是由若干个 SoC 整合而成的。在嵌入式系统中,固化在硬件上的软件程序甚至依然可以得到更新,而且这种更新目前大多都可以通过连接互联网实现,这种升级被称之为 OTA (Over-the-air)更新。

 

另外,设备感测层还需要解决设备的访问协议问题。物联网系统目前已经广泛支持 IPv6 协议。IPv6 能够提供全球的 IP 地址总量高达 2 的 128 次方,这是一个天文数字,可以确保任何物联网设备都能够拥有独立的 IP 地址,从而实现在全球的唯一寻址。当全球物联网设备达到千亿,甚至万亿数量级的时候,IPv6 功不可没。

 

网络传输层要解决的是感测设备和计算设备之间,以及最终与平台管理层之间的数据传输问题。根据连接性质不同,又可以分为短距、中距和长距类型,以及有线和无线类型。在这些连接协议中,蓝牙、NFC、Wi-Fi、无线射频(RFID)、4G 和 5G 等是比较常用的。这些传输协议在设备侧一般都是直接设计在板上系统上的,通过IP协议提供可访问地址。开发者需要根据连接的距离、速率、功耗和成本等要求做出合理的选择。

 

IoT 平台层是物联网系统中至关重要的部分,它的出现也标志着基于云计算平台的物联网系统诞生。一个 IoT 平台的核心作用是管理成千上万的物联网设备,包括他们的状态,数据上报接收,建立对它们的控制,对设备进行运维分组,并能够实现从云端往边缘侧的更新推送(OTA)。同时,物联网平台也要借用上文提到的大数据技术栈,对设备上报数据进行处理,并用各种数据库完成存储,这其中比较重要的数据库类型就是时序数据库。

 

更完整的 IoT 平台还包括围绕设备数据建立自动化工作流的能力,数据分析工具以及为更上层的应用开发提供数据开发接口的设计。

 

目前,主流云计算平台都专门为客户提供了物联网技术平台,结合基础云和大数据相关服务获取增值业务收入。阿里云,AWS,Azure 和 Google Cloud 都有专门的解决方案,国内外也有专门的物联网平台技术公司将自己的解决方案架构在基础云上或者提供跨云服务。

 

Oracle,Salesforce 和微软 Azure 等企业软件厂商的物联网平台不仅提供了上述基础服务,还结合了自己的企业应用套装优势,提供一站式的物联网应用开发平台。它们更适合企业物联网系统建设。

 

最上一层的应用层是整个物联网技术架构中最不标准化的部分。应用层最终要将连接的设备和数据用于具体的商业场景。比如共享充电宝就是一个物联网系统,它的应用层包含面向 C 端的租用和支付系统,面向商户的设备状态报告,收益结算系统,以及面向运营部门的设备运维管理系统。换到另外一个物联网场景,应用层的构成可能完全不一样。

 

边缘计算和 AIoT

 

物联网技术架构的基本思路是分层分工,感测层主要取得数据和建立对物理硬件的控制,数据通过网络层和计算平台连接,计算则在云端完成。但是随着物联网应用场景的丰富,设备规模的扩大,以及芯片技术的发展,边缘计算概念开始得到认可。所谓边缘计算,就是利用设备端和邻近网关的计算能力处理和存储数据,减少和云端的数据传输,从而实现更快速的应用响应。除了速度的提升,边缘计算还能够大幅减少云计算和数据传输成本。比如针对一个大型的视频监控网络,如果摄像头将所有的视频流数据都传输到云端,云端算力要求和成本将会非常高。而如果在摄像头设备内部实现必要的视觉计算(比如识别异常),整个物联网系统的效率将大大提高。再例如广泛应用的人脸认证和识别系统,如果不能依赖本地的设备计算能力,十亿用户的高频度使用将会让云平台不堪重负。

 

上面两个例子显示了边缘计算往往和人工智能应用相关,设备侧往往完成的是模式识别类的人工智能算法,因此往往需要专门芯片的助力。Nvidia 公司推出的 Jetson 系列模块就是专门为边缘计算场景而服务的。这些芯片模块被安装在机器人、自动驾驶汽车等边缘设备上,所以这组技术产品也被称为“自主机器”。因为物联网和这些人工智能应用的结合,因此,这套技术方案也常被称为 AIoT。

 

应用领域

 

如果把 2012 年前后作为基于云计算的物联网平台技术发展开端的年份,仅仅八年左右的时间,物联网应用领域已经发展得非常广泛。只是我们身在其中,享受它带来的便利,并不一定能够感知它的存在。这个高速发展过程很大程度上受益于基础云计算服务和大数据技术栈的同步发展。

 

在消费应用领域,个人穿戴设备已经从手表、手环发展到耳环戒指这样的杂项。在智能家居领域,我们可见的家电、门锁、照片、开关、音箱等都已经是互联网设备。在个人和家庭领域,物联网技术竞争已经不再重要,竞争的焦点已经迁移到内容生态和用户网络效应。在这些领域,苹果、谷歌和国内的华为、小米等已经牢牢占据了领先地位。小米生态链重点指的就是依托米家体系的一群消费电子产品企业。

 

在工业、农业、交通运输、能源和社会管理领域,物联网的应用场景更为广泛。我们的街道上已经密布了各种摄像头,这些摄像头通过专门网络构筑了天眼系统;我们头顶上的电力传输网络和用电单位终端也已经完成了智能电网改造;矿场和工地上也都布满了各种安全监控设备。这些都是最近十年来重大的 IT 投资。预计未来十年这样的建设和更新依然不会结束。


云计算的未来


本文主要是对云计算过去十五年的一个回顾。技术领域的发展速度是如此之快,以至于我们很难预测未来的十五年会发生什么。在本文的最后,我仅仅对当下已经呈现的云计算市场趋势做一些简单的概括,它们甚至已经在发生,但我们不知道这些技术趋势的发展具体会颠覆哪些巨头,会催生出哪些明星。

 

存储和计算的成本将进一步下降,但消耗会同步增长。考虑到全球范围内的计算服务还有大量没有转移到云计算环境中,未来十年基础云服务的算力还会大量增加,服务单价会持续下降。

 

前沿技术将持续融合到云计算平台,包括量子计算、AR/VR、区块链等。尤其是那些依赖海量数据计算能力和弹性计算资源的应用,云计算是成就它们更快成长速度的轨道。

 

云计算的核心竞争将聚焦在应用开发环境的优越性上。谁能够提供廉价、完善和前沿的开发技术栈环境,谁就能够获得更多的开发者用户。当开发者用户选择了云服务商后,他们其实就为终端用户做出了选择。

多云、或称混合云环境成为长期的企业应用策略,云计算用户将综合使用边缘、各个云计算服务商和自有 IT 设施。


云计算开发技术栈会越来越复杂,这会让应用开发领域的分工更加明确。面向终端用户的应用开发将变得更加简洁,应用生成的方式会越来越多元,无需编码,依靠普通业务用户建立应用程序的服务商会越来越多。

 


本文作者是明道云创始人,明道云是一个零代码应用平台厂商,通过可视化方式帮助企业用户建立中后台企业应用,具备快速搭建,灵活调整,数据贯通和简单易学的特点。

 

    本文作者:任向晖 责任编辑:张珊 本文来源:牛透社
声明:本文由入驻牛透社的作者撰写,观点仅代表作者本人,绝不代表牛透社赞同其观点或证实其描述。
  • 任向晖
    任向晖
    企业认证
    企业认证
  • 14篇

    文章总数

    13.02万

    文章总浏览数

意见反馈
返回顶部