AWS 首席云计算企业战略顾问张侠博士分享了主题为《AWS云计算引领 IT 转型与创新》的演讲。

张侠博士谈到,数字化的时代,数据已经成为最重要的战略资产。如果把大数据、机器学习和人工智能结合在一起,就可以用这些数据来做一些前瞻性的数据分析,实现对大数据更广泛、深入的应用,进行预测性的分析。数据湖与分析是企业数字化转型的关键核心之一,当下,用户对数据的需求一直在增长,数据量从TB发展到PB,再到EB,及时性也从微秒到毫秒,然而传统数据库不能应对数据的增长,形成数据孤岛,数据不能发挥应有的价值,而云数据湖以可扩展和演进的数据架构、支持各种格式存储、各种方式分析数据,以及高可用、高持久、EB级、安全合规、可审计等优点。

AWS 提供最安全、可扩展、全面且经济高效的服务组合,使客户能够在云中构建数据湖,以及使用机器学习等各种分析方法分析所有数据,包括来自 IoT 设备的数据。

AWS数据湖以Amazon S3为核心,Amazon S3是一种安全、高度可扩展、持久的对象存储,具有毫秒级的数据访问延迟。

云数据仓库方面,Amazon Redshift能够提供性能优秀、强大、使用简单、全托管的数据仓库服务,只有本地1/10的成本,大规模并行处理, 支持从GB 到 TB 规模数据的扩展。

除此之外,Amazon EMR作为原生云大数据平台,可用于快速且经济高效地大规模处理海量数据,轻松运行和扩展 Apache Spark、Hadoop、HBase、Presto、Hive 以及其他大数据框架。Amazon Elasticsearch Service可以实现全托管,可缩放, 安全的 Elasticsearch 分析服务,Amazon Kinesis可以轻松地实时收集、处理并分析视频和流数据,Amazon Athena使用标准 SQL 对 Amazon S3 上的数据做交互查询,无需基础设施及配置,无需另外加载数据,具备即刻查询、开放结构、易于使用等优势。AWS Glue提供无服务器架构的数据目录和 ETL 服务,AWS Database Migration Service提供数据库迁移服务。

人工智能是备受关注的未来创新技术,AWS在该领域也一直走在前沿,张侠博士介绍了AWS在人工智能和机器学习应用方面的能力,过去一年时间,AWS新推出了近250项人工智能方面的服务和功能。AWS针对机器学习的中间平台之关键服务Amazon SageMaker和Amazon SageMaker Studio近期将正式在中国区域推出,目前这个服务在中国可进行有限预览。

Amazon SageMaker是AWS近期在中国发布的服务,作为一种完全托管的机器学习服务,Amazon SageMaker能够让数据科学家和开发人员快速轻松地将基于机器学习的模型构建到智能应用程序的生产实践中,Amazon SageMaker为开发者提供了弹性笔记本、实验管理、自动模型创建、模型调试分析,以及模型概念漂移检测等强大功能,并将这些功能封装在首个面向机器学习的集成开发环境(IDE) Amazon SageMaker Studio中,如今已有上万用户在使用Amazon SageMaker。

在人工智能与机器学习分会场,AWS的几位专家围绕着机器学习的模型训练、机器学习研发和使用、以及如何将TensorFlow脚本跑在Amazon Sagemaker上等话题进行了精彩的分享。

AWS拥有最广泛,最完整的机器学习功能集,无论是图像识别、文档阅读、文本转语音、语音转文字、个性化推荐、智能预测、欺诈预测、智能企业检索还是智能代码检查,AWS都提供了强大的工具和应用。

AWS的机器学习服务分为三个层次,ML框架和基础架构、ML平台和AI服务,在ML框架和基础架构方面,AWS支持各种主流的机器学习基础框架,比如TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod、Keras等;也支持AWS Glue、Amazon Kinesis这种机器学习数据库或者数据接口等。基础设施方面,AWS提供各种各样机器学习的虚拟机、实例和镜像,提供GPU的计算实例Amazon EC2 G4,也提供Amazon EC2 P3这样专门做并行计算、适合机器学习的实例类型,还推出了Amazon Elastic Inference,在Amazon EC2上动态地挂一个专门的GPU,然后自动缩放,以比较低的成本来做机器学习推理工作。AWS还推出了基于独家定制芯片的Amazon Inferentia Inf1实例,专门用于机器学习推理。

ML平台方面,Amazon Sagemaker是覆盖了完整的机器学习工作流,在数据准备阶段,Amazon Sagemaker利用自动标注功能将数据标记成本降低高达70%,在数据准备阶段,Amazon Sagemaker具备安全托管、自定义处理任务、容器支持、安全合规、自动创建和终止等优势,在模型构建阶段拥有多种算法选择,模型训练阶段,可以一键训练您的模型,部署阶段可以一键部署,并持续监控生产环境中的模型。

在AI服务层面,AWS提供了比较现成的人工智能服务,如Amazon Rekognition图像识别服务,Amazon Polly文字转语音、Amazon Transcribe语音转文字这样的语言服务。Polly、Transcribe在中国已经向用户提供。另外有语言理解、语言翻译、语义识别和读取这些文字处理服务。这次还新推出了在企业内部做全局搜索的Amazon Kendra搜索服务。