腾讯首次披露了自己的大数据核心技术体系,发表了“构建大数据的道路”
- 时间:
- 浏览:0
在8月31日刚刚出版的《通往大数据构建之路》中,首次公开了自身大数据核心技术架构和大量业务应用实践。作为中国大数据领域的尖端技术著作,该书汇集了大数据领域数十位技术专家的思考和实战精髓,通过全面解剖自身对大数据领域的探索和到达,为中国大数据工作者提供了有价值的参考文献。
[腾讯公司]副总裁[蒋杰]显示:ldquo;从第一代离线计算到隐私计算,数智融合,以云本地为代表的第四代大数据技术,腾讯大数据团队不断基于内部的大规模业务实践,打造领先的技术和产品服务内外的广大客户。未来,我们将通过“腾讯”云继续开放大数据领域的技术和诀窍,与合作伙伴合作,为各行各业的客户创造价值,加速数字经济与现实经济的融合。rdquo;
根据《大数据产业发展规划》,当前数据成为重要的生产要素,大数据产业成为激活数据要素潜能的重要支撑,成为加快经济社会发展质量变革、效率变革和动力变革的重要引擎。此次发布的“腾讯大数据构建之路”,系统再现了大数据技术在“腾讯”内部的应用发展与演化,对促进国内大数据产业共同进步具有积极意义。
这本书是由腾讯数据平台部和机械工业出版社共同制作的,内容大致分为两部分。第一部分主要阐述了腾讯大数据平台的技术体系。第2部分介绍通过腾讯云打开腾讯大数据的产品群。
第一部分,大数据团队从自身平台的发展过程和总体结构入手,深入介绍了各项技术原理,并亲自研究了实战过程中的挑战和核心技术的设计思想。它涵盖了访问大数据、计算、存储、分析和调度等多个技术元素的总体架构和应用程序展示。详细分析了大量重量级产品,包括实时数据采集TDBank、新一代大数据分布式存储Ozone、高性能大数据SQL引擎SuperSQL、自行开发的高性能分布式机器学习平台“Angel”。
以分布式计算为例,SuperSQL的关键技术,以及OLAP的数据分析、跨数据中心的查询优化等各种场合都有应用。SuperSQL作为一个跨数据源、数据中心和计算引擎的高性能大数据SQL引擎,可以优化集群的使用,提高业务数据的使用效率,帮助解决业务数据孤岛问题。目前,SuperSQL已部署在腾讯内部网和外部客户中,通过跨数据中心的多个群集对接,每个群集的规模将达到数百台。
图:图腾讯是SuperSQL系统架构。
第二部分,大数据团队主要介绍数据治理、数据应用、机器学习等方面的建设经验,了解大数据产品及其内外场景的实践落地。腾讯以自研机器学习平台Angel为例,其功能涵盖了传统的机器学习、图挖掘、图学习、深度学习、隐私计算等,是国内第一个世界顶级的AI开源基金会mdash。mdash;毕业于LF AI基金会的顶级项目,自2017年开源以来,已经被华为、小米、OPPO等100多家企业和组织使用。在本书中,腾讯大数据团队可以分层分析其系统架构、执行架构和功能特性,帮助读者深入认识和理解。
此外,针对业内人士在大数据运行方面存在的广泛问题,从大数据平台的规划、平台治理、运行维护体系的建立、运行成本的优化、数据资产的管理等方面系统地介绍了腾讯积累的经验。随着海量数据业务的爆炸式增长,这是提高平台自律性、以数据驱动型运用为目标不断探索的结果,对于有大数据平台构建和运用维护需求的企业和团队来说,这将是直接的参考。
图腾讯是大数据运用分析活用系统的构筑。
在刚刚召开的首届“腾讯”云大数据峰会上,“腾讯”云副总裁刘煜宏介绍,“腾讯”云大数据平台计算力突破1000万核心,单日实时计算量达到100万亿级。一天的执行集装箱数量超过亿,一天的计算数据量超过数百倍,服务提供企业的客户数量超过2万家,开源的社区代码贡献量超过800万行,进一步显示了其在大数据领域的顶级实力。