作者:禅与计算机程序设计艺术
1.背景介绍
随着互联网、移动互联网、云计算、大数据技术的快速发展,越来越多的企业将数据作为核心资产运用在新的业务模式中,因此需要进行数据的安全保护、分析处理以及可视化展示等一系列技术措施来支持业务的决策和执行。而数据平台工程师作为资深的数据技术专家和数据科学家,则需要具备丰富的数据相关知识以及丰富的大数据开发经验,才能更好的实现数据平台架构设计、运行管理、性能调优等功能。
《大数据架构师必知必会系列:大数据概念与技术基础》主要内容包括:
1、大数据基本概念与关键术语 2、大数据存储与查询技术 3、大数据计算技术及相关算法 4、大数据分析与处理技术 5、大数据搜索引擎技术 6、大数据流式计算技术 7、大数据安全技术 8、大数据平台架构设计及实践案例 9、大数据可视化技术
文章将从云计算、分布式文件系统、分层存储、键-值存储、列式存储、搜索引擎、MapReduce、Spark、Storm等多个角度阐述这些核心技术背后的原理和特性,并结合实际场景案例,带领读者了解大数据核心技术的最新进展和发展方向。文章力求全面细致,从细节入手,为读者呈现实践指导,并提供参考价值。
2.核心概念与联系
2.1 大数据基本概念
数据量
数据量是指能够被收集、存储、处理和分析的信息总量。它可以是结构化或者非结构化,并且随着时间不断增长。目前的数据总量已经超过了以往收集方式所能容纳的数据量,这就要求对数据的采集、处理、存储、检索等流程更加高效、智能、自动化,传统的关系型数据库无法承受这样的数据量的需求。因此,出现了大数据这一术语,用于描述超出一般计算机处理能力的数据。
数据类型
根据数据来源不同,大