大数据架构概览

来自： http://www.thebigdata.cn/JieJueFangAn/29071.html

Big Data非常复杂，涉及到的技术繁多。我们常“耳闻”的技术，如果MapReduce, Hadoop等处于哪一层次，下图会给你一个整体印象。

图片：databricks.jpg

下面是常见的技术简介：

HBase ：是一个分布式的、面向列的开源数据库。其设计理念源自谷歌的 BigTable，用 Java 语言编写而成。

MongoDB ：是目前非常流行的一种非关系型(NoSQL)数据库

YARN ：这是新一代的 MapReduce 计算框架，简称 MRv2，它是在第一代 MapReduce 的基础上演变而来的

Spark ：是一个基于内存计算的开源的集群计算系统，其目的在于，让数据分析更加快速。Spark 是由加州大学伯克利分校的 AMP 实验室采用 Scala 语言开发而成。Spark 的内存计算框架，适合各种迭代算法和交互式数据分析，能够提升大数据处理的实时性和准确性，现已逐渐获得很多企业的支持，如阿里巴巴、百度、网易、英特尔等公司均是其用户。

原文：

https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan

本文由用户 PattiMaes 自行上传分享，仅供网友学习交流。所有权归原作者，若您的权利被侵害，请联系管理员。

转载本站原创文章，请注明出处，并保留原始链接、图片水印。

本站是一个以用户分享为主的开源技术平台，欢迎各类分享！

本文地址：https://www.open-open.com/lib/view/open1454302509105.html

热门搜索

大数据架构概览

下面是常见的技术简介：

原文：