<p style="text-align: center;"><strong><img alt="" src="https://simg.open-open.com/show/988125c04f1b57cf3a5f7ea76d4aa4b2.png" /></strong></p> <p>Hive是一个基于Hadoop的开源数据仓库,用于存储和处理海量结构化数据。它是非死book 2008年8月开源的一个数据仓库框架,提供了类似于SQL语法的HQL语句作为数据访问接口,Hive有如下优缺点:</p> <p>优点:</p> <ul> <li>Hive 使用类SQL 查询语法, 最大限度的实现了和SQL标准的兼容,大大降低了传统数据分析人员学习的曲线;</li> <li>使用JDBC 接口/ODBC接口,开发人员更易开发应用;</li> <li>以MR 作为计算引擎、HDFS 作为存储系统,为超大数据集设计的计算/ 扩展能力;</li> <li>统一的元数据管理(Derby、MySql等),并可与Pig 、Presto 等共享;</li> </ul> <p>缺点:</p> <ul> <li>Hive 的HQL 表达的能力有限,有些复杂运算用HQL 不易表达;</li> <li>由于Hive自动生成MapReduce 作业, HQL 调优困难;</li> <li>粒度较粗,可控性差</li> </ul> <p style="text-align: center;">Hive运行架构</p> <p style="text-align: center;"><a href="https://simg.open-open.com/show/ef4c85fc0e2ee7dd847b329ae738878e.jpg"><img alt="" src="https://simg.open-open.com/show/ef4c85fc0e2ee7dd847b329ae738878e.jpg" /></a></p> <h2>下载</h2> <ul> <li><a href="/misc/goto?guid=4958996182354377783" rel="nofollow"><strong>Source code</strong> (zip)</a></li> <li><a href="/misc/goto?guid=4958996182456158233" rel="nofollow"><strong>Source code</strong> (tar.gz)</a></li> </ul> <p>本站原创,转载时保留以下信息:<br /> 本文转自:深度开源(open-open.com)<br /> 原文地址:<a href="http://www.open-open.com/news/view/7e4a7e75">http://www.open-open.com/news/view/7e4a7e75</a></p>