HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现...
该团队认为需要结合使用分布式文件系统和NoSQL数据库以存储在ETI企业内部或外部产生的大量原始数据集和经过处理的数据。 任何基于行的文本数据,诸如记录由文本的分割线来划分的网络服务器的日志文件,和那些可以以流传输的形式处理的数据集(一个接一个地处理记录,不需要对特定的记录进行随机访问)将会被存储在Hadoop的...
大数据企业实训项目:基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘包括查看文件列表,多文件上传,创建文件夹,文件重命名...