官方链接:Apache Hadoop官网 Apache Kafka 特点:Kafka是一个分布式流处理平台,由LinkedIn开发,后来贡献给了Apache基金会。 功能:高吞吐量的消息传递、实时数据流处理。 适用场景:构建实时数据管道和流式应用。 官方链接:Apache Kafka官网 Elasticsearch 特点:Elasticsearch是一个基于Lucene构建的开源搜索引擎,提供全文搜索...
在Nutch的进化过程中,产生了Hadoop、Tika、Gora和Crawler Commons四个Java开源项目。如今这四个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理的事实上的标准。Tika使用多种现有的开源内容解析项目来实现从多种格式的文件中提取元数据和结构化文本,Gora支持把大数据持久化到多种存储实现,Crawler Commons是...
一款Java 语言编写的国产时序数据库,为用户提供数据收集、存储和分析等服务。 与Hadoop、Spark和可视化工具(如Grafana)无缝集成,满足了工业 IoT 领域中海量数据存储、高吞吐量数据写入和复杂数据查询分析的需求。 最早听说 iotdb 这个项目,是通过博士五年,我在清华做时序数据库这篇文章。铁头乔大佬 2016 年西安交大计算...
因为没数据研发相关经验 所以问的都比较简单😄😄😄一面30分钟Hadoop是什么,怎么理解的两道sql手撕hive on spark和spark on hive的区别说一个sql优化的工作数仓怎么建模,给了一个订单收货退货的场景怎么去建模二面 20min简历挖掘有个指标异常怎么排查Hadoop的构成 查看7道真题和...
mall项目是一套电商系统,包括前台商城系统及后台管理系统,基于SpringBoot+MyBatis实现。前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等...
(含详细目录+答案),覆盖技术领域:JVM、Java集合、Java多线程/并发编程、Java基础、Spring原理、微服务、Netty与RPC、网络编程、日志、ZooKeeper、Kafka、RabbitMQ、HBase、MongoDB、Cassandra、设计模式、负载均衡、数据库、一致性算法、Java算法、数据结构、加密算法、分布式缓存、Hadoop、Spark、Storm、YARN、机器学习、云...
一个基于spring boot的JAVA开源商城系统,是前后端分离、为生产环境多实例完全准备、数据库为b2b2c商城系统设计、拥有完整下单流程和精美设计的java开源商城系统:https://www.mall4j.com
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 3、Spiderman 码云地址:l-weiwei/Spiderman2 - 码云 - 开源中国 ...
免费开源CRMEB商城JAVA版,SpringBoot + Maven + Swagger + Mybatis Plus + Redis + Uniapp +Vue+elementUI 包含移动端、小程序、PC后台、Api接口;有产品、用户、购物车、订单、积分、优惠券、营销、余额、权限、角色、系统设置、组合数据、可拖拉...
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 3、Spiderman 码云地址:l-weiwei/Spiderman2 - 码云 - 开源中国 ...