该join task由在两个数据集上进行复杂计算的两个子task组成。在该task的第一部分,每个系统必须要在用户访问表中找到特定日期区间内具有最高收入值的那个IP地址。一旦中间记录生成之后,系统必须计算出该区间内所有被访问页面的平均PageRank大小。 DBMS擅长处理具有复杂join操作的查询任务。如表所示,DBMS分别比Hadoop快了3...