有一个很棒的pyspark包,它比较两个 Dataframe ,包的名字是datacompyhttps://capitalone.github.io/da...
比较Pyspark中两个不同的dataframes中的两个arrays 我有两个dataframes,因为它有一个数组(字符串)列。 我正在尝试创建一个新的数据帧,它只过滤行中一个数组元素与另一个元素匹配的行。 #first dataframe main_df = spark.createDataFrame([('1', ['YYY', 'MZA']), ('2', ['XXX','YYY']), ('3'...
有一个很棒的pyspark包,它比较两个 Dataframe ,包的名字是datacompyhttps://capitalone.github.io/da...