Dataset可以认为是DataFrame的一个特例,主要区别是Dataset每一个record存储的是一个强类型而不是一个Row,因此具有如下三个特点: · Dataset可以在编译时检查类型 · Dataset是面向对象的编程接口 · 后面版本DataFrame会继承DataSet,DataFrame是面向Spark SQL的接口。 DataFrame和Dataset可以相互转化,df.as[ElementType]这样...