前回に引き続きessential pysparkの第一章を攻めていく。 Big data processing with Spark SQL and DataFrames Transforming data with Spark DataFrames Domain Specific Language (DSL)という操作方法で構築されている immutable 各列はどんなデータ型も取れる 操作はtransformationとactionから構成される Transformations: あるデータフレームの操作が他のデータフレームに影響を及ぼすもの(e.g.. read, select, wh…