SparkR リファレンス

SparkR 入門

Code Workbook では、Spark R とネイティブ R の両方を使用できます。Spark R は、大規模なデータセットでの選択、フィルター処理、集約などの操作をサポートする分散データフレーム実装を提供します。ユーザーはネイティブ R により慣れているかもしれませんが、大規模なデータセットをフィルター処理する前に、まず SparkR を使用することをお勧めします。

一般的な SparkR 操作

SparkR のすべての可能な操作を確認するには、API ドキュメント↗を参照してください。以下では、一般的な操作の構文を説明します。

フィルター処理

フィルター処理の式は、文字列として渡される SQL ライクな WHERE 句になります。

←

PREVIOUSPySpark リファレンス

NEXTR ファイルシステム API

→