注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

データ基盤のセキュリティ

概要

Foundry の全体的な目標は、ユーザーの組織内の客観的な現実の正規のビューを提供することです。この現実を構築する最初のステップは、データ基盤を構築し、許可を与えることです。データ基盤をどのようにセキュリティで保護するかを説明するために、我々はSky Industriesという航空機製造会社の仮想的な例を通じて説明します。我々は、Sky Industries の開発者を表現し、生のフライト、滑走路、空港、アラート、ルート、および乗客のデータを統合し、それをオントロジーに準備し、それをSky Industries の全組織に利用可能にします。

プロジェクトの作成

データ基盤を設計する際の重要な部分は、将来の拡大と簡単なメンテナンスを可能にするために、ユーザーの本番データパイプラインに必要なプロジェクトが何であるかを決定することです。我々の例では、我々は推奨されるプロジェクト設定を使用し、それぞれが異なる目的を持つ3つのプロジェクトを持つことになります:

  • Flight Control System [Datasource]: Bureau of Transportation Statistics (BTS)からの生のデータがこのプロジェクトで取り込まれ、クリーニングされます。
  • Flight Delays [Transform]: データセットは*Flight Control System [Datasource]*プロジェクトからインポートされ、再利用可能なデータセットを生成するために変換されます。
  • Aviation [オントロジー]: データセットは*Flight Delays [Transform]*プロジェクトからインポートされ、組織の個々のオブジェクトを表現するために変換されます。

ユーザーのFoundryインスタンスによっては、プロジェクトと/またはグループを同時に作成できる場合があります。目指すのは、各プロジェクトに3つのグループがあり、それぞれがデフォルトのロール(例えば、Viewer)にマッピングされていることです。我々は我々のプロジェクトが我々の組織の他の人々によってすべて発見可能であることを望むので、我々はプロジェクトのデフォルトのロールをDiscovererに設定します。また、各プロジェクトでコードリポジトリを作成します。これは、我々の変換が存在する場所です。以下は、**Flight Delays [Transform]**プロジェクトの最終設定です。

Flight delay project

プロジェクトの参照

我々のパイプラインを構築するためのプロジェクトができたので、我々はFoundryを使ってビジネスロジックを作成し始めることができます。ベストプラクティスの詳細は、データ統合ドキュメンテーションをご覧ください。

我々が他のプロジェクトからデータを使用する前に、我々は現在のプロジェクトでそれに対する参照を作成する必要があります。一度そうすれば、我々はそのデータセットを我々のビルドで使用し、我々のプロジェクトの誰でもそのデータに対する変換を作成することができます、ソースプロジェクト自体へのアクセスがなくても。

以下は、我々が**Flight Control System [Datasource]プロジェクトのflightsデータセットへのプロジェクトの参照を我々のFlight Delays [Transform]**プロジェクトに追加したときの様子です。

Project references

我々のすべての変換を書き終えた後、以下は我々の最終的な生産パイプラインの様子です。

Flight alert pipeline data lineage view

我々のパイプラインが3つのプロジェクトをカバーしているので、我々は各プロジェクトごとにユーザーに特定のロールアクセスを別々に与えることができます。

例えば、我々は我々の最初の運用ユーザー、EricをAviation [オントロジー] - Viewerグループに追加します。これにより、彼は**Aviation [オントロジー]プロジェクトにViewerアクセスを持つことになります。デフォルトのロールがDiscovererであるため、これらのユーザーはFlight Control System [Datasource]Flight Delays [Transform]**プロジェクトではDiscovererアクセスしか持たないが、Aviation [オントロジー]プロジェクトではViewerとなります。ただし、Datasourceプロジェクトへのディスカバラーアクセスを持つことが、ユーザーがオントロジープロジェクトのような下流のデータへのアクセスを許可されることを妨げることはありません

以下は、Ericのリソースアクセスの様子です。

Flight alert pipeline permissions view for first user.

Ericの同僚であるLindaは、生産パイプラインを維持する人です。したがって、Lindaは全3つのプロジェクトの対応するオーナーとエディターグループに追加されます。パイプラインを個々のプロジェクトとグループに分割するのは、長期的にメンテナンスするのが最も簡単です。

Flight alert pipeline permissions view for second user.

データの共有

データやリソースを同僚と共有することを推奨します。これは、彼らを正しいプロジェクトグループに追加することにより行います。これにより、彼らはプロジェクトへの均一なアクセスを持つことができます。これは、リソースを直接共有するよりも理解しやすく、管理しやすいです。

また、ユーザーは同僚にデータやファイルに直接アクセスすることでデータを共有することもできます。これを行うには、右上のShareボタンを選択するか、テーブルビューのファイルを右クリックします。次に、リンク共有を有効にし、共有可能なURLをコピーし、そのリンクを同僚に送信します。リンクを持っている人は誰でもファイルにアクセスでき、指定したロール(例えば、Viewer)が付与されます。

Share dataset