注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
Data Connection は、外部システムからのデータを同期し、Foundryで使用するためのアプリケーションです。ユーザーは、Data Connectionを使用して、データ統合、モデリング、およびオントロジーレイヤーで使用するために、データをFoundryに同期することができます。また、Data Connectionを利用して、Webhookとデータエクスポートを通じて外部システムに書き戻しを可能にするアウトバウンド接続を設定することも可能です。
ワークスペースのナビゲーションバーからアイコンを選択して、Data Connectionアプリケーションにアクセスします。
また、アプリケーションポータルで検索して、Data Connectionアプリケーションを見つけることもできます。
組織で初めてFoundryをユーザーのデータに接続する場合は、初期設定ガイドを参照して開始してください。
Foundryは、次の3つの原則でデータ接続プロセスを標準化します。
しばしば、システム間のデータ接続は、回復が難しい障害に見舞われる可能性があります。外部環境でユーザーの制御を超えて生じる問題(例えば、ネットワーク接続の悪さ、ディスク障害、応答しないソースシステムなど)がデータ同期に影響を与え、下流の分析パイプラインも壊れてしまう可能性があります。不完全なデータや破損したデータは、技術的な課題だけでなく、組織にとっても、それが気づかれずに使用されたり、緊急のニーズに対応できなかったりすると、危険な可能性もあります。
Foundryは、自動的なリトライ機能を利用して障害から回復したり、シンプルな関数(例えば、ファイルシステムやデータベースの同期)を利用してソースシステムから小規模なバッチでデータを取り込んだり、統合されたデータヘルス監視システムを利用して重大な障害を警告したり、パイプラインの健康状態の問題を把握したりすることで、これらの一般的な障害点を積極的に対策します。これらの機能は、不完全なデータや破損したデータのリスクを最小限に抑えます。
また、Foundryは、データは最も原始的なソースから「そのまま」取り込まれるべきであり、外部の前処理は行われないという哲学によって特徴づけられています。外部の前処理がない場合、分岐しバージョン管理されたFoundryのパイプラインは、生データがオントロジーへと進む過程で生じたすべての変更の唯一のソースとなり、そのパス上で生じる問題はプラットフォーム内で特定し解決することができます。Data Connectionは、この設計哲学に従って、表形式とファイルベースの同期をサポートし、データが目的のデータセット(Foundryパイプラインの起点)に到達する前にデータをトランスフォームするための最小限のオプションを意図的に提供しています。
エンタープライズには、個々にも統合システムとしても価値を持つ複雑なシステムの配列があります。各システムには、統合に必要な要件があり、一部のシステムには、統合を通常困難にする独自の機能や特性が必要です。
Foundryは、よく知られたシステムタイプ(例えば、関係データベース、FTPS、HDFS、S3、SFTP、ローカルディレクトリなど)とのボックス内統合を提供するだけでなく、新しいシステムタイプからデータを接続し同期する柔軟性も提供します。多くの場合、新しいシステムは既存のプラグインを再利用するか、わずかな変更だけで利用することができます。コア機能(例えば、スケジューリングやアップロード)は標準化されているため、接続自体だけを調整する必要があります。
利用可能なソースタイプの全範囲については、こちらをご覧ください。
システム間のデータ接続を管理することは、同期、認証、スケジューリングとオーケストレーション、監視など、すべてのステップを負担する管理者にとって、大きな負担となるプロセスです。
Foundryは、この複雑さを抽象化し、バックエンドサービスが大部分の作業を引き受け、ユーザーがシンプルなフロントエンドユーザーインターフェースを通じてパイプラインを設定し管理することができます。これにより、通常は技術的に複雑なタスクへの敷居を下げ、より多くのユーザーがデータ接続を行うことが可能になります。