データ統合ファイルシステムおよび Blob storesFTP/FTPS

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

FTP/FTPS

Foundry を FTP 及び FTPS サーバーに接続して、フォルダーと Foundry データセット間でデータを同期します。

サポートされている機能

機能ステータス
一括インポート🟢 一般に利用可能
探索🟢 一般に利用可能
増分🟢 一般に利用可能

データモデル

このコネクタは、任意のタイプのファイルを Foundry データセットに転送できます。ファイル形式は保持され、転送中または転送後にスキーマは適用されません。必要なスキーマを出力データセットに適用するか、または下流の変換を書くことでデータにアクセスします。

パフォーマンスと制限

転送可能なファイルのサイズに制限はありません。ただし、ネットワークの問題により、大規模な転送が失敗することがあります。特に、2日以上かかる直接のクラウド同期は中断されます。ネットワークの問題を避けるために、小さなファイルサイズを使用し、同期の各実行で取り込むファイルの数を制限することをお勧めします。同期はスケジュールされ、頻繁に実行できます。

セットアップ

  1. Data Connection アプリケーションを開き、画面の右上隅にある + New Source を選択します。
  2. 利用可能なコネクタタイプから FTP/FTPS を選択します。
  3. インターネット経由で 直接接続を使用するか、または 中継エージェントを介して接続するかを選択します。
  4. 以下のセクションの情報を使用して、コネクタのセットアップを続けるための追加の設定プロンプトに従います。

直接接続を設定するには、Foundry がインターネット経由で FTP サーバーにアクセスできる必要があります。オンプレミスの FTP サーバーにアクセスするには、エージェントを介して接続を選択してください。

Foundry でのコネクタの設定について詳しく学びましょう。

認証

FTP/FTPS の認証は、ユーザー名とパスワードを使用して完了します。FTP ユーザーが接続の設定に対してルートディレクトリの権限を持っていない場合、FTP/FTPS 接続が失敗する可能性があります。ルートディレクトリに関する詳細は、設定オプションを参照してください。

オプション必須?説明
UsernameはいFTP ログインユーザー名。
PasswordはいFTP ログインパスワード。このフィールドは、匿名ログインの場合は空の値にすることができます。詳細については、サーバー管理者にお問い合わせください。

ネットワーキング

直接接続が FTP/FTPS コネクタを実行している場合、接続をホワイトリストに登録するためにネットワーク出口ポリシーを追加する必要があります。

出口ポリシーは、FTP サーバーのドメイン(ドメイン名で接続する場合)および制御ポート(通常はポート 21)とデータポートに解決する FTP サーバーのドメイン名に対する IP を作成する必要があります。データポートは、FTP サーバーの管理者によって決定されます。適切な出口ポリシー設定にもかかわらずエラーが続く場合は、適用したポリシーのリストを引用して問題を提出します。

UNIX マシン上で、サーバードメインが解決する IP アドレスを次のように実行して見つけます:

Copied!
1 2 3 # 'dig' コマンドは DNS ルックアップを行います。特定のドメインに関する情報を取得します。 # '+short' オプションは結果を短縮形で表示します。 dig <ドメイン> +short

サーバーのドメインが複数のドメインやサーバーに解決する場合、関連する全てのドメインとそれらの関連する IP をホワイトリストに登録する必要があります。サーバーが複数のドメインやサーバーに解決するかどうかを確認するには、接続しようとしているサーバーの dig <domain> コマンドをターミナルから実行し、結果のセクションを確認してください。

エージェントがユーザーのコネクタを実行している場合、エージェントのサーバーが FTP/FTPS サーバーにネットワーク接続を確立できるようにし、ファイアウォールが適切に設定されていることを確認してください。必要に応じて、ネットワーク接続を確認するために netcat や同様のユーティリティを使用することをお勧めします。

証明書と秘密鍵

以下のガイダンスに従って、クライアントまたはサーバーの証明書と秘密鍵を追加設定し、ユーザーのコネクタを適切に設定してください。

SSL とホスト名の検証

SSL 接続はサーバーの証明書を検証します。通常、SSL の検証は証明書チェーンを通じて行われます。デフォルトでは、エージェントと直接接続の両方のランタイムは、ほとんどの業界標準の証明書チェーンを信頼します。接続しようとしているサーバーが自己署名証明書を持っている場合、または接続に対してファイアウォールが TLS インターセプションを行っている場合、コネクタは証明書を信頼しなければなりません。Data Connection での証明書の使用について詳しく学びましょう。

SSL 検証を正常に行うためには、サーバーが完全な証明書チェーンを提供する必要があります。FTP サーバーの証明書チェーンは、openssl s_client -connect {hostname}:{port} -showcerts -starttls ftp コマンドを実行することで取得できます。証明書チェーンを確認するためには、OpenSSL のコマンドラインユーティリティや他の利用可能なツールを使用してください。

FTPS を使用している場合、FTPS サーバーの証明書がエージェントの信頼ストアに追加されていることを確認してください。

Foundry はすべての出口ルートの検証を試みます。しかし、FTP は検査できないため、接続が中断したりタイムアウトエラーが発生したりします。適切な出口ポリシーの設定にもかかわらずエラーが続く場合は、ホスト名検証を無効にしたいポリシーのリストとともに問題を報告してください。

暗黙的/明示的 SSL

FTP サーバーは、暗黙的 SSL または明示的 SSL のいずれかをサポートするように設定できます。通常、ポート 990 で動作しているサーバーは暗黙的 SSL を使用しています。

サーバーの設定をサーバー管理者に確認してください。デフォルトでは、コネクタは明示的 SSL を想定していますが、ユーザーの環境に合わせてこの設定を変更する必要があるかもしれません。

接続要件

FTP は CONTROLDATA の接続タイプが必要です。DATA 接続は ACTIVE または PASSIVE モードで設定されている必要があります。

  • CONTROL: クライアントからサーバー
  • DATA: データは範囲から選択(例:1024-1123)
    • PASSIVE: クライアントからサーバー
    • ACTIVE: サーバーからクライアント
      • エージェント接続のみで動作

デフォルトの FTP/FTPS コネクタポート:

  • FTP: 21
  • FTPS 明示的: 21
  • FTPS 暗黙的: 990

アクティブモードとパッシブモード

パッシブモード のネットワーク接続を使用することをお勧めします。パッシブモードでは、すべての接続はクライアントから開始されます。パッシブモードを使用する場合、コントロールポート(通常は 21)とデータ転送用のポート範囲(例:1024-1123)がホワイトリストに登録されていることを確認してください。接続の詳細を取得するには、FTP/FTPS サーバーの管理者に連絡してください。

アクティブモード は、ファイル転送を確立するための古い方法です。アクティブモードでは、クライアントはサーバーに接続し、サーバーはクライアントに接続します。サーバーとクライアントは互いに依存しており、双方向 のネットワーク接続が必要です。このネットワーク方法は、ほとんどのセキュアな環境で実現するのが一般的に難しく、直接接続を使用した場合には不可能です。

設定オプション

オプション必須?デフォルト説明
URLはいFTP/FTPS サーバーの URL。URL には、接続のルートディレクトリとして使用されるサーバー上のディレクトリへのパスを含めることもできます(例:ftp://server.name/folder/name)。
クライアント証明書と秘密鍵の設定いいえ詳細は 証明書と秘密鍵 を参照してください。
サーバー証明書の設定いいえ詳細は 証明書と秘密鍵 を参照してください。
接続タイムアウトいいえ30 秒タイムアウトをミリ秒単位で増やします。
再ログイン時間いいえ15 分分単位でインターバルを変更します。
ファイル変更タイムアウトいいえ2 秒ファイルが一定期間変更されない状態が続くとアップロードを検討する時間を設定します。タイムアウトはミリ秒単位です。
HTTP プロキシ URLいいえhttp:// または https:// で始まるプロキシサーバーの URL。HTTP プロキシのサポートは、使用している FTP サーバーに大きく依存しており、ACTIVE モードでは使用できません。これは、HTTP プロキシが外部アクセス可能なポートでのクライアントのリッスン要求をサポートしていないためです。ACTIVE モードの転送では、FTP サーバーがクライアントに戻って接続し、これは HTTP プロキシを介しては不可能です。
SSL メソッドいいえEXPLICITFTPS 接続のために 明示的または暗黙的 SSL を使用するかどうか。
モードいいえPASSIVEPASSIVE または ACTIVE
タイムゾーンいいえコネクタのタイムゾーンFTP サーバーのタイムゾーン。FTP はタイムスタンプをタイムゾーンなしで記録します。正確な変更タイムスタンプを表示するために、FTP サーバーのタイムゾーンがデフォルトと異なる場合は、FTP サーバーのタイムゾーンを指定してください。
タイムスタンプフォーマット文字列いいえMM-dd-yy hh:mmaFTP サーバーからタイムスタンプを解析するためのフォーマット文字列。タイムスタンプは、最後の同期以降に変更されたファイルを判断するために使用されます。サポートされているフォーマットについては、Java のドキュメンテーションを参照してください。
コントロールエンコーディングいいえUS-ASCIIFTP コントロールメッセージのエンコーディング。ファイル名がデータ接続サーバーのデフォルトのファイルシステムエンコーディングと異なるエンコーディングになっている場合、コントロールエンコーディングが必要になることがあります。
例: Windows の FTP サーバーでは、日本語には windows-31j が、韓国語には x-windows-949 がよく使用されます。
詳細は Java のドキュメンテーション を参照してください。
Keep aliveいいえfalse大きなファイルをダウンロードする間、コントロール接続をアクティブに保つために FTP NOOP コマンドを送信するかどうかを選択します。すべての FTP サーバーがサポートしているわけではありません。

FTP からデータを同期

FTP コネクタは ファイルベースの同期 インターフェースを使用します。

トラブルシューティング

エージェント接続

  • エージェント接続の設定に問題がありますか?FTP/S クライアントをインストールし、ソースと同じ設定を使用してサーバーに接続しようとします。この接続が失敗した場合、問題はコネクタのバグではありません。ネットワーク接続、認証、FTP サーバーの設定を調査してから問題を提出してください。

  • あなたは出口プロキシロードバランサーを使用していますか?FTP はステートフルなプロトコルなので、ロードバランサーを使用すると、連続したリクエストが同じ IP から発信されない場合、同期が(非決定的に)失敗する可能性があります。

SSL と FTPS

  • ユーザーのサーバーは自己署名証明書を使用していますか?それをソースのトラストストアに追加しましたか?上記の SSL とホスト名の検証 セクションを参照してください。

  • ユーザーの FTP サーバーはレガシー TLS バージョン(例えば、TLS 1.1)のみをサポートしていますか?その場合、コネクタのランタイムは、サーバーが提供する Cipher スイートのいずれも受け入れないかもしれません。Palantir の代表者と代替案を探るための問題を提出してください。