デフォルトの動作のカスタマイズ

IBM Cloud Data Engine 動作のカスタマイズ

下記の手順に従って、IBM Cloud Data Engine をクエリするためのデフォルト本製品を設定します。

ジョブステータスの確認

ジョブがサーバー側で開始されると、IBM Cloud Data Engine は自動的にこのジョブをチェックして処理を終了します。プロバイダがジョブステータスに対して行っているリクエストの待機時間を設定するには、PollingInterval を使用できます。

一部のクエリは複雑になる可能性があり、結果が取得されるまでに時間がかかることに注意してください。そのため、多くの不必要なリクエストをしないためにPollingInterval が長くなるように設定されている可能性があります。SELECT クエリが単純な"Select * FROM Table" クエリでなく、少なくともクライテリアや予測が含まれている場合のみ、サーバー側でジョブが開始されます。各ジョブの結果は"Select" 操作のみをサポートするため、ビューと見なされます。

クエリ結果のクリーニング

IBM Cloud Data Engine は、実行した各クエリの結果をResultLocationURI 内のCSV またはJSON ファイルに格納します。CleanQueryResults を使用すると、実行されたすべてのクエリに対してこれらのファイルを自動的にクリーニングできます。

プロセス内の最後の接続を切断すると、この動作によってパフォーマンスが若干低下することに注意してください。

IBM Cloud のクエリキャッシングの使用

QueryCachingLevel を設定して、ResultLocationURI に格納されているクエリ結果の使用方法を変更します。これは、特定のクエリを複数回実行するときに特に役立ちます。これは、IBM Cloud Data Engine が同じデータを再度スキャンすることはなく、単に前回の実行の結果を使用するということです。これらの結果は、QueryTolerance で指定された秒数より前にジョブが開始された場合は使用されません。

デフォルトバケット

デフォルトのバケットはBucket および接続プロパティを設定することで指定できます。これはオプションで、クエリを発行するときにバケットを指定しない場合に使用されます。Bucket が設定されていない場合、バケット名は[Schema].[Table] の形式でクエリのスキーマとして使用する必要があります。

結果の格納

結果は異なるデータ型で格納される場合があります。デフォルトでは、CData Python Connector for IBM Cloud Data Engine はCSV を使用します。これはStoreResultsAs を設定することで変更できます。