Excel Add-In for Parquet

Build 20.0.7695

接続の確立

接続プロファイルの設定

[CData]リボンから[データの取得]をクリックし、[取得元:Parquet]を選択してParquet クエリウィンドウを起動します。接続を設定するには、[選択]ボタンをクリックします。ここでは、接続の設定、接続のテスト、および接続プロファイルの保存を行うことができます。

Parquet データソースへの接続

CData Excel Add-In for Parquet を使用すると、ローカルおよびリモートのParquet リソースに接続できます。データソースへの接続に必要なプロパティに加えて、URI プロパティをParquet リソースの場所に設定します。

サービスプロバイダ URI 形式 OAuthClientId OAuthClientSecret OAuthAccessToken OAuthAccessTokenSecret User Password AuthScheme AzureAccount AzureAccessKey AWSAccessKey AWSSecretKey AWSRegion AccessKey SecretKey Region OracleNamespace ProjectId
Local localPath

file://localPath/file.parquet

HTTP またはHTTPS http://remoteStream

https://remoteStream

オプション オプション オプション
Amazon S3 s3://remotePath/file.parquet 必須(your AccessKey) 必須(your SecretKey) オプション
Azure Blob Storage azureblob://mycontainer/myblob/ 必須 必須(your AccessKey)
Azure Data Lake Store Gen1 adl://remotePath

adl://Account.azuredatalakestore.net@remotePath

オプション オプション オプション 必須 必須
Azure Data Lake Store Gen2 abfs://myfilesystem/remotePath 必須 必須(your AccessKey)
Azure Data Lake Store Gen2 with SSL abfss://myfilesystem/remotePath 必須 必須(your AccessKey)
Google Drive gdrive://remotePath/file.parquet オプション オプション オプション オプション 必須
OneDrive onedrive://remotePath/file.parquet オプション オプション オプション オプション 必須
Box box://remotePath/file.parquet オプション オプション オプション オプション 必須
Dropbox dropbox://remotePath/file.parquet オプション オプション オプション オプション 必須
SharePoint Online SOAP sp://remotePath/file.parquet 必須 必須
SharePoint Online REST sprest://remotePath/file.parquet オプション オプション オプション 必須
FTP またはFTPS ftp://server:port/remotePath/file.parquet

ftps://server:port/remotepath/file.parquet

必須 必須
SFTP sftp://server:port/remotePath/file.parquet オプション オプション
Wasabi wasabi://bucket1/remotePath/file.parquet; 必須(your AccessKey) 必須(your SecretKey) オプション
Google Cloud Storage gs://bucket/remotePath/file.parquet; オプション オプション オプション オプション 必須 必須
Oracle Cloud Storage os://bucket/remotePath/file.parquet; 必須(your AccessKey) 必須(your SecretKey) オプション 必須

ローカルファイルへの接続

URI をParquet ファイルを含むフォルダに設定します。ローカルファイルは、SELECT だけでなくINSERT/UPDATE/DELETE もサポートします。

以下は接続文字列の例です。

URI=C:\folder1\file.parquet;

同じスキーマを共有する複数のParquet ファイルに接続することもできます。以下は接続文字列の例です。

URI=C:\folder; AggregateFiles=True;

個々のParquet ファイルをすべてテーブルとして公開したい場合は、このプロパティをFalse のままにしてください。

URI=C:\folder; AggregateFiles=False;

クラウド上のファイルへの接続

本製品 はさまざまなクラウドストレージ上にホストされたParquet ファイルからデータを取得することができますが、INSERT、UPDATE、DELETE はローカルファイル以外ではサポートされていません

クラウド上のファイルをINSERT、UPDATE、DELETE する必要がある場合は、そのクラウドサービスに対応するCData 本製品 をダウンロードし(ストアドプロシージャでサポートされています)、ローカルファイルの対応する 本製品 に変更を加え、そのクラウドソース用のストアドプロシージャを使ってファイルをアップロードできます。

例えば、SharePoint 上に格納されたCSV ファイルをアップデートしたい場合、CData SharePoint 本製品 のDownloadDocument プロシージャを使用してCSV ファイルをダウンロードし、CData CSV 本製品 でローカルのCSV ファイルをアップデートして、最後にSharePoint 本製品 のUploadDocument プロシージャを使って変更されたファイルをSharePoint にアップロードできます。

Amazon S3 への接続

URI をバケットおよびフォルダ に設定します。さらに、次のプロパティを設定して認証します。

  • AWSAccessKey:AWS アクセスキー(username)に設定。
  • AWSSecretKey:AWS シークレットキーに設定。
次に例を示します。
URI=s3://bucket1/folder1; AWSAccessKey=token1; AWSSecretKey=secret1; AWSRegion=OHIO;
オプションで、AWSRegion を追加で指定します。

Note: また、ベースUrl を指定することで、S3互換サービスに接続することもできます。 例えば、Url conn prp がhttp://s3.%region%.myservice.com に設定され、Region がregion-1 の場合、https://s3.region-1.myservice.com/bucket/... (もしくは、UseVirtualHosting プロパティがtrue の場合はhttps://bucket.s3.region-1.myservice.com/...)のようなリクエストURL を生成します。

Oracle Cloud Object Storage への接続

URI をバケットおよびフォルダ に設定します。さらに、次のプロパティを設定して認証します。

  • AccessKey:Oracle cloud のAccess Key に設定。
  • SecretKey:Oracle cloud のSecret Key に設定。
  • OracleNamespace:Oracle cloud のnamespace に設定。
次に例を示します。
URI=os://bucket/remotePath/; AccessKey=token1; SecretKey=secret1; OracleNamespace=myNamespace; Region=us-ashburn-1;
オプションで、Region を追加で指定します。

Wasabi への接続

URI をバケットおよびフォルダ に設定します。さらに、次のプロパティを設定して認証します。

  • AWSAccessKey:Wasabi アクセスキー(username)に設定。
  • AWSSecretKey:Wasabi シークレットキーに設定。
オプションで、AWSRegion を追加で指定します。

次に例を示します。

URI=wasabi://bucket1/folder1; AWSAccessKey=token1; AWSSecretKey=secret1; AWSRegion=OHIO;

Azure Blob Storage への接続

URI をコンテナの名前とBlob の名前に設定します。さらに、次のプロパティを設定して認証します。

  • AzureAccount:Azure Blob に紐づいているアカウントに設定。
  • AzureAccessKey:Azure Blob に紐づいているアクセスキーに設定。
次に例を示します。
URI=azureblob://mycontainer/myblob/; AzureAccount=myAccount; AzureAccessKey=myKey;

Azure Data Lake Store Gen 2 への接続

URI をファイルシステムの名前およびParquet ファイルにコンタクトするフォルダの名前 に設定します。さらに、次のプロパティを設定して認証します。

  • AzureAccount:Azure Data Lake Store に紐づいているアカウントに設定。
  • AzureAccessKey:Azure Data Lake Store に紐づいているアクセスキーに設定。
次に例を示します。
  URI=abfs://myfilesystem/folder1; AzureAccount=myAccount; AzureAccessKey=myKey;
  URI=abfss://myfilesystem/folder1; AzureAccount=myAccount; AzureAccessKey=myKey;

Box への接続

URI をParquet ファイルを含むフォルダへのパス に設定します。Box へ認証するには、OAuth 認証標準を使います。 認証方法については、Box への接続 を参照してください。

次に例を示します。

URI=box://folder1;  OAuthClientId=oauthclientid1; OAuthClientSecret=oauthcliensecret1; CallbackUrl=http://localhost:12345;

Dropbox への接続

URI をParquet ファイルを含むフォルダへのパス に設定します。Dropbox へ認証するには、OAuth 認証標準を使います。 認証方法については、Dropbox への接続 を参照してください。ユーザーアカウントまたはサービスアカウントで認証できます。ユーザーアカウントフローでは、以下の接続文字列で示すように、ユーザー資格情報の接続プロパティを設定する必要はありません。

URI=dropbox://folder1;  OAuthClientId=oauthclientid1; OAuthClientSecret=oauthcliensecret1; CallbackUrl=http://localhost:12345;

SharePoint Online SOAP への接続

URI をParquet ファイルを含むドキュメントライブラリ に設定します。認証するには、UserPassword、およびSharepointUrl を設定します。

次に例を示します。

URI=sp://Documents/folder1; User=user1; Password=password1; SharepointUrl=https://subdomain.sharepoint.com;

SharePoint Online REST への接続

URI をParquet ファイルを含むドキュメントライブラリ に設定します。SharepointUrl は任意です。指定しない場合、ドライバーはルートドライブで動作します。 認証するには、OAuth 認証標準を使用します。

次に例を示します。

URI=sp://Documents/folder1; InitiateOAuth=GETANDREFRESH; SharepointUrl=https://subdomain.sharepoint.com;

FTP への接続

URI をルートフォルダとして使用されるフォルダへのパスが付いたサーバーのアドレス に設定します。認証するには、User およびPassword を設定します。

次に例を示します。

URI=ftps://localhost:990/folder1; User=user1; Password=password1; 

Google Cloud Storage への接続

URI をファイルシステムの名前およびParquet ファイルにコンタクトするフォルダの名前 へのパスに設定します。Google API に認証するには、ProjectId を指定します。

次に例を示します。

URI=gs://bucket/remotePath/; ProjectId=PROJECT_ID; 

接続プロパティ

最後に、Connection プロパティを参照してください。接続の確立に使用できるさまざまなオプションの説明があります。

接続の管理

Parquet への認証に成功すると、インポートするデータをカスタマイズすることができます。詳しくは、接続の管理 を参照してください。

関連項目

  • データのクエリ:[データ選択]ウィザードを使用してスプレッドシートにデータをプルします。また、ここではスケジュールされたデータのリフレッシュも設定できます。
  • Excel アドインの使用:利用可能なCData Excel 式 を使用するなど、Parquet データとやりとりする他の方法が見つかります。

Copyright (c) 2021 CData Software, Inc. - All rights reserved.
Build 20.0.7695