接続の確立
CData Cmdlets ユーザーは、データモジュールをインストールし、接続プロパティを設定してスクリプトを開始できます。このセクションでは、CSV インポートおよびエクスポートcmdlet などのネイティブPowerShell cmdlet でHDFS Cmdlets を使用する例を示します。
インストールおよび接続
PSGet がある場合は、PowerShell Gallery から次のコマンドを使ってcmdlet をインストールできます。CData サイトからセットアップを取得することもできます。
Install-Module HDFSCmdlets
プロファイルに以下を追加すると、次のセッションでcmdlet がロードされます。
Import-Module HDFSCmdlets;
Connect-HDFS cmdlet を使って、別のcmdlet に渡すことができる接続オブジェクトを作成します。
$conn = Connect-HDFS -Host "sandbox-hdp.hortonworks.com" -Port "50070" -Path "/user/root"
このセクションでは、使用しているアカウントの認証を提供し、接続する方法を説明します。
HDFS アカウントの認証
認証するためには、次の接続プロパティを設定します。
- Host:HDFS インストールのホストに設定。
- Port:HDFS インストールのポートに設定。デフォルトポート:50070
データの取得
Select-HDFS cmdlet はデータを取得するためのネイティブなPowerShell インターフェースを提供します。
$results = Select-HDFS -Connection $conn -Table "Files" -Columns @("FileId, ChildrenNum") -Where "FileId='119116'"Invoke-HDFS cmdlet はSQL インターフェースを提供します。このcmdlet を使うと、Query パラメータを介してSQL クエリを実行できます。
cmdlet 出力のパイプ処理
cmdlet は行オブジェクトをパイプラインに一度に一行ずつ返します。以下は、結果をCSV ファイルにエクスポートします。
Select-HDFS -Connection $conn -Table Files -Where "FileId = '119116'" | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myFilesData.csv -NoTypeInformation
Select-HDFS からの結果をSelect-Object cmdlet にパイプして、Export-CSV cmdlet にパイプする前にいくつかのプロパティを実行していることがわかるでしょう。これをする理由は、CData Cmdlets は接続、テーブル、およびカラムの情報を結果セットの各行オブジェクトに追加しますが、必ずしもその情報がCSV ファイルに必要ではないからです。
ただし、これによってcmdlet の出力を別のcmdlet にパイプすることが容易になります。以下に、結果セットをJSON に変換する例を示します。
PS C:\> $conn = Connect-HDFS -Host "sandbox-hdp.hortonworks.com" -Port "50070" -Path "/user/root" PS C:\> $row = Select-HDFS -Connection $conn -Table "Files" -Columns (FileId, ChildrenNum) -Where "FileId = '119116'" | select -first 1 PS C:\> $row | ConvertTo-Json { "Connection": { }, "Table": "Files", "Columns": [ ], "FileId": "MyFileId", "ChildrenNum": "MyChildrenNum" }