Cmdlets for HDFS

Build 20.0.7654

接続の確立

CData Cmdlets ユーザーは、データモジュールをインストールし、接続プロパティを設定してスクリプトを開始できます。このセクションでは、CSV インポートおよびエクスポートcmdlet などのネイティブPowerShell cmdlet でHDFS Cmdlets を使用する例を示します。

インストールおよび接続

PSGet がある場合は、PowerShell Gallery から次のコマンドを使ってcmdlet をインストールできます。CData サイトからセットアップを取得することもできます。

Install-Module HDFSCmdlets

プロファイルに以下を追加すると、次のセッションでcmdlet がロードされます。

Import-Module HDFSCmdlets;

Connect-HDFS cmdlet を使って、別のcmdlet に渡すことができる接続オブジェクトを作成します。

$conn = Connect-HDFS -Host "sandbox-hdp.hortonworks.com" -Port "50070" -Path "/user/root"

このセクションでは、使用しているアカウントの認証を提供し、接続する方法を説明します。

HDFS アカウントの認証

認証するためには、次の接続プロパティを設定します。

  • Host:HDFS インストールのホストに設定。
  • Port:HDFS インストールのポートに設定。デフォルトポート:50070

データの取得

Select-HDFS cmdlet はデータを取得するためのネイティブなPowerShell インターフェースを提供します。

$results = Select-HDFS -Connection $conn -Table "Files" -Columns @("FileId, ChildrenNum") -Where "FileId='119116'"
Invoke-HDFS cmdlet はSQL インターフェースを提供します。このcmdlet を使うと、Query パラメータを介してSQL クエリを実行できます。

cmdlet 出力のパイプ処理

cmdlet は行オブジェクトをパイプラインに一度に一行ずつ返します。以下は、結果をCSV ファイルにエクスポートします。

Select-HDFS -Connection $conn -Table Files -Where "FileId = '119116'" | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myFilesData.csv -NoTypeInformation

Select-HDFS からの結果をSelect-Object cmdlet にパイプして、Export-CSV cmdlet にパイプする前にいくつかのプロパティを実行していることがわかるでしょう。これをする理由は、CData Cmdlets は接続、テーブル、およびカラムの情報を結果セットの各行オブジェクトに追加しますが、必ずしもその情報がCSV ファイルに必要ではないからです。

ただし、これによってcmdlet の出力を別のcmdlet にパイプすることが容易になります。以下に、結果セットをJSON に変換する例を示します。

 
PS C:\> $conn  = Connect-HDFS -Host "sandbox-hdp.hortonworks.com" -Port "50070" -Path "/user/root"
PS C:\> $row = Select-HDFS -Connection $conn -Table "Files" -Columns (FileId, ChildrenNum) -Where "FileId = '119116'" | select -first 1
PS C:\> $row | ConvertTo-Json
{
  "Connection":  {

  },
  "Table":  "Files",
  "Columns":  [

  ],
  "FileId":  "MyFileId",
  "ChildrenNum":  "MyChildrenNum"
} 

Copyright (c) 2020 CData Software, Inc. - All rights reserved.
Build 20.0.7654