CData Python Connector for Azure Data Lake Storage
概要
CData Python Connector for Azure Data Lake Storage を使うことで開発者が、Azure Data Lake Storage への接続が可能なPython スクリプトを作成できます。コネクタは複雑なAzure Data Lake Storage データへの接続を、Python コネクタから通常のデータベースシステムへの接続に一般的に使用されるインターフェースにラップします。
主要機能
- "pip install" でのインストール後に実行環境に付随するさまざまなWHL ファイルと単一のTAR.GZ ファイル。
- Windows とLinux 双方の環境でPython バージョン3.8、3.9、3.10、および3.11をサポート。Mac ではPython 3.8、3.9、および3.10ディストリビューションをサポート。
- Azure Data Lake Storage 内のデータを取得SQL クエリを書いて実行。
- カスタムダイアレクトクラスでSQLAlchemy 1.3 および1.4 からこのコネクタが使用可能に。
はじめに
コネクタをPython ディストリビューションにインストールしてAzure Data Lake Storage への基本接続を作成するには、はじめに を参照してください。
Python コネクタの使用 / ツールからの使用
モジュールから提供されたクラスで基本的なSELECT、INSERT、UPDATE、DELETE、EXECUTE クエリを実行する例は、コネクタの使用 を参照してください。
Azure Data Lake Storage データをPandas やPetl などのツールに接続するには、ツールからの使用 を参照してください。
SQLAlchemy ORM
SQLAlchemy はマップされたクラスでAzure Data Lake Storage 内のテーブルをモデル化するために使用できます。Python コネクタをSQLAlchemy で設定する方法は、SQLAlchemy から を参照してください。
Pandas
Pandas DataFrame をコネクタとともに使用して、分析用のグラフを生成することができます。Pandas から を参照してください。
スキーマ検出
提供されるシステムテーブルを使うことで、ユーザーが利用可能なテーブル、ビュー、ストアドプロシージャやそれらのカラムまたはパラメータに関する追加の情報を見つけることができます。システムテーブルをクエリする方法はスキーマ検出 を参照してください。
高度な機能
高度な機能 では本製品 でサポートされている、ユーザー定義ビューの定義、SSL 設定、リモーティング、キャッシング、ファイアウォールとプロキシ設定、高度なログの記録など、高度な機能の詳細を説明します。
SQL 準拠
構文のリファレンスとサポートされているSQL の概要を示すコード例については、SQL 準拠 を参照してください。
データモデル
利用可能なデータベースオブジェクトはデータモデル を参照してください。このセクションでは、特定のAzure Data Lake Storage エンティティのクエリに関する詳細情報も提供します。
接続文字列オプション
最後に、Connection プロパティを参照してください。接続の確立に使用できるさまざまなオプションの説明があります。