CData Python Connector for Google Data Catalog

Build 24.0.9062

Pandas から

コネクタと組み合わせることで、Pandas を使用してGoogle Data Catalog データを含むデータフレームを生成できます。 作成したデーフレームは、他のさまざまなPython パッケージに渡すことができます。

接続

Pandas はSQLAlchemy エンジンに依存してクエリを実行します。Pandas を使用する前に、インポートする必要があります。
import pandas as pd
from sqlalchemy import create_engine
engine = create_engine("googledatacatalog:///?InitiateOAuth=GETANDREFRESH;ProjectId=YourProjectId;")

データのクエリ

Pandas では、SELECT クエリはread_sql() メソッド呼び出しで、関連する接続オブジェクトと共に提供されます。Pandas はその接続上でクエリを実行し、さまざまな目的で使用されるデータフレームの形式で結果を返します。
df = pd.read_sql("""
	SELECT
	   Type,
	   DatasetName,
     $exNumericCol;
	FROM Schemas;""", engine)
print(df)

Copyright (c) 2024 CData Software, Inc. - All rights reserved.
Build 24.0.9062