Pandas から
コネクタと組み合わせることで、Pandas を使用してGoogle Cloud Storage データを含むデータフレームを生成できます。作成したデーフレームは、他のさまざまなpython パッケージに渡すことができます。
接続
Pandas を使用するには、事前にインポートする必要があります。Pandas は、以下のように、クエリ実行時にSQLAlchemy エンジンにも依存します。
import pandas as pd
from sqlalchemy import create_engine
engine = create_engine("googlecloudstorage:///?InitiateOAuth=GETANDREFRESH;ProjectId='project1';")
データのクエリ
SELECT クエリは、関連する接続オブジェクトとともに、Pandas の"read_sql()" メソッド呼び出しで提供されます。Pandas はその接続上でクエリを実行し、さまざまな目的で使用されるデーフレームの形式で結果を返します。
df = pd.read_sql("""
SELECT
Name,
OwnerId,
$exNumericCol;
FROM Buckets;""", engine)
print(df)