CData Python Connector for Spark SQL

Build 24.0.9062

Aggregate Functions

func モジュールを使用して、SQLAlchemy 内で特定の集計関数を使用することもできます。

このモジュールをインポートするには、以下を実行します。

from sqlalchemy.sql import func

func がインポートされると、次の集計機能が利用可能になります。

COUNT

以下の例では、セッションオブジェクトのquery() メソッドを使用して一連のグループのレコード数をカウントします。
rs = session.query(func.count(Customers._id).label("CustomCount"), Customers.City).group_by(Customers.City)
for instance in rs:
	print("Count: ", instance.CustomCount)
	print("City: ", instance.City)
	print("---------")

セッションオブジェクトのexecute() メソッドを使用してCOUNT を実行することもできます。

rs = session.execute(Customers_table.select().with_only_columns([func.count(Customers_table.c._id).label("CustomCount"), Customers_table.c.City])group_by(Customers_table.c.City))
for instance in rs:

SUM

この例では、一連のグループの数値カラムの累積を計算します。

rs = session.query(func.sum(Customers.Balance).label("CustomSum"), Customers.City).group_by(Customers.City)
for instance in rs:
	print("Sum: ", instance.CustomSum)
	print("City: ", instance.City)
	print("---------")

セッションオブジェクトのexecute() メソッドを使用してSUM を呼び出すこともできます。

rs = session.execute(Customers_table.select().with_only_columns([func.sum(Customers_table.c.Balance).label("CustomSum"), Customers_table.c.City]).group_by(Customers_table.c.City))
for instance in rs:

AVG

この例では、セッションオブジェクトのquery() メソッドを使用して一連のグループの数値カラムの平均値を計算します。
rs = session.query(func.avg(Customers.Balance).label("CustomAvg"), Customers.City).group_by(Customers.City)
for instance in rs:
	print("Avg: ", instance.CustomAvg)
	print("City: ", instance.City)
	print("---------")

セッションオブジェクトのexecute() メソッドを使用してAVG を呼び出すこともできます。

rs = session.execute(Customers_table.select().with_only_columns([func.avg(Customers_table.c.Balance).label("CustomAvg"), Customers_table.c.City]).group_by(Customers_table.c.City))
for instance in rs:

MAX およびMIN

この例では、一連のグループの数値カラムの最大値および最小値を検索します。
rs = session.query(func.max(Customers.Balance).label("CustomMax"), func.min(Customers.Balance).label("CustomMin"), Customers.City).group_by(Customers.City)
for instance in rs:
	print("Max: ", instance.CustomMax)
	print("Min: ", instance.CustomMin)
	print("City: ", instance.City)
	print("---------")

セッションオブジェクトのexecute() メソッドを使用してMAX やMIN を呼び出すこともできます。

rs = session.execute(Customers_table.select().with_only_columns([func.max(Customers_table.c.Balance).label("CustomMax"), func.min(Customers_table.c.Balance).label("CustomMin"), Customers_table.c.City]).group_by(Customers_table.c.City))
for instance in rs:

Copyright (c) 2024 CData Software, Inc. - All rights reserved.
Build 24.0.9062