CData Python Connector for Apache Hive

Build 22.0.8479

Aggregate Functions

func モジュールを使用して、SQLAlchemy 内で特定の集計関数を使用することもできます。まず、それをインポートする必要があります。

from sqlalchemy.sql import func

インポートすると、次の集計機能が利用可能になります。

COUNT

この例では、セッションオブジェクトのquery() メソッドを使用して一連のグループのレコード数をカウントします。

rs = session.query(func.count([CData].[Default].Customers._id).label("CustomCount"), [CData].[Default].Customers.City).group_by([CData].[Default].Customers.City)
for instance in rs:
	print("Count: ", instance.CustomCount)
	print("City: ", instance.City)
	print("---------")

あるいは、セッションオブジェクトのexecute() メソッドを使用してCOUNT を実行することもできます。

rs = session.execute([CData].[Default].Customers_table.select().with_only_columns([func.count([CData].[Default].Customers_table.c._id).label("CustomCount"), [CData].[Default].Customers_table.c.City])group_by([CData].[Default].Customers_table.c.City))
for instance in rs:

SUM

この例では、一連のグループの数値カラムの累積を計算します。

rs = session.query(func.sum([CData].[Default].Customers.Balance).label("CustomSum"), [CData].[Default].Customers.City).group_by([CData].[Default].Customers.City)
for instance in rs:
	print("Sum: ", instance.CustomSum)
	print("City: ", instance.City)
	print("---------")

あるいは、セッションオブジェクトのexecute() メソッドを使用してSUM を呼び出すこともできます。

rs = session.execute([CData].[Default].Customers_table.select().with_only_columns([func.sum([CData].[Default].Customers_table.c.Balance).label("CustomSum"), [CData].[Default].Customers_table.c.City]).group_by([CData].[Default].Customers_table.c.City))
for instance in rs:

AVG

この例では、セッションオブジェクトのquery() メソッドを使用して一連のグループの数値カラムの平均値を計算します。

rs = session.query(func.avg([CData].[Default].Customers.Balance).label("CustomAvg"), [CData].[Default].Customers.City).group_by([CData].[Default].Customers.City)
for instance in rs:
	print("Avg: ", instance.CustomAvg)
	print("City: ", instance.City)
	print("---------")

あるいは、セッションオブジェクトのexecute() メソッドを使用してAVG を呼び出すこともできます。

rs = session.execute([CData].[Default].Customers_table.select().with_only_columns([func.avg([CData].[Default].Customers_table.c.Balance).label("CustomAvg"), [CData].[Default].Customers_table.c.City]).group_by([CData].[Default].Customers_table.c.City))
for instance in rs:

MAX およびMIN

この例では、一連のグループの数値カラムの最大値および最小値を検索します。

rs = session.query(func.max([CData].[Default].Customers.Balance).label("CustomMax"), func.min([CData].[Default].Customers.Balance).label("CustomMin"), [CData].[Default].Customers.City).group_by([CData].[Default].Customers.City)
for instance in rs:
	print("Max: ", instance.CustomMax)
	print("Min: ", instance.CustomMin)
	print("City: ", instance.City)
	print("---------")

あるいは、セッションオブジェクトのexecute() メソッドを使用してMAX やMIN を呼び出すこともできます。

rs = session.execute([CData].[Default].Customers_table.select().with_only_columns([func.max([CData].[Default].Customers_table.c.Balance).label("CustomMax"), func.min([CData].[Default].Customers_table.c.Balance).label("CustomMin"), [CData].[Default].Customers_table.c.City]).group_by([CData].[Default].Customers_table.c.City))
for instance in rs:

Copyright (c) 2023 CData Software, Inc. - All rights reserved.
Build 22.0.8479