集約関数 | StarRocks

📄️ any_value

各集約グループから任意の行を取得します。

📄️ approx_count_distinct

集計関数の近似値を返し、COUNT(DISTINCT col) より高速でメモリ効率的です。

📄️ approx_top_k

expr 内で最も頻繁に出現する上位 k 個のアイテム値とその概算カウントを返します。

📄️ avg

選択されたフィールドの平均値を返します。

📄️ bitmap

Bitmap 集計関数の使用例を示します。

📄️ bool_or

expr のいずれかの行が true と評価された場合に true を返します。

📄️ corr

2 つの式間のピアソン相関係数を返します。

📄️ count

指定された式に基づいて、行の総数を返します。

📄️ count_if

指定された条件を満たすレコードの数を返します。

📄️ covar_pop

2 つの式の母集団共分散を返します。

📄️ covar_samp

2 つの式の標本共分散を返します。

📄️ ds_hll_accumulate

値を HyperLogLog スケッチに蓄積し、シリアライズされたスケッチを VARBINARY として返します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。

📄️ ds_hll_combine

複数のシリアライズされた HyperLogLog スケッチを単一のシリアライズされたスケッチに結合します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。

📄️ ds_hll_count_distinct

集計関数の近似値を返します。これは COUNT(DISTINCT col) の結果に似ています。APPROXCOUNTDISTINCT(expr) も同様の関数です。

📄️ ds_hll_estimate

シリアライズされた HyperLogLog スケッチから近似重複除去カウントを推定します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。

📄️ ds_theta_count_distinct

COUNT(DISTINCT col) の結果に似た集計関数の近似値を返します。dsthetacount_distinct は COUNT(DISTINCT col) よりも高速で、高いカーディナリティの列に対してメモリ使用量が少なくなります。

📄️ group_concat

グループ内の非NULL値を sep 引数で区切られた1つの文字列に連結します。

📄️ grouping

列が集計列であるかどうかを示します。

📄️ grouping_id

同じグループ化基準の統計結果を区別するために使用されます。

📄️ hll_raw_agg

HLL フィールドを集計し、HLL 値を返します。

📄️ hll_union

HLL 値のセットを連結して返します。

📄️ hll_union_agg

HLL は HyperLogLog アルゴリズムに基づく実装です。

📄️ mann_whitney_u_test

2つの母集団から得られたサンプルに対して Mann-Whitney 順位検定を実行します。

📄️ max

expr 式の最大値を返します。

📄️ max_by

y の最大値に関連付けられた x の値を返します。

📄️ min

expr 式の最小値を返します。

📄️ min_by

y の最小値に関連付けられた x の値を返します。

📄️ MIN_N, MAX_N

Returns the n smallest or largest values from an expression as an array.

📄️ multi_distinct_count

expr の行数の合計を返し、count(distinct expr) と同等です。

📄️ multi_distinct_sum

expr 内の異なる値の合計を返し、sum(distinct expr) と同等です。

📄️ percentile_approx

PERCENTILE_APPROX関数は指定されたパーセンタイルの加重近似値を返します。

📄️ percentile_approx_weight

指定されたパーセンタイルの加重近似値を返します。パーセンタイルパラメータ p は単一の値または配列を指定できます。percentileapproxweight は PERCENTILE_APPROX の重み付きバージョンであり、各入力値に対して重み（定数値または数値列）を指定することができます。

📄️ percentile_cont

PERCENTILE_CONT関数は線形補間によるパーセンタイル値を計算します。

📄️ percentile_disc

PERCENTILE_DISC関数は入力列の離散分布に基づいてパーセンタイル値を返します。

📄️ percentile_disc_lc

PERCENTILE_DISC_LC関数は離散分布に基づくパーセンタイル値を計算し、メモリ効率を最適化しています。

📄️ retention

RETENTION関数は指定された期間内のユーザーリテンション率を計算します。

📄️ std

STD関数は式の標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。

📄️ stddev,stddev_pop,std

STDDEV関数は母集団標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。

📄️ stddev_samp

STDDEV_SAMP関数は標本標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。

📄️ sum

SUM関数は非NULL値の合計を返し、DISTINCTキーワードで異なる値の合計を計算できます。

📄️ sum_map

Aggregates MAP values by summing numeric values for matching keys across multiple rows.

📄️ var_samp,variance_samp

VAR_SAMP関数は標本分散を返し、v2.5.10以降はウィンドウ関数としても使用できます。

📄️ variance,var_pop,variance_pop

VARIANCE関数は母分散を返し、v2.5.10以降はウィンドウ関数としても使用できます。

📄️ window_funnel

WINDOW_FUNNEL関数はスライディングウィンドウ内でイベントチェーンを検索し、連続イベントの最大数を計算します。