📄️ any_value
各集約グループから任意の行を取得します。
📄️ approx_count_distinct
集計関数の近似値を返し、COUNT(DISTINCT col) より高速でメモリ効率的です。
📄️ approx_top_k
expr 内で最も頻繁に出現する上位 k 個のアイテム値とその概算カウントを返します。
📄️ avg
選択されたフィールドの平均値を返します。
📄️ bitmap
Bitmap 集計関数の使用例を示します。
📄️ bool_or
expr のいずれかの行が true と評価された場合に true を返します。
📄️ corr
2 つの式間のピアソン相関係数を返します。
📄️ count
指定された式に基づいて、行の総数を返します。
📄️ count_if
指定された条件を満たすレコードの数を返します。
📄️ covar_pop
2 つの式の母集団共分散を返します。
📄️ covar_samp
2 つの式の標本共分散を返します。
📄️ ds_hll_accumulate
値を HyperLogLog スケッチに蓄積し、シリアライズされたスケッチを VARBINARY として返します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。
📄️ ds_hll_combine
複数のシリアライズされた HyperLogLog スケッチを単一のシリアライズされたスケッチに結合します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。
📄️ ds_hll_count_distinct
集計関数の近似値を返します。これは COUNT(DISTINCT col) の結果に似ています。APPROXCOUNTDISTINCT(expr) も同様の関数です。
📄️ ds_hll_estimate
シリアライズされた HyperLogLog スケッチから近似重複除去カウントを推定します。この関数は DataSketches HLL 近似重複除去カウント関数ファミリーの一部です。
📄️ ds_theta_count_distinct
COUNT(DISTINCT col) の結果に似た集計関数の近似値を返します。dsthetacount_distinct は COUNT(DISTINCT col) よりも高速で、高いカーディナリティの列に対してメモリ使用量が少なくなります。
📄️ group_concat
グループ内の非NULL値を sep 引数で区切られた1つの文字列に連結します。
📄️ grouping
列が集計列であるかどうかを示します。
📄️ grouping_id
同じグループ化基準の統計結果を区別するために使用されます。
📄️ hll_raw_agg
HLL フィールドを集計し、HLL 値を返します。
📄️ hll_union
HLL 値のセットを連結して返します。
📄️ hll_union_agg
HLL は HyperLogLog アルゴリズムに基づく実装です。
📄️ mann_whitney_u_test
2つの母集団から得られたサンプルに対して Mann-Whitney 順位検定を実行します。
📄️ max
expr 式の最大値を返します。
📄️ max_by
y の最大値に関連付けられた x の値を返します。
📄️ min
expr 式の最小値を返します。
📄️ min_by
y の最小値に関連付けられた x の値を返します。
📄️ MIN_N, MAX_N
Returns the n smallest or largest values from an expression as an array.
📄️ multi_distinct_count
expr の行数の合計を返し、count(distinct expr) と同等です。
📄️ multi_distinct_sum
expr 内の異なる値の合計を返し、sum(distinct expr) と同等です。
📄️ percentile_approx
PERCENTILE_APPROX関数は指定されたパーセンタイルの加重近似値を返します。
📄️ percentile_approx_weight
指定されたパーセンタイルの加重近似値を返します。パーセンタイルパラメータ p は単一の値または配列を指定できます。percentileapproxweight は PERCENTILE_APPROX の重み付きバージョンであり、各入力値に対して重み(定数値または数値列)を指定することができます。
📄️ percentile_cont
PERCENTILE_CONT関数は線形補間によるパーセンタイル値を計算します。
📄️ percentile_disc
PERCENTILE_DISC関数は入力列の離散分布に基づいてパーセンタイル値を返します。
📄️ percentile_disc_lc
PERCENTILE_DISC_LC関数は離散分布に基づくパーセンタイル値を計算し、メモリ効率を最適化しています。
📄️ retention
RETENTION関数は指定された期間内のユーザーリテンション率を計算します。
📄️ std
STD関数は式の標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。
📄️ stddev,stddev_pop,std
STDDEV関数は母集団標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。
📄️ stddev_samp
STDDEV_SAMP関数は標本標準偏差を返し、v2.5.10以降はウィンドウ関数としても使用できます。
📄️ sum
SUM関数は非NULL値の合計を返し、DISTINCTキーワードで異なる値の合計を計算できます。
📄️ sum_map
Aggregates MAP values by summing numeric values for matching keys across multiple rows.
📄️ var_samp,variance_samp
VAR_SAMP関数は標本分散を返し、v2.5.10以降はウィンドウ関数としても使用できます。
📄️ variance,var_pop,variance_pop
VARIANCE関数は母分散を返し、v2.5.10以降はウィンドウ関数としても使用できます。
📄️ window_funnel
WINDOW_FUNNEL関数はスライディングウィンドウ内でイベントチェーンを検索し、連続イベントの最大数を計算します。