📄️ base64_to_bitmap
StarRocks にビットマップデータをインポートする前に、データをシリアライズし、Base64 文字列としてエンコードする必要があります。Base64 文字列を StarRocks にインポートする際には、その文字列をビットマップデータに変換する必要があります。この関数は、Base64 文字列をビットマップデータに変換するために使用されます。
📄️ bitmap_agg
列内の値(NULLを除く)をビットマップに集約します(複数の行を1つの行にまとめます)。
📄️ bitmap_and
2 つの入力ビットマップの交差を計算し、新しいビットマップを返します。
📄️ bitmap_andnot
lhs に存在し、rhs に存在しない bitmap 値を返し、新しい bitmap を返します。
📄️ bitmap_contains
入力値が bitmap 列に含まれているかどうかを計算し、Boolean 値を返します。
📄️ bitmap_count
入力されたビットマップの 1 ビット数を返します。
📄️ bitmap_empty
空のビットマップを返します。主に挿入やストリームロード中にデフォルト値を埋めるために使用されます。例えば:
📄️ bitmap_from_binary
特定のフォーマットのバイナリ文字列を bitmap に変換します。
📄️ bitmap_from_string
文字列を BITMAP に変換します。この文字列は、カンマで区切られた一連の UINT64 数字で構成されています。例えば、「0, 1, 2」という文字列は、ビット 0, 1, 2 がセットされた Bitmap に変換されます。入力フィールドが無効な場合、NULL が返されます。
📄️ bitmap_has_any
2 つの Bitmap 列の間に交差する要素があるかどうかを計算し、戻り値は Boolean 値です。
📄️ bitmap_hash
任意のタイプの入力に対して32ビットのハッシュ値を計算し、そのハッシュ値を含むビットマップを返します。これは主に、StarRocks テーブルのビットマップフィールドに非整数フィールドをインポートするための stream load タスクに使用されます。例えば:
📄️ bitmap_intersect
集約関数で、グループ化後のビットマップの共通部分を計算するために使用されます。一般的な使用シナリオとして、ユーザーリテンション率の計算があります。
📄️ bitmap_max
ビットマップの最大値を取得します。ビットマップが NULL の場合、この関数は NULL を返します。ビットマップが空の場合、この関数はデフォルトで NULL を返します。
📄️ bitmap_min
ビットマップの最小値を取得します。ビットマップが NULL の場合、この関数は NULL を返します。ビットマップが空の場合、この関数はデフォルトで NULL を返します。
📄️ bitmap_or
2 つの入力ビットマップの和集合を計算し、新しいビットマップを返します。
📄️ bitmap_remove
input を Bitmap 値 lhs から削除し、結果セットを返します。
📄️ bitmap_subset_in_range
startrange と endrange(排他的)の範囲内で Bitmap 値から要素を抽出します。出力される要素は Bitmap 値の部分集合です。
📄️ bitmap_subset_limit
start range から始まる要素値を持つ BITMAP 値から指定された数の要素を抽出します。出力される要素は src の部分集合です。
📄️ bitmap_to_array
BITMAP を BIGINT 配列に変換します。
📄️ bitmap_to_base64
ビットマップを Base64 エンコードされた文字列に変換します。この関数は v2.5 からサポートされています。
📄️ bitmap_to_binary
Bitmap 値を Binary 文字列に変換します。
📄️ bitmap_to_string
入力されたビットマップをカンマ (,) で区切られた文字列に変換します。この文字列にはビットマップ内のすべてのビットが含まれます。入力が null の場合、null が返されます。
📄️ bitmap_union
グループ化後の値のセットに対して、bitmap union を計算します。一般的な使用シナリオには、PV や UV の計算が含まれます。
📄️ bitmap_union_count
一連のビットマップ値の和集合を返し、その和集合の基数を返します。この関数は v2.3 からサポートされています。
📄️ bitmap_union_int
TINYINT、SMALLINT、INT 型の列における異なる値の数をカウントし、COUNT (DISTINCT expr) と同じ合計を返します。
📄️ bitmap_xor
lhs と rhs に固有の要素からなる集合を計算します。これは論理的には bitmapandnot(bitmapor(lhs, rhs), bitmap_and(lhs, rhs))(補集合)と同等です。
📄️ intersect_count
2 つの Bitmap 値の共通部分のサイズ(同じ要素の数)を求める関数で、データの分布が直交する必要はありません。最初のパラメータは Bitmap 列、2 番目のパラメータはフィルタリングに使用する次元列、3 番目のパラメータは可変長パラメータで、フィルタリング次元列の異なる値が取られます。
📄️ sub_bitmap
BITMAP 値 src から、指定された位置 offset から始まる len 個の要素を抽出します。出力される要素は src の部分集合です。
📄️ subdivide_bitmap
大きなビットマップを複数のサブビットマップに分割します。
📄️ to_bitmap
入力は 0 から 18446744073709551615 までの値を持つ符号なし bigint であり、出力はこの要素を含む bitmap です。この関数は主に StarRocks テーブルの bitmap フィールドに整数フィールドをインポートするための stream load タスクで使用されます。例えば:
📄️ unnest_bitmap
unnest_bitmap は、ビットマップを受け取り、そのビットマップ内の要素をテーブルの複数行に変換するテーブル関数です。