Tohle by mělo stačit:
SELECT a
, sum(ab_ct)::int AS ct_total
, count(*)::int AS ct_distinct_b
, array_agg(b || ', ' || ab_ct::text) AS b_arr
FROM (
SELECT a, b, count(*) AS ab_ct
FROM tbl
GROUP BY a, b
ORDER BY a, ab_ct DESC, b -- append "b" to break ties in the count
) t
GROUP BY a
ORDER BY ct_total DESC;
Vrátí:
ct_total
:celkový početb
zaa
.ct_distinct_b
:počet různýchb
zaa
.b_arr
:poleb
plus frekvenceb
, seřazené podle frekvenceb
.
Seřazeno podle celkového počtu b
za a
.
Případně můžete použít ORDER BY
klauzule v rámci souhrnného volání
v PostgreSQL 9.0 nebo novějším. Jako:
SELECT a
, sum(ab_ct)::int AS ct_total
, count(*)::int AS ct_distinct_b
, array_agg(b || ', ' || ab_ct::text ORDER BY a, ab_ct DESC, b) AS b_arr
FROM (
SELECT a, b, count(*) AS ab_ct
FROM tbl
GROUP BY a, b
) t
GROUP BY a
ORDER BY ct_total DESC;
Může být jasnější. Ale obvykle je to pomalejší. A řazení řádků v poddotazu funguje pro jednoduché dotazy, jako je tento. Další vysvětlení: