sql >> Databáze >  >> RDS >> PostgreSQL

Fronta úloh jako SQL tabulka s více spotřebiteli (PostgreSQL)

Postgres používám také pro frontu FIFO. Původně jsem používal ACCESS EXCLUSIVE, který poskytuje správné výsledky ve vysoké souběžnosti, ale má ten neblahý účinek, že se vzájemně vylučuje s pg_dump, který během provádění získává zámek ACCESS SHARE. To způsobí, že se moje funkce next() uzamkne na velmi dlouhou dobu (trvání pg_dump). To nebylo přijatelné, protože jsme obchod s nepřetržitým provozem a zákazníkům se nelíbila mrtvá doba ve frontě uprostřed noci.

Usoudil jsem, že musí existovat méně omezující zámek, který by byl stále bezpečný současně a nezamykal by se, když je spuštěn pg_dump. Moje hledání mě přivedlo k tomuto příspěvku SO.

Pak jsem provedl nějaký průzkum.

Následující režimy jsou dostatečné pro funkci FIFO fronty NEXT(), která aktualizuje stav úlohy z ve frontě na běh bez jakéhokoli selhání souběžnosti a také neblokování proti pg_dump:

SHARE UPDATE EXCLUSIVE
SHARE ROW EXCLUSIVE
EXCLUSIVE

Dotaz:

begin;
lock table tx_test_queue in exclusive mode;
update 
    tx_test_queue
set 
    status='running'
where
    job_id in (
        select
            job_id
        from
            tx_test_queue
        where
            status='queued'
        order by 
            job_id asc
        limit 1
    )
returning job_id;
commit;

Výsledek vypadá takto:

UPDATE 1
 job_id
--------
     98
(1 row)

Zde je skript shellu, který testuje všechny různé režimy uzamčení při vysoké souběžnosti (30).

#!/bin/bash
# RESULTS, feel free to repro yourself
#
# noLock                    FAIL
# accessShare               FAIL
# rowShare                  FAIL
# rowExclusive              FAIL
# shareUpdateExclusive      SUCCESS
# share                     FAIL+DEADLOCKS
# shareRowExclusive         SUCCESS
# exclusive                 SUCCESS
# accessExclusive           SUCCESS, but LOCKS against pg_dump

#config
strategy="exclusive"

db=postgres
dbuser=postgres
queuecount=100
concurrency=30

# code
psql84 -t -U $dbuser $db -c "create table tx_test_queue (job_id serial, status text);"
# empty queue
psql84 -t -U $dbuser $db -c "truncate tx_test_queue;";
echo "Simulating 10 second pg_dump with ACCESS SHARE"
psql84 -t -U $dbuser $db -c "lock table tx_test_queue in ACCESS SHARE mode; select pg_sleep(10); select 'pg_dump finished...'" &

echo "Starting workers..."
# queue $queuecount items
seq $queuecount | xargs -n 1 -P $concurrency -I {} psql84 -q -U $dbuser $db -c "insert into tx_test_queue (status) values ('queued');"
#psql84 -t -U $dbuser $db -c "select * from tx_test_queue order by job_id;"
# process $queuecount w/concurrency of $concurrency
case $strategy in
    "noLock")               strategySql="update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "accessShare")          strategySql="lock table tx_test_queue in ACCESS SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "rowShare")             strategySql="lock table tx_test_queue in ROW SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "rowExclusive")         strategySql="lock table tx_test_queue in ROW EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "shareUpdateExclusive") strategySql="lock table tx_test_queue in SHARE UPDATE EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "share")                strategySql="lock table tx_test_queue in SHARE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "shareRowExclusive")    strategySql="lock table tx_test_queue in SHARE ROW EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "exclusive")            strategySql="lock table tx_test_queue in EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    "accessExclusive")      strategySql="lock table tx_test_queue in ACCESS EXCLUSIVE mode; update tx_test_queue set status='running{}' where job_id in (select job_id from tx_test_queue where status='queued' order by job_id asc limit 1);";;
    *) echo "Unknown strategy $strategy";;
esac
echo $strategySql
seq $queuecount | xargs -n 1 -P $concurrency -I {} psql84 -U $dbuser $db -c "$strategySql"
#psql84 -t -U $dbuser $db -c "select * from tx_test_queue order by job_id;"
psql84 -U $dbuser $db -c "select count(distinct(status)) as should_output_100 from tx_test_queue;"
psql84 -t -U $dbuser $db -c "drop table tx_test_queue;";

Kód je zde také, pokud jej chcete upravit:https://gist.github.com/1083936

Aktualizuji svou aplikaci, aby používala režim EXCLUSIVE, protože je to nejvíce omezující režim, který a) je správný a b) není v konfliktu s pg_dump. Vybral jsem nejvíce restriktivní, protože se zdá nejméně riskantní, pokud jde o změnu aplikace z ACCESS EXCLUSIVE, aniž bych byl uber odborníkem na zamykání postgres.

Cítím se docela dobře se svým testovacím zařízením a obecnými myšlenkami za odpovědí. Doufám, že sdílení pomůže vyřešit tento problém ostatním.



  1. Pochopení 3 klíčových charakteristik velkých dat

  2. Co je schéma v SQL Server a jak vytvořit/zrušit schéma v SQL Server databázi - SQL Server / TSQL výukový program, část 27

  3. Co je připojovací řetězec ovladače MySQL JDBC?

  4. Jak nainstalovat MySQL na CentOS 6