Doporučil bych udělat malý profil, abyste viděli, kde je úzké hrdlo. Můj neinformovaný odhad je, že s tak velkými objekty můžete být omezeni připojením mezi vaším aplikačním serverem a memcached, a proto uvidíte podobné výsledky s redis. Může se také stát, že vaše aplikace zabere spoustu času seřazením a uvolněním mnoha objektů. Pokud je to snadné, možná by stálo za to vyzkoušet schéma ukládání do mezipaměti, kde pouze ukládáte do mezipaměti požadavek odesílaný klientovi (což je, jsem si jistý, mnohem méně než 128 MB).
Další věcí, kterou byste měli vyzkoušet, by bylo zapnutí komprese. To by zvýšilo latenci komprese/dekomprese, ale snížilo by latenci sítě, pokud je to skutečně problém.