sql >> Databáze >  >> RDS >> Mysql

Nejrychlejší cesta k podmnožině - data.table vs. MySQL

Pokud se data vejdou do RAM, data.table je rychlejší. Pokud uvedete příklad, pravděpodobně se rychle ukáže, že data.table používáte špatně. Přečetli jste si „co dělat a co ne“ na data.table wiki ?

SQL má spodní hranici, protože se jedná o úložiště řádků. Pokud se data vejdou do RAM (a 64bit je docela málo), pak data.table je rychlejší nejen proto, že je v RAM, ale také proto, že sloupce jsou v paměti souvislé (minimalizace načítání stránek z RAM do L2 pro operace se sloupci). Použijte data.table správně a měl by být rychlejší než dolní mez SQL. To je vysvětleno v FAQ 3.1. Pokud s data.table vidíte pomaleji, pak je velmi vysoká pravděpodobnost, že data.table používáte nesprávně (nebo došlo k chybě výkonu, kterou musíme opravit). Po přečtení wiki data.table prosím zveřejněte nějaké testy.



  1. Nelze se připojit k žádnému ze zadaných hostitelů mysql. C# MySQL

  2. efektivní způsob, jak otestovat, zda existuje řádek tabulky

  3. spočítat 10 nejčastěji se vyskytujících hodnot ve sloupci v mysql

  4. Příklady UTC_DATE – MySQL