sql >> Databáze >  >> RDS >> Database

Trendy ScyllaDB – Jak uživatelé nasazují databázi velkých dat v reálném čase

ScyllaDB je open-source distribuované úložiště dat NoSQL, reimplementované z populární databáze Apache Cassandra. Scylla, která byla vydána před pouhými čtyřmi lety v roce 2015, zaznamenala podle DB-Engines v průměru více než 220% meziroční nárůst popularity. Od komunity DBA a našich uživatelů jsme o této rostoucí databázi hodně slyšeli a rozhodli jsme se stát sponzorem letošního Scylla Summit, abychom se od jejích uživatelů dozvěděli více o trendech nasazení. V tomto příspěvku rozebíráme cloud ScyllaDB vs. místní nasazení, nejoblíbenější poskytovatele cloudu, databáze SQL a NoSQL používané se ScyllaDB, nejnáročnější úlohy správy a proč byste měli používat ScyllaDB vs. Cassandra.

  • ScyllaDB vs. Cassandra
  • ScyllaDB Cloud vs. ScyllaDB On-Premises
  • Nejoblíbenější poskytovatelé cloudu pro ScyllaDB
  • Nejčastěji používané databáze se ScyllaDB
  • Časově nejnáročnější úkoly správy ScyllaDB

ScyllaDB vs. Cassandra – co je lepší?

Zajímá vás, které úložiště se širokými sloupci použít pro vaše nasazení? Zatímco Cassandra je stále nejoblíbenější, ScyllaDB rychle získává jako 7. nejoblíbenější široký sloupcový obchod podle DB-Engines. Jaké jsou tedy některé z důvodů, proč by si uživatelé vybrali ScyllaDB vs. Cassandra?

ScyllaDB nabízí výrazně nižší latenci, což vám umožňuje zpracovávat velký objem dat s minimálním zpožděním. Ve skutečnosti je podle srovnávací zprávy ScyllaDB jejich 99,9 percentilová latence až 11x lepší než Cassandra na holém kovu AWS EC2. Takže tento typ výkonu musí něco stát, ne? Má, ale v této zprávě tvrdí, že jde o 2,5násobné snížení nákladů ve srovnání se spuštěním Cassandry, protože tohoto výkonu mohou dosáhnout pouze s 10 % uzlů.

Existují desítky kvalitních článků o ScyllaDB vs. Cassandra, takže se zde krátce zastavíme, abychom se dostali ke skutečnému účelu tohoto článku, rozčlenění uživatelských dat ScyllaDB .

ScyllaDB Cloud vs. ScyllaDB On-Premises

ScyllaDB lze provozovat ve veřejném cloudu i lokálně. Ve skutečnosti je ScyllaDB nejčastěji nasazována jak ve veřejném cloudu, tak v prostředí on-premise v rámci jedné organizace. 44 % nasazení ScyllaDB využívající cloud i on-premise computing by mohlo být realizováno buď prostřednictvím hybridního cloudového prostředí využívajícího obojí pro konkrétní aplikaci, nebo pomocí těchto prostředí samostatně ke správě různých aplikací.

On-premise nasazení ScyllaDB a cloudové nasazení ScyllaDB byly mrtvé – dokonce i na 28 %. Bezplatný open source ScyllaDB i ScyllaDB Enterprise můžete provozovat v cloudu nebo on-premise a licence ScyllaDB Enterprise začíná na 28,8 000 $/rok pro celkem 48 jader.

Jaký je nejlepší způsob nasazení #ScyllaDB? Cloud vs. On-PremiseClick To Tweet

Nejoblíbenější poskytovatelé cloudu pro ScyllaDB

Vzhledem k tomu, že 28 % clusteru ScyllaDB je nasazeno výhradně v cloudu a 72 % využívá cloud v určité kapacitě, zajímalo nás, kteří poskytovatelé cloudu jsou nejoblíbenější pro úlohy ScyllaDB .

#1. AWS

Zjistili jsme, že 39,1 % všech cloudových nasazení ScyllaDB běží na AWS od našich účastníků průzkumu. I když jsme očekávali, že AWS bude poskytovatelem cloudových služeb číslo 1 pro ScyllaDB, procento bylo podstatně nižší než odpovědi ze všech typů cloudových databází v tomto průzkumu, který uvedl, že 55 % bylo nasazeno na AWS. Toto číslo více odpovídá naší nedávné zprávě o trendech databáze Open Source za rok 2019, kde bylo hlášeno, že 56,9 % cloudových nasazení běží na AWS. To může být způsobeno tím, že AWS nepodporuje ScyllaDB prostřednictvím jejich relačních databázových služeb (RDS), takže bychom mohli předpokládat, že jak stále více organizací pokračuje v migraci svých dat do ScyllaDB, AWS může zaznamenat pokles zákaznické základny.

#2. Google Cloud

Google Cloud Platform (GCP) byla druhým nejoblíbenějším poskytovatelem cloudu pro ScyllaDB, který dosáhl 30,4 % všech cloudových nasazení. Google Cloud nabízí svůj vlastní široký sloupcový obchod a databázi velkých dat s názvem Bigtable, která je ve skutečnosti na 111. místě, jedna pod ScyllaDB na 110. místě na DB-Engines. Nízká cena a vysoký výkon ScyllaDB z něj činí atraktivní možnost pro uživatele GCP, zejména proto, že se jedná o open source ve srovnání s Bigtable, který je komerčně dostupný pouze na GCP.

#3. Azure

Na třetím místě následoval Azure, což představuje 17,4 % všech nasazení ScyllaDB v cloudu od respondentů našeho průzkumu. Azure je atraktivní poskytovatel cloudu pro organizace využívající sadu služeb Microsoft.

Který poskytovatel cloudu je pro #ScyllaDB nejoblíbenější? AWS vs. Azure vs. GCPClick To Tweet

Zbývajících 13,0 % cloudových nasazení ScyllaDB bylo zjištěno, že běží ve službách cloud computingu DigitalOcean, Alibaba a Tencent.

Jejich spravovaná služba, Scylla Cloud, je aktuálně dostupná pouze na AWS a k využití jejich DBaaS musíte použít verzi ScyllaDB Enterprise. Scylla Cloud plánuje v budoucnu přidat podporu pro GCP a Azure, ale s pouhými 39 % hlášeními o AWS můžeme předpokládat, že více než 60 % nasazení ScyllaDB se samo spravuje v cloudu.

Nejčastěji používané databáze se ScyllaDB

Jak jsme také zjistili ze zprávy Open Source Database Report z roku 2019, organizace v průměru využívají 3.1 různých typů databází. V tomto průzkumu však organizace používající ScyllaDB uvedly, že v průměru používají pouze 2,3 různých typů databází, což je 26% snížení ve srovnání s našimi výsledky od všech uživatelů databází s otevřeným zdrojovým kódem. Zjistili jsme také, že 39 % nasazení ScyllaDB používá pouze ScyllaDB a ve svých aplikacích nevyužívá žádný jiný typ databáze.

Které databáze se tedy nejčastěji používají ve spojení se ScyllaDB? Zjistili jsme, že uživatelé ScyllaDB také používají SQL databáze MySQL 20 % času a PostgreSQL 20 % času také. Druhou nejčastěji používanou databází se ScyllaDB byla Cassandra zastoupená v 16 % nasazení a mohli bychom předpokládat, že je to organizacemi, které testují ScyllaDB jako alternativu ke Cassandře ve svých aplikacích, protože oba typy databází jsou úložiště se širokými sloupci.

MongoDB byla čtvrtá nejčastěji nasazená databáze se ScyllaDB na 12 %. Redis a Elasticsearch se umístily na pátém místě, obě využívají 8 % času s nasazením ScyllaDB.

Zjistili jsme také, že 20 % nasazení Scylly využívá jiné typy databází, včetně Oracle, Aerospike, Kafka (která se nyní transformuje na databázi pro streamování událostí), DB2 a Tarantool.

Časově nejnáročnější úkoly správy ScyllaDB

Víme, že ScyllaDB je široce výkonná, ale jak snadné je její použití? Zeptali jsme se uživatelů ScyllaDB, jaký je jejich časově nejnáročnější úkol správy, a od 28 % jsme slyšeli, že oprava Scylla byla nejdelším úkolem správy. Scylla Repair je proces synchronizace, který běží na pozadí, aby bylo zajištěno, že všechny repliky budou nakonec obsahovat stejná data. Uživatelé musí pravidelně spouštět příkaz nodetool repair, protože neexistuje způsob, jak automatizovat opravy ve verzích ScyllaDB s otevřeným zdrojovým kódem nebo ScyllaDB Enterprise, ale můžete nastavit plán oprav pomocí Scylla Manager.

Analýza pomalých dotazů ScyllaDB vyrovnala zálohy a obnovy ScyllaDB na druhé místo se 14 % pro každou časově nejnáročnější úlohu správy. Nezdá se, že by ScyllaDB aktuálně měla k dispozici analyzátor dotazů k identifikaci dotazů, které je třeba optimalizovat, ale uživatelé mohou pomocí pomalého protokolování dotazů zjistit, které dotazy mají nejdelší dobu odezvy. Zálohy ScyllaDB také nelze automatizovat prostřednictvím open source a podnikových verzí, ale uvádí, že opakované zálohy budou dostupné v budoucích vydáních Scylla Manager. Neexistuje také žádný automatický způsob, jak obnovit zálohu ScyllaDB, protože tyto musí být ve všech verzích provedeny ručně.

10 % uživatelů ScyllaDB uvedlo, že přidávání, odebírání nebo nahrazování uzlů bylo časově nejnáročnějším úkolem a umístilo se na čtvrtém místě. Jedná se o manuální procesy, které mohou zabrat poměrně dost času, zvláště pokud máte co do činění s velkým objemem dat. Přidání uzlů se používá k škálování nasazení, zatímco jejich odstraněním se vaše nasazení zmenšuje. Uzly musí být vyměněny, pokud jsou nefunkční nebo mrtvé, i když cluster může být stále dostupný, když je mimo provoz více než jeden uzel.

Na pátém místě se 7 % seděly upgrady a odstraňování problémů. ScyllaDB Enterprise i open source vyžadují rozsáhlé kroky k upgradu clusteru. Doporučené metody jsou prostřednictvím postupného postupu, takže nedochází k prostojům, ale jedná se o ruční proces, takže uživatel musí odstranit jeden uzel po druhém, provést všechny kroky upgradu, restartovat a ověřit uzel, než přejde k provádění stejné kroky pro zbývající uzly v clusteru. Časově náročné, ale naštěstí to není každodenní úkol! Odstraňování problémů je samozřejmě hluboká králičí díra, do které se lze ponořit, ale zákazníci ScyllaDB Enterprise dostávají 24/7 kritickou podporu a uživatelé s otevřeným zdrojovým kódem mají přístup k nepřebernému množství zdrojů, včetně dokumentace, e-mailových konferencí, Scylla University a slabého kanálu pro uživatele. diskuze.

Jaký je časově nejnáročnější úkol správy #ScyllaDB? Kliknutím na Tweet

Zbývajících 21 % časově náročných úkolů hlášených uživateli ScyllaDB zahrnuje monitorování, migraci, zajišťování, vyvažování fragmentů, komprimaci a opravy.

Jaké jsou tedy tyto výsledky v porovnání s vašimi nasazeními ScyllaDB? Hledáte způsob, jak automatizovat tyto časově náročné úkoly správy? I když dnes podporujeme MySQL, PostgreSQL, Redis™* a MongoDB® Database, neustále hledáme zpětnou vazbu, pro kterou databázi přidat podporu prostřednictvím našich plánů DBaaS. Dejte nám vědět v komentářích nebo na Twitteru na @scalegridio, pokud hledáte snazší způsob správy vašich ScyllaDB clusterů v cloudu nebo on-premise!


  1. 10 faktů o monitorování výkonu databáze, které vás mohou překvapit

  2. Vraťte konec měsíce v SQLite

  3. Vyplnění pole Many2many (odoo 8)

  4. Vrátit se do readline verze 6.x v Homebrew a opravit Postgresql?