sql >> Databáze >  >> RDS >> Mysql

Nastavte velkou databázi v MySQL pro analýzu v R

Dokumentace pro RMySQL je docela dobrá - ale předpokládá, že znáte základy SQL. Jsou to:

  • vytvoření databáze
  • vytvoření tabulky
  • získání dat do tabulky
  • získání dat z tabulky

Krok 1 je snadný:v konzoli MySQL jednoduše „vytvořte databázi DBNAME“. Nebo z příkazového řádku použijte mysqladmin nebo často existují GUI pro správu MySQL.

Krok 2 je trochu obtížnější, protože musíte zadat pole tabulky a jejich typ. To bude záviset na obsahu vašeho CSV (nebo jiného odděleného) souboru. Jednoduchý příklad by vypadal asi takto:

use DBNAME;
create table mydata(
  id INT(11) NOT NULL AUTO_INCREMENT PRIMARY KEY,
  height FLOAT(3,2)
); 

Což říká vytvořit tabulku se 2 poli:id , který bude primárním klíčem (musí být tedy jedinečný) a bude se automaticky zvyšovat, jak budou přidány nové záznamy; a výška , který je zde uveden jako float (číselný typ), s celkem 3 číslicemi a 2 za desetinnou čárkou (např. 100,27). Je důležité, abyste rozuměli typům dat .

Krok 3 – existují různé způsoby, jak importovat data do tabulky. Jedním z nejjednodušších je použít mysqlimport utility. Ve výše uvedeném příkladu, za předpokladu, že vaše data jsou v souboru se stejným názvem jako tabulka (mydata), první sloupec je znak tabulátoru a druhý proměnná výška (bez řádku záhlaví), by to fungovalo:

mysqlimport -u DBUSERNAME -pDBPASSWORD DBNAME mydata

Krok 4 – vyžaduje, abyste věděli, jak spouštět dotazy MySQL. Opět jednoduchý příklad:

select * from mydata where height > 50;

Znamená „načíst všechny řádky (id + výška) z tabulky mydata, kde je výška větší než 50“.

Jakmile si osvojíte tyto základy, můžete přejít ke složitějším příkladům, jako je vytvoření 2 nebo více tabulek a spouštění dotazů, které spojují data z každé z nich.

Pak - můžete se obrátit na příručku RMySQL. V RMySQL nastavíte připojení k databázi a poté pomocí syntaxe dotazu SQL vrátíte řádky z tabulky jako datový rámec. Je tedy opravdu důležité, abyste získali část SQL – část RMySQL je snadná.

Na webu je hromada výukových programů MySQL a SQL, včetně „oficiálního“ výukový program na webu MySQL. Stačí Google vyhledat „mysql tutorial“.

Osobně 80 Mb vůbec nepovažuji za velký datový soubor; Jsem překvapen, že to způsobuje problém s RAM a jsem si jistý, že nativní funkce R to zvládnou docela snadno. Ale je dobré se naučit nové dovednosti, jako je SQL, i když je k tomuto problému nepotřebujete.



  1. Rozumíte segmentům Lob (SYS_LOB) v oracle?

  2. CONCAT_WS() pro SQL Server

  3. Jak změnit uživatele na superuživatele v PostgreSQL

  4. Jak modelovat přátelské vztahy