Dokumentace pro RMySQL je docela dobrá - ale předpokládá, že znáte základy SQL. Jsou to:
- vytvoření databáze
- vytvoření tabulky
- získání dat do tabulky
- získání dat z tabulky
Krok 1 je snadný:v konzoli MySQL jednoduše „vytvořte databázi DBNAME“. Nebo z příkazového řádku použijte mysqladmin nebo často existují GUI pro správu MySQL.
Krok 2 je trochu obtížnější, protože musíte zadat pole tabulky a jejich typ. To bude záviset na obsahu vašeho CSV (nebo jiného odděleného) souboru. Jednoduchý příklad by vypadal asi takto:
use DBNAME;
create table mydata(
id INT(11) NOT NULL AUTO_INCREMENT PRIMARY KEY,
height FLOAT(3,2)
);
Což říká vytvořit tabulku se 2 poli:id , který bude primárním klíčem (musí být tedy jedinečný) a bude se automaticky zvyšovat, jak budou přidány nové záznamy; a výška , který je zde uveden jako float (číselný typ), s celkem 3 číslicemi a 2 za desetinnou čárkou (např. 100,27). Je důležité, abyste rozuměli typům dat .
Krok 3 – existují různé způsoby, jak importovat data do tabulky. Jedním z nejjednodušších je použít mysqlimport utility. Ve výše uvedeném příkladu, za předpokladu, že vaše data jsou v souboru se stejným názvem jako tabulka (mydata), první sloupec je znak tabulátoru a druhý proměnná výška (bez řádku záhlaví), by to fungovalo:
mysqlimport -u DBUSERNAME -pDBPASSWORD DBNAME mydata
Krok 4 – vyžaduje, abyste věděli, jak spouštět dotazy MySQL. Opět jednoduchý příklad:
select * from mydata where height > 50;
Znamená „načíst všechny řádky (id + výška) z tabulky mydata, kde je výška větší než 50“.
Jakmile si osvojíte tyto základy, můžete přejít ke složitějším příkladům, jako je vytvoření 2 nebo více tabulek a spouštění dotazů, které spojují data z každé z nich.
Pak - můžete se obrátit na příručku RMySQL. V RMySQL nastavíte připojení k databázi a poté pomocí syntaxe dotazu SQL vrátíte řádky z tabulky jako datový rámec. Je tedy opravdu důležité, abyste získali část SQL – část RMySQL je snadná.
Na webu je hromada výukových programů MySQL a SQL, včetně „oficiálního“ výukový program na webu MySQL. Stačí Google vyhledat „mysql tutorial“.
Osobně 80 Mb vůbec nepovažuji za velký datový soubor; Jsem překvapen, že to způsobuje problém s RAM a jsem si jistý, že nativní funkce R to zvládnou docela snadno. Ale je dobré se naučit nové dovednosti, jako je SQL, i když je k tomuto problému nepotřebujete.