Získejte zdroj z http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip
Otevřete org.apache.nutch.crawl.Crawl
třídy ve vašem editoru.
Vyhledávací proměnná Path crawlDb = new Path(dir + "/crawldb");
Proměnná vám napoví, kde nahradit kód, abyste získali svůj vlastní CustomMySQLCrawl
třída.
K přetrvávání dochází během tohoto volání:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb
Takže tam je místo, kam byste jej měli uložit do databáze. Možná budete chtít v tomto okamžiku zvážit integraci režimu spánku.