Nutch:修正したソースをコマンド実行に反映させる

Eclipseならソースを修正して実行ボタン押せば普通に動くけど、コマンドで実行させる場合はちょっとした作業が必要。

修正したソースは全て

./src/

フォルダ内に入っているものとする。

nutchのバージョンは1.0。

ant

nutchフォルダで

$ant

すると、buildフォルダにコンパイルされたファイルが生成される。

移動

修正したファイルだけbuildフォルダから移動させる。

プラグインの場合
./build/プラグイン名/プラグイン名.jar

./plugins/プラグイン名/

へ移動。

プラグイン以外の場合

まず、

./nutch-1.0.jar

を解凍して

./nutch-1.0/

フォルダを生成しておく。

次に、

./build/classes/org/apache/nutch/パッケージ名/クラス名.class

./nutch-1.0/org/apache/nutch/パッケージ名/

に移動。

nutch-1.0.job
./build/nutch-1.0.job

./

に移動。
(これ、何に使われているのかちょっと分からないけどとりあえず上書き)

実行

後は

$nutch crawl urls crawl -depth 10 -topN 100

とかすれば修正された部分が反映されているはず。