Nutch:Crawlを使わずそれぞれを単品で実行すると上手くいかない

Crawl.javaを実行すると
Injector,Generator,Fetcher,CrawlDb,LinkDb,Indexer
なんかをまとめて実行してくれるんですが、インデックスは自分でやりたいから、
Injector,Generator,Fetcher,CrawlDb
ここら辺を単品で実行させてみた。

何となく上手くいくものの、crawl-urlfilter.txtあたりのフィルターが効いてないらしく、amazonとかソフマップとか関係ないサイトまでクロールしてた。

Crawl.javaのmainをまねてやれば上手くいくんだろうけど、面倒なので個別実行は保留にしておきます。

追記

Crawl.javaのmainのインデックス生成部分をコメントアウトして利用することに。