怎么使用nutch创建索引
的有关信息介绍如下:
一个是schema.xml,在其中的fields标签下加入如下代码: Java代码 lt;field name="test2" type="string" stored="true" indexed="true"/> 其中的stored表示这个字段的值要存储在lucene的索引中 其中的indexed表示这个字段的值是不是要进行分词查询 还有一个是solrindex-mapping.xml文件,这个文件的作用是把索引过滤器中生成的字段名与schema.xml中的做一个对应关系,要在其fields标签中加入如下代码: Java代码 这样自定义索引过滤插件就算完成了,记得这里的schema.xml文件是在solr/conf目录下的,修改以后要重启一下,不知道solr支不支持修改了配置文件后不重启就可以生效。 bin/nutch solrindex http://localhost:8080/solr/ crawldb -linkdb crawldb/linkdb crawldb/segments/* solr的索引文件在solr/data/index中,你可以用luke这个工具加开其索引文件,看一下其中的一些元信息,这个时候你就应该可以看到test1与test2这两个字段了.