我刚刚开始使用Nutch和Solr。我用一个种子URL运行了一次爬行。我运行了这个命令:
bin/nutch抓取网址-dir抓取-solrhttp://localhost:8983/solr/深度3-topN 5
一切顺利,我假设Solr索引页面?那么我现在如何进行搜索呢?我去了这里localhost:8983/solr/admin/但是当我输入搜索查询并单击搜索时,我得到了这个:
HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text
我还尝试了教程中的一个示例,但当我运行此命令时:
java-jarpost. jar solr.xml监视器
我明白了:
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'
我的最终目标是以某种方式将这些数据添加到Accumulo中并将其用于搜索引擎。
我假设您使用的是Nutch 1.4或更高版本。如果是这种情况,您需要将在solr/conf/schema. xml文件中添加的字段类型从“text”更改为“text_general”,不带引号。
我现在正朝着一个类似的目标努力,并且已经使用该修复程序至少让solr正常工作,尽管我仍然无法让solr搜索索引站点。希望这有帮助,如果你能让它工作,请告诉我。