我有一个文档列表,我正在根据用户对阿帕奇SOLR的查询对这些文档进行索引。我想通过使用相关索引文档中的关键字来提取一些新闻文章,并将其与索引文档一起显示给用户。有没有什么算法或程序可以让我们从文档中提取相关的关键词,并用于提取新闻?
您应该研究TF-IDF关键字提取。大约两年前,我用英语Wiki和一个简单的Python脚本做了一个类似的过程。不过,在进行此操作之前,您需要回答几个问题。你可以在这里找到一篇关于使用TF-IDF关键字提取的文章