如何在 SolrNet 中实施 JSON Facet API
我想在solr中发挥汇总功能,我从此中实现它 如何实现 json facet api solrnet ISolrOperations solr = connection.GetSolrInstance(); QueryOptions queryOption = new QueryOptions { Rows = 0, FilterQueries = new ISolrQuery[] { new SolrQueryByField("playerId", query.PlayerId.ToString()), new SolrQueryByRange("dateTime", query.DateTimeFrom, query.DateTimeTo) },
6 2024-04-26
编程技术问答社区
Solr.Net查询返回错误结果
我正在尝试使用 solr.net .我的字段body在架构中定义为: text_general在模式中使用solr.StandardTokenizerFactory,定义为:
8 2024-04-25
编程技术问答社区
SOLR DIH delta 输入与更新
我在SQL数据库中存储了一个大数据,该数据正在不断更新.我需要找到更新SOLR索引的最佳方法,指出我的表格太多,例如产品,productDetails,ProductStocks ...等. 似乎有两个解决方案: 1)dih deltaqueryimport-查询数据库中的所有记录,这些记录的最后一个记录大于last_index_time,然后将这些记录导入索引索引,每30分钟安排每30分钟,并且尚未在sceded时进行的数据进行反映,尚未反映,尚未重新列出,尚未进行反映,尚未进行反映,并未进行.由于更新的记录数量,在查询上花费了太多时间. 2)任务队列 - 每次在数据库中更新产品时,我们都会将任务索引到Solr. 只想知道您的建议以及每种方法的利弊? 解决方案 我从事一个具有类似情况的项目.我们决定实施您的第二解决方案. 推动比拉力解决方案更可取.通过推送解决方案,您可以实现接近实时更新,通常这是业务的重要优势. 但是,使用此解决方案,您需要考虑以
10 2024-04-23
编程技术问答社区
Solr MoreLikeThis /mlt处理程序返回404错误
我想找到与Solr中特定文档相似的所有文档.我已经安装了Solr并进行了一些疑问.我试图提出的查询会产生一个错误,我无法在互联网上弄清楚或研究.你能给我一些启示吗?我正在使用Solrnet客户端,但是如果Solrnet不适合此类查询,我将很乐意使用Pure Solr并阅读XML. 这是我正在使用的查询: 这是我的架构XML 这是我收到的错误: 解决方案 似乎您尚未在SolrConfig.xml中注册MLT处
16 2024-04-23
编程技术问答社区
如何在 windows 上将 Spark Streaming 连接到独立的 Solr?
我想将火花流与独立的Solr集成.我在窗户上使用Spark 1.6.1和Solr 5.2独立,没有动物园配置.我能够通过传递Zookeeper配置找到一些解决方案,从Spark连接到Solr. 我如何将Spark程序连接到独立的Solr? 解决方案 请查看此示例是否有用 http://spark.apache.org/docs/latest/streaming-programming-guide.html#design-patterns-for-for-using-foreachrdd 以示例,您需要编写自己的连接类,以包装
18 2024-04-23
编程技术问答社区
Solr 数据导入处理程序 delta 导入
我正在使用dataImporthandler在SOLR中索引数据.我使用全图像索引了我的数据库中的所有数据,大约是10000个产品.它是否按间隔索引将新数据添加到数据库中,我的意思是将新数据索引到我的表中添加到10行左右,或者只是更新已经索引的数据中的更改. 任何人都可以尽快向我解释一下. 解决方案 dataImporthandler可能会有些艰巨.您的初始查询已加载了10.000种独特产品.如果您指定/dataimport?command = Full-Import,则将其加载. 完成此导入后,DIH将存储一个变量({dataimporter.last_index_time}),这是您进行此导入的最后一个日期/时间. 为了进行更新,您指定了一个deltaquery. Deltaquery旨在确定自上次更新以来数据库中已更改的记录.因此,您指定了这样的查询:选择product_id 从某种程度上 其中[date_update]> ='$ {dataimporter.l
36 2024-04-23
编程技术问答社区
SolrServer:使用 addBean( Object Bean ) 时是否需要模式?
我在solrserver中看到了两种方法:addbean(object bean)和add(solrdocument doc). 我的问题是: 如果我可以使用AddBean()直接添加对象,我是否需要为对象创建任何架构? Solr不查看对象的字段并从那里确定模式? 或solr首先将对象序列化到字符串中,然后使用普通添加? (这可能需要架构规范) 解决方案 solr支持A 此功能是-IMHO-适用于原型制作并获得模式的首个版本,但是您不应该使用这种核心进行生产. 有一些资源提供有关该主题的更多详细信息 图案+模式 http://searchhub.org/2013/05/21/shemaless-solr-part-1/ 但是要回答您的问题 如果您在该示意图模式下运行服务器,不,您不需要模式. 如果您做不是 - 这很可能,因为它不是开箱即用的 - 是的,您确实需要一个架构
32 2024-04-23
编程技术问答社区
如何获取 Solr 中最后插入的文档?
我的问题是.. 当我想在solr中获得最后的文档ID时,我会得到 99999999 和最后一个ID = 246458031 我尝试这个 如何在solr中获得最后的索引记录? ,仅在上次ID 9999999 时才起作用 2.当我使用时间戳时,许多记录的日期相同[TIMESTAMP":" 2017-08-14T08:51:21.185Z] 所以我需要从solr获得最后一个ID 编辑 我找到了解决方案[ q =*:*&start = 0&rows = 1&sort = timestamp+desc,id+desc ] 我按时间和ID进行了排序,它运行得很好 解决方案 您可以按_version_降序排序. afaik,_version_字段是毫秒乘以2^20的毫秒. 从SOLR代码库中删除的相关代码: public long getNewClock() { synchronized (clockSync) { long time =
18 2024-04-23
编程技术问答社区
Solr/SolrJ:如何在不创建巨型 ArrayList 的情况下遍历结果
是否有一种方法可以迭代SOLRJ响应,以便在迭代过程中逐渐获取结果,而不是返回巨大的内存ArrayList? 或我们必须诉诸于此: SolrQuery query = new SolrQuery(); query.setQuery("*:*"); int fetchSize = 1000; query.setRows(fetchSize); QueryResponse rsp = server.query(query); long offset = 0; long totalResults = rsp.getResults().getNumFound(); while (offset
20 2024-04-23
编程技术问答社区
Solr:现有索引
我与Solr一起索引一些数据.在开始另一个索引之前,我需要检查现有索引. 是否有任何命令可以使用Solr检查现有索引? 谢谢! 解决方案 如果要探索索引的内容,则可以使用 luke ,您可以在Github中下载: https://github.com/dmitrykeykey/luke/luke/releases
30 2024-04-23
编程技术问答社区
Solr-Collections API 超时
我有一个带有3倍动物园守门员和4x solrcloud节点的设置. 这一切都在起作用,所有节点都彼此见面,我最初有一个默认集合. 从那里,我使用集合API创建了一个新的集合,该集合成功地完成了,所有收藏集已成功地跨越了2个节点,而其他2个则用于副本.我还可以成功将文档保存到该集合中.在任何框上浏览Solr Web GUI都可以,没有速度问题. 但是,每当我尝试使用集合API时,我都会获得超时.创建一个新的集合,重新加载现有的收藏之一,删除一个集合……所有这些都超时. 关于为什么会非常感谢 的任何想法 欢呼 解决方案 最终成为动物园管理员配置不匹配 其他解决方案 我也面临类似的问题: Solr process 24214 running on port 8983 Failed to get system information from http://localhost:8983/solr/ due to: org.apache.solr.
22 2024-04-23
编程技术问答社区
SolrJ 和自动提交
我使用solrj api将文档添加到Solr 4.3核心,我注意到我将自动加入设置为库存solrconfig中的15秒,我如下所示. ${solr.autoCommit.maxTime:15000} false 我的尚无请勿将自动提交设置为true,这意味着Solr实例将每15秒自动提交一次,因此我不需要使用Solrj API提交明确性,就像每次添加文档时,对于Solr,我的理解正确吗? httpSolrServer.add(doc1); httpSolrServer.commit();// Is this still needed ? 预先感谢! 解决方案 如果已定义自动命令,则不需要明确的提交. 但是,在上面的定义中,您将OpenSearcher设置为(硬
28 2024-04-23
编程技术问答社区
无法找到或加载主类 org.apache.solr.util.SolrCLI
我一直在遇到错误 "无法找到或加载主类org.apache.solr.util.solrcli" 在尝试在Windows X64 Machine上设置Solr时. 解决方案 解决问题的解决方案真的很简单. 1)启动solr.请注意,您必须使用solr.cmd而不是仅使用solr *bin/solr.cmd start* 2)然后创建集合: *bin/solr.cmd create -c gettingstarted -p 8983* 3)然后使用Post工具将文件/s添加到索引中.您可以通过两种方式执行邮政命令 a)java -Dc=gettingstarted -jar post.jar *.json 或 b)bin/post -c gettingstarted example/exampledocs/books.json 现在,您可以导航到新创建的收藏" Getstarted"并查询您的书籍. `希望这能节省某人的时间.
50 2024-04-23
编程技术问答社区
如何在一次请求中上传 pdf 并更新字段
全部: 我是Solr和Solrj的新手.我现在要做的是将PDF文件上传到SOLR并设置自定义字段,例如同时进行last_modified字段. ,但我一直遇到错误,例如"遇到的多个多值字段last_modified遇到的多个值",我使用solrj上传pdf并设置了last_modified字段,例如 ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract"); up.setParam("literal.last_modified", "2011-05-19T09:00:00Z"); 我猜该错误是由于solr提取PDF时,它也将一些元数据作为last_motified的字段值,因此我的custmized last_modified值会导致多瓦错误,但是我想知道如何替换meta带有我的Custmized数据的数据? 谢谢 解决方案 /update/ext
22 2024-04-23
编程技术问答社区
Solr 将数据从 "爬虫 "核心复制到 "搜索 "核心
我们正在寻求设置SOLR 4.9设置,其中我们的一个非常简单的爬网擦拭并加载了"爬网"核心,然后在爬网完成后将数据副本触发到"搜索"核心.这样做的目的是,我们的爬行者非常简单,并且并没有真正以有利于进行更新和删除的方式跟踪文档.基本上,爬虫将删除整个"爬网"核心,撕裂了约50k的文档(提交1000左右),然后触发一些可以通过数据复制到另一个"搜索"核心的东西. . 假设我们必须重新启动搜索核心,那么如何通过命令行或代码使其成为可能? 解决方案 创建第三个核心作为search core的副本.然后使用coreadmin中的mergeindexes命令将两个不同的核心合并为第三个核心.合并完成后,与旧的search核心交换第三个核心.然后卸载所交换的core (如果您觉得自己可以觉得可以,请使用deleteInstanceDir=true永久删除旧数据). 类似: http://localhost:8983/solr/admin/cores/action=CREA
38 2024-04-23
编程技术问答社区
Lucene 中词组查询的位置偏移
我正在努力自定义荧光笔插件(使用FVH),以输出给定搜索的查询项的位置偏移.到目前为止,我已经能够使用以下代码提取正常查询的偏移信息.但是,对于短语查询,代码即使不属于短语查询的一部分,代码即使它不属于所有查询项的位置偏移(即术语集).因此,我想知道Lucene是否有一种方法可以仅获取使用FVH的短语查询短语的偏移信息? // In DefaultSolrHighlighter.java::doHighlightingByFastVectorHighlighter() SolrIndexSearcher searcher = req.getSearcher(); TermFreqVector[] tvector = searcher.getReader().getTermFreqVectors(docId); TermPositionVector tvposition = (TermPositionVector) tvector[0]; Set termSet
72 2024-04-23
编程技术问答社区
Solr 评分关键词检测率
我使用的是solr 6.1 我现在设置分数, 但是我在得分上有一些问题 我只是搜索GC,QF集为:title^100 content^70 text^50, 三个字段类型都是text_general, 我获得第一个结果得分是1050.8486,另一个是853.08655, 但是,第一个内容在内容字段中是如此短,而另一个内容在内容字段中 太多了 我只是不知道为什么第一个分数会很多 下面的两个结果调试内容: 1002.8741 =总和:\ n 1002.8741 =最大值:\ n 1002.8741 =重量(标题:1275中的GCS)[],结果:\ n 1002.8741 = score = score(doc = 1275,freq = 1.0 = 1.0 = termfreq = 1.0 = termfreq = 1.0 \ n),乘积:\ n 100.0 = boost \ n 8.513557 = idf(docfreq = 27,
22 2024-04-23
编程技术问答社区
Solr 拼写检查程序随机工作
我对Solr集成的咒语检查器有问题. 我(目前)有两个内核,配置了相同的solrconfig.xml(适用于拼写检查器的设置正确)和略有不同的XML(用于SpellChecker的配置相同). 问题在于,对于一​​个核心,咒语检查器的运作良好,对于另一个核心. 对于solr admin的不工作的,我可以看到字段"拼写"(拼写检查使用的字段)是索引但没有存储的. 有什么想法吗? 我认为我不属于我,因为它们不属于我. 感谢大家 编辑: solrxml.conf ...
18 2024-04-23
编程技术问答社区
SolrCloud:使用 "开始、行 "参数进行经典分页的变通方法
我有3个碎片的Solrcloud. 我的目的:从类别中选择并处理所有产品. 当前实施:周期中的部分选择. 第1次迭代:q = cat:1&start = 0&lows = 100 第二次迭代:q = cat:1&start = 100&row = 100 第三:Q = CAT:1&start = 200&lows = 100 ... 但是增长"开始",性能下降.在这里说明: https://wiki.apache.org/solr/solr/distribedsearch 使使用高"启动"参数效率更高.为了 例如,如果请求开始= 500000&排= 25在索引上,500,000+ 文档每片,目前将导致500,000个记录获得 通过网络从碎片发送到协调的solr 实例.相比之下,如果您有一个单股索引,则只有25个 记录会通过网络发送. (理所当然,设置开始 这个高不是很多人需要做的事情.) 我如何在类别中的所有记录中走动什么想法? 解决方
14 2024-04-23
编程技术问答社区