当前位置: 首页 > SearchEngine > Solr in action 开篇介绍(1)

Solr in action 开篇介绍(1)

Apache Solr5.1

Solr是基于apche licene的受欢迎的、快的开源企业搜索平台。
Solr的高度可靠,可扩展性和容错,提供分布式索引,复制和负载均衡的查询,自动故障转移和恢复,集中配置等等。
Solr为许多世界上最大的互联网网站的搜索和导航功能提供支持。

功能

Solr是一个拥有REST_like API的独立企业搜索服务。你可以通过HTTP的方式上传JSON、XML、CSV或者字节等方式将文档加入到索引中。同时,你也可以通过HTTP GET的方式查询索引,并获取JSON、XML、CSV或者字节结果等。
1.高级的全文本搜索能力 Advanced Full-Text Search Capabilities
拥有强大的匹配能力,包括分词、通配符、关联、分组以及对任何数据类型的支持。
2.高通信量优化 Optimized for High Volume Traffic
3.基于标准的开放式接口:XML、JSON、HTTP
4.提供一套完整的综合管理界面 Comprehensive Administration Interfaces
Solr附带了一个内置的响应迅速的管理用户界面,可以方便的控制Solr实例。
5.方便的实现Solr监控 Solr通过JMX的方式发布metric数据
6.高扩展性和容错能力 Highly Scalable and Fault Tolerant 通过zookeeper来实现动态扩展、复制、分发、均衡和容错。
7.灵活性和适应性,方便配置
Solr的设计,以适应您的需求,同时还能简化配置
8.近实时索引
想看看现在你的更新? Solr的利用了Lucene的近实时索引功能优势,以确保您看到您的内容,当你想看到它
9.可扩展的插件架构
Solr的出版许多定义良好的扩展点可以很容易地插件都索引和查询时间的插件。当然,既然是Apache许可的开源,你可以改变你想要的任何代码!

其他功能

1.对富文本的支持,支持word,pdf内容检索
2.地理信息搜素:启用基于位置的搜索非常方便,这些是Solr内置的空间搜索功能
3.高度可配置扩展的用户缓存:Solr内置缓存的细粒度控制,便于性能优化
4.高级存储选项:建立在Lucene的先进的存储能力(编解码器,目录等),Solr的可以很容易地调整你的数据存储需求,以满足您的应用
5.继承UIMA进行非结构化信息管理提取
6.多重搜索引擎:Solr的多租户架构,很容易隔离用户和内容

数据处理

(https://cwiki.apache.org/confluence/display/solr/Overview+of+Documents%2C+Fields%2C+and+Schema+Design)
1.无配置模式(data-driven schema)和配置模式
2.字段类型与Lucene可以进行无缝匹配
3.动态字段启用,可以即时的添加新的字段
4.通过Solr的副本模式可以通过不能的方式对相同的内容进行分析
5.明确的数据类型
6.提供外部的基于文件的禁用词列表、同义词列表、保护词列表
7.包含许多额外的文本分析组件,包括分词、正则表达式等
8.数据类型的可扩展性

搜索

(https://cwiki.apache.org/confluence/display/solr/Searching)
1.REST接口
2.可以根据任意数量的字段进行排序,包括数学领域方面的计算等功能。缺少值的文档可以被配置为最后一个或者第一个进行排序
3.查询功能提供强大的关联性调整功能
4.Solr支持多种方法来查询解析
5.丰富的过滤功能
6.可插拔的查询分析器(query parsers)
7.NRT(Near Real Time) 近实时

切面Facets

(https://cwiki.apache.org/confluence/display/solr/Faceting)
1.强大的切面以多种方式支持分组和组织数据
2.枢轴刻面支持复杂的问“如果”的问题
3.细粒度的性能控制使其能够权衡切面之间CPU和内存资源的竞争
4.枢轴切面支持周期、查询、范围、日期等的数据提取
5.范围切面可以对时间进行分组和对数据内容进行桶拆分
6.多选择面参数对切面与原结果集的交互方式进行精确控制

发现Discovery

聚类,拼写检查,自动完成,更可以很容易地帮助用户发现内容
1.预输入,自动完成,自动提示功能,无论你怎么称呼它,Solr的支持强大的,可扩展的机制来提供建议,以作为用户他们在键入查询
(https://cwiki.apache.org/confluence/display/solr/Suggester)
2.综合Carrot2功能使动态搜索结果聚类(https://cwiki.apache.org/confluence/display/solr/Result+Clustering)
3.拼写建议是一件轻而易举的使,以帮助用户纠正他们的查询获得更好的结果(https://cwiki.apache.org/confluence/display/solr/Spell+Checking)
4.配置命中突出显示,帮助用户集中在究竟在何处发生匹配(https://cwiki.apache.org/confluence/display/solr/Highlighting)

统计数据与聚合

Statistics and Aggregations(https://cwiki.apache.org/confluence/display/solr/The+Stats+Component)
1.Solr支持对结果集的复杂数据分析
2.可以计算最小值、最大值、合计等
空间Spatial(https://cwiki.apache.org/confluence/display/solr/Spatial+Search)
富文本(https://cwiki.apache.org/confluence/display/solr/Indexing+and+Basic+Data+Operations)
性能Performance(https://cwiki.apache.org/confluence/display/solr/The+Well-Configured+Solr+Instance)

扩展Scaling

(https://cwiki.apache.org/confluence/display/solr/SolrCloud)
1.按需要及计算能力进行solr的扩展,负载均衡等
2.碎片拆分实现增量更新
3.通过zookeeper完成solr的主从一致性
4.内置的用户界面可以查看集群状况
5.日志传输、复制和故障转移减少数据丢失

管理界面

(https://cwiki.apache.org/confluence/display/solr/Using+the+Solr+Administration+User+Interface)
1.广泛的报告和控制接口,可以很容易地理解和改变正在发生什么的Solr
2.浏览日志,线程和系统性能
3.通过查询界面瞬间探索您的数据,而无需编写代码
4.探索和分析,数据研究和更先进的接口调试您的数据和查询
5.从浏览器上可以直接索引的内容,包括文件上传等功能



本文固定链接: http://anyoneking.com/archives/784 | 懒散狂徒的博客
标签: , , ,

【上一篇】

报歉!评论已关闭.