P23

  Lucene 3.0 实战 文档

全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。 关于全文检索,我们要知道:1,只处理文本。2,不处理语义。3,搜索时英文不区分大小写。4,结果列表有相关度排序。 在信息检索工具中,全文检索是最具通用性和实用性的。

烟波天客 2015-03-18   2776   0
P

Lucene 3.0.0 API 文档 文档

Apache Lucene是一个高性能,功能完整的文本搜索引擎库。

gongjinxun 2015-01-02   457   0
P28

  基于lucene的搜索引擎 文档

引言本文用lucene和Heritrix构建了一个Web搜索应用程序Lucene是基于Java的全文信息检索包,它目前是ApacheJakarta家族下面的一个开源项目。Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。Heritrix是一个纯由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。

2804915145 2014-11-29   681   0
P8

  Lucene.net基本应用 文档

Lucene.net基本应用

240996650 2014-07-30   2538   0
P

Lucene 4.6 API 文档 文档

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java资讯检索程式库。 人们经常提到资讯检索程式库,虽然与搜索引擎有关,但不应该将资讯检索程式库与搜索引擎相混淆。 <br>  全文检索服务主要由两大部门构成:索引器及搜索器。索引器主要负责对文件名称及文件内容进行分词,并创建索引表。搜索器负责检索索引表,获取相关内容信息,并显示

guoshun 2014-07-08   546   0
P45

  Lucene 使用代码实例之搜索文档 文档

1,Query类:这是一个抽象类,用于将用户输入的查询字符串封装成Lucene能够识别的Query,它具有TermQuery,BooleanQuery,PrefixQuery等多种实现。2,Term类:用于描述搜索的基本单位,其构造函数是Term(“fieldName”,”queryWord”),其中第一个参数代表要在文档的哪一个Field上进行搜索,第二个参数代表要搜索的关键词。

纠结的忘忆 2014-04-24   2641   0
P8

  计算机专业外文翻译(lucene相关) 文档

向上向外扩展:关于研究Nutch/Lucene的互操作性摘要在过去几年中,多处理系统提高运行能力的解决方案一直困扰着主流的商业计算。主要的服务器供应商继续提供越来越强悍的机器,而近期,向外扩展的解决方案,规模较小的机器集群的形式,更加被商业计算所接受。向外扩展的解决方案是以网络为中心高吞吐量的特别有效的应用。

wushijie 2014-02-28   3671   0
P10

  Lucene 操作数据库例子 文档

用Lucene检索数据库1.写一段传统的JDBC程序,讲每条的用户信息从数据库读取出来2.针对每条用户记录,建立一个lucene document Documentdoc=newDocument();并根据你的需要,将用户信息的各个字段对应luncenedocument中的field进行添加。

n2m7 2014-01-02   4027   0
P4

  lucene使用心得分享 文档

lucene单个索引支撑的数据量极限,如何接近这个极限? lucene单个索引支撑的数据量极限是Integer.MAX_VALUE.   因为lucene索引中doc都有一个内部的docid,这个id lucene用了int 来做,因此,lucene单个索引支撑的数据量极限是Integer.MAX_VALUE.

lcc0739 2013-11-28   3813   0
P45

  Lucene 公司学习培训 文档

目录搜索引擎简介Lucene简介Lucene原理Lucene应用实例搜索引擎搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。全文检索:数据的存储有结构化和非结构化的。

gumpassion 2013-10-09   4055   0
P96

  Lucene 培训教程 文档

Lucene课程内容第一章:lucene简介第二章:入门实例第三章:内建Query对象第四章:分析器Analyzer第五章:QueryParser第六章:索引第七章:排序第八章:过滤项目实践:构建一个简单的WEB搜索程序第一章:Lucene简介搜索引擎的历史什么是Lucene全文检索系统的结构为什么使用LuceneLucene倒排索引原理Lucene Implementations基于Lucene的搜索程序CompassNutch开源搜索引擎列表全球商用搜索市场Heritrix介绍课堂练习:Heritrix简单抓取任务的设置搜索引擎的历史萌芽:Archie、Gopher 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 发展。

dc1314 2013-09-01   434   0
P45

  Lucene 使用代码实例之搜索文档 文档

1,Query类:这是一个抽象类,用于将用户输入的查询字符串封装成Lucene能够识别的Query,它具有TermQuery,BooleanQuery,PrefixQuery等多种实现。2,Term类:用于描述搜索的基本单位,其构造函数是Term(“fieldName”,”queryWord”),其中第一个参数代表要在文档的哪一个Field上进行搜索,第二个参数代表要搜索的关键词。3,TermQuery类:TermQuery是抽象类Query的一个具体实现,也是Lucene支持的最为基本的一个查询类。TermQuery的构造函数是TermQuery(newTerm(“fieldName”,”queryWord”)),唯一的参数是一个Term对象。4,IndexSearcher类:用于在建立好的索引上进行搜索的句柄类,其打开索引方式被设置为只读,因此允许多个IndexSearcher实例操作同一个索引。

lianzf 2013-07-05   5004   0
P97

  Lucene 课程 文档

内容第一章:lucene简介第二章:入门实例第三章:内建Query对象第四章:分析器Analyzer第五章:QueryParser第六章:索引第七章:排序第八章:过滤项目实践:构建一个简单的WEB搜索程序第一章:Lucene简介搜索引擎的历史什么是Lucene全文检索系统的结构为什么使用Lucene Lucene倒排索引原理Lucene Implementations基于Lucene的搜索程序CompassNutch开源搜索引擎列表全球商用搜索市场Heritrix介绍课堂练习:Heritrix简单抓取任务的设置搜索引擎的历史萌芽:Archie、Gopher 起步:Robot(网络机器人)的出现与Spider(网络爬虫).

ch1990 2013-06-17   5156   0
P96

  Lucene 课程 文档

Lucene课程内容第一章:lucene简介第二章:入门实例第三章:内建Query对象第四章:分析器Analyzer第五章:QueryParser第六章:索引第七章:排序第八章:过滤项目实践:构建一个简单的WEB搜索程序第一章:Lucene简介搜索引擎的历史什么是Lucene全文检索系统的结构为什么使用Lucene Lucene倒排索引原理Lucene Implementations基于Lucene的搜索程序CompassNutch开源搜索引擎列表全球商用搜索市场Heritrix介绍课堂练习:Heritrix简单抓取任务的设置搜索引擎的历史萌芽:Archie、Gopher 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 发展:Excite、Galaxy、Yahoo等繁荣:Infoseek、AltaVista、Google和Baidu 什么是LuceneLucene是非常优秀的成熟的开源的免费的纯java语言的全文索引检索工具包。

welss 2013-03-29   874   0
P9

  数据中心数据搜索引擎设计 文档

为了建立有自主版权的数据搜索引擎产品,数据中心数据搜索引擎采用lucene与POI相结合的方式实现。 Lucene是开源的搜索引擎产品,提供了全文索引建立和基于全文索引的数据搜索等功能。Lucene的全文索引建立只提供对文本文件的分词索引,对于现在的office文件格式目前不支持,需要借助于其他的office文件解析器才能建立office文件的分析索引。

xuesheng32 2013-02-18   3847   0
P10

  lucene入门与使用 文档

lucene入门与使用(转载)本文主要面向具体使用,适用于已熟悉java编程的lucene初学者。1.Lucene的简介1.1Lucene历史  org.apache.lucene包是纯java语言的全文索引检索工具包。 Lucene的作者是资深的全文索引/检索专家,最开始发布在他本人的主页上,2001年10月贡献给APACHE,成为APACHE基金jakarta的一个子项目。 目前,lucene广泛用于全文索引/检索的项目中。 lucene也被翻译成C#版本,目前发展为Lucene.Net(不过最近好象有流产的消息)。

xuesheng32 2013-02-18   484   0
P

Lucene 教程 文档

、lucene是apache下的一个开源框架,主要使用于处理大量资源全文搜索的时间使用的工具。从其官方网站定义为:Apache的Lucene的是一种基于java语言开发的、高性能、跨平台、几乎适用于任何程序的全文搜索引擎。并且apache的Lucenea是完全开源的。

diaomin81 2013-01-29   557   0
P45

  LUCENE 开发部署指导手册 文档

编制本手册的目的:1.描述Lucene用途,使开发人员依据本手册初步认识Lucene;2.描述Lucene的API,使开发人员可以快速认识并利用Lucene开发搜索引擎;3.描述Lucene和webdt的融合;4.重点描述Lucene的应用,使开发人员可按照本手册的描述开发。本手册面向的读者:熟悉Java开发,并对WEBDT软件的特点(请参阅《技术白皮书》)具有初步认识的技术人员。概述本手册首先介绍了Lucene的概念,详细描述了简单快速地将Lucene融入WEBDT运行平台并进行实际开发的方法,使技术人员对Lucene有一个概要性的框架认识,为下一步开发工作奠定基础。LUCENE简介什么是LUNCENELucene是一套javaAPI,就如同Servlet是一套API一样。Lucene不是一个独立的搜索引擎系统,但是你可以使用Luncene来开发搜索引擎系统。这正如Servlet不是网站系统但是你可以用Servlet开发网站一样。有人已经用Lucene开发出了独立的搜索引擎系统,你可以下载,然后不写一行代码就是用它。Nutch是最出名的了。Lucene是一个全文搜索框架,而不是应用产品。

i_google 2013-01-05   442   0
P12

  Lucene的Highlighter实现文章摘要的自动提取 文档

使用Lucene自带的Highlighter就可以实现对原始文件摘要的提取工作。Highlighter类有一个getBestFragment方法,这个方法有多个重载的方法。使用Lucene自带的Highlighter就可以实现对原始文件摘要的提取工作。Highlighter类有一个getBestFragment方法,这个方法有多个重载的方法

zfr046 2012-11-02   10596   0
P18

  Lucene 3.1 使用教程 文档

全文检索就如同ORM,是一个概念。ORM的框架有很多种:Hibernate、TopLink、iBatis等,我们之前学习的是Hibernate。同样的,全文检索领域中也有多种框架,Lucene就是其中的一个用开源的全文检索框架。对索引库的操作可以分为两种:管理与查询。管理索引库使用IndexWriter,从索引库中查询使用IndexSearcher。Lucene的数据结构为Document与Field。Document代表一条数据,Field代表数据中的一个属性。一个Document中有多个Field,Field的值为String型,因为Lucene只处理文本。

a565810900 2012-10-16   3588   0
1 2 3 4

关键词

最新上传

热门文档