在项目中集成GoogleDesktop全文检索.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在项目中集成GoogleDesktop全文检索

在项目中集成?Google?Desktop,提供全文检索能力 文章来源:转载 点击数:394 更新时间:2006-3-23 19:07:45 在项目中,需要对客户资料和文件进行全文检索。考虑到 Google Desktop 强大的检索能力,决定把它集成到项目中,从而简化项目方案,加快进度。 1、用户从 Client 端浏览器中发出查询请求,例如: ? “http://server:8080/search.jsp?keyword=网络管理” ? 2、search.jsp 构建出特殊的 URL,访问 Google Desktop: ? “:4664/searchs=C4gKVsZ-bAyBaEwxsW2FKoAAqr0q=%E7%BD%91%E7%BB%9C%E7%AE%A1%E7%90%86” 其中: (1) 是本机的 IP 地址,4664 是 Google Desktop 的监听端口号; (2)“searchs=C4gKVsZ-bAyBaEwxsW2FKoAAqr0”是 Google Desktop 的特殊参数,注:“s=”后边的内容,不同的机器内容不一样,暂且称之为 serial,下文中有说明; (3)“q=%E7%BD%91%E7%BB%9C%E7%AE%A1%E7%90%86”是被有哪些信誉好的足球投注网站的关键词,“网络管理”的 UTF-8 编码,再经过 .URLEncoder.encode() 之后的结果; 3、Google Desktop 从本地硬盘上(假定是 E:\Docs)的资料中检索出符合条件的数据;(实际上这是事先就建好索引,并不是被调用时再去读取的) 4、Google Desktop 把结果返回给 search.jsp。这是一个 UTF-8 编码的大字符串; 5、search.jsp 把检索结果进行一系列处理后(例如去掉 Google 的 LOGO、权限过滤、格式调整、文件名变换、超级链接重定位等),返回给客户端浏览器。有一件事是要做的:把检索结果中形如“E:\Docs\abc.doc”的文件路径换成“/getfile.jsp?filename=abc.doc”,否则客户端打不开该链接; 6、客户单击了那些他感兴趣的文档资料的链接,该链接形如: ? “http://server:8080/getfile.jsp?filename=abc.doc” 7、getfile.jsp 从本地硬盘(E:\Docs)中读出 abc.doc。(在读出之前,可以加入权限判断功能,检查当前用户是否具备访问 abc.doc 的权限) 8、getfile.jsp 以二进制的方式把文件内容(abc.doc)返回给 Client 端浏览器,浏览器将根据文件的类型自动调用相关联的 Windows 程序(MS Word)打开文件。 本方案的关键之处是在第 2 步中构建合理的 URL。而该 URL 中,比较困难的是 “searchs=C4gKVsZ-bAyBaEwxsW2FKoAAqr0”。该内容在不同的机器上,可能不一样,但在同一台机器上,却是固定的,所以只需要手工寻找一次即可。 寻找该 serial 的方法是: 1、在安装了 Google Desktop 的服务器上,双击屏幕右下角的 Google Desktop 图标,系统将自动打开 IE,并出现桌面有哪些信誉好的足球投注网站的主页面;同时在 IE 的地址栏中将出现形如“:4664/s=UNBXCjdtJHM6yrJXNAfPo4xw6eQ”的 URL; 2、在主页面上的空白处单击鼠标右键,“查看源文件”,并查找类似于“FORM name=f method=GET action=/searchs=C4gKVsZ-bAyBaEwxsW2FKoAAqr0”的代码,看见了吧?“action=”后边的那一串,就是要寻找的目标; 本演示方案中,共涉及两个 JSP 文件: 1、search.jsp:负责构建正确的 URL,并对返回的结果作出分析、过滤、替换、权限检查等操作; 2、getfile.jsp:负责检查权限,然后从硬盘上读取相关的文件资料,返回给客户端; 由于我还不太会用赛迪的 BLOG,不知道如何实现图文混排(试了一次,好象不成功),所以在此只给出关键代码的示例,search.jsp 可仿照着写: import java.io.InputStream; import java.io.ByteArrayOutputStream; import java.io.FileOutputStream; import .HttpURLConnection; import .URL; public class GoogleDesktopConnect { /* 这就是双击屏幕右下角的 Go

文档评论(0)

sb9185sb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档