首页 > 编程知识 正文

分布式,多个文件名批量搜索

时间:2023-05-06 12:24:08 阅读:118228 作者:890

最近找不到合适的大量文件的公司内部搜索引擎,所以必须自己写,并注册域名放到美国的VPS上。 有关详细信息,请访问http://www.enp知识.com/index _ cn.html。 欢迎大家下载,并提出宝贵意见。这个搜索引擎的主要特点是:

基于分布式高性能文件搜索,支持的文件总大小为数百TB (数万GB )单个文件大小为数百GB )支持的文件数量超过数千万个,支持的文件格式超过数千种,常见的文件格式,例如OCR )光学字符识别支持)多语言支持,例如英语、中文、阿拉伯语、俄语、日语等支持中文的定制分词界面非常友好,基于强大文件夹扩展的安全管理rest风格的API 有关下载安装的详细信息,请访问http://www.enp知识.com/get started.html。 最简单的演示版本请访问http://www.enp知识.com :18888/file search /。 这是从石油勘探开发行业的几个网络获取的资料。 该内部搜索引擎非常适合于存储大量文档和技术资料的中小企业,特别是国外的中小企业。 可以快速找到文件服务器和电脑中存在的文档。 在此基础上,开发了文本挖掘功能,用于将非结构化和半结构化数据转换为结构化数据,进行统计分析和图形显示。 我们在石油勘探开发行业已经积累了丰富的经验,现在计划在石油行业开辟销路,然后移植到其他行业。 最后欢迎有志之士加盟合作。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。