轻量多国语言全文搜索服务器:FTServer 1.3

(FTS)是一个轻量精准全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,精准搜索中文长句子,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词。非常容易按需定制,直接编译就可以使用,无需额外配置,同时可以嵌入到各种应用内部。

Java版本测试<<射雕英雄传>>全书在一个数据库事务内建完整索引在30秒内。查出里面3643个不同位置的”黄蓉”稳定在0.1秒内.无需词库,支持搜索”时察”这类没独立意义的词。

1.那时察合台还不知…
2.梅超风和他手掌相交,立时察觉…
3.这时察合台的六犬已快嗅到干草堆前…
测试支持 English, 简体中文, 正體中文, 日本語。 代码能支持 한국어, Русский, Deutsch。支持多语言混合搜索。

安装:
1. Java 版本可以从Release 中下载 fts.zip,解压后是一个War文件,直接在Tomcat或者Jetty上Deploy就可以使用了。
2. C#版本直接下载代码,放入一个支持asp.net的服务器中就可以了,例如Mono中带的xsp4 。
使用:
输入网址就可以录入内容,输入关键字就可以进行搜索

无须分词,支持中文字符任意排列。

使用 CRUD + JSP 构建,非常容易整合到各类应用程序中,通过后台线程大量建索引,优化查询时的速度与内存使用。

支持: 中文 日文 英文 俄文 德文 等混合搜索。

更新内容:

  1. 支持页面的 keywords
  2. 对页面分段索引,更适合小内存(JVM 2GB)机器
  3. 支持真人工,智能归纳页面内容进行索引. 录入格式是“Title \n Text”
  4. 支持数千个搜索优先级

Java 版本使用 Netbeans 编译,或者直接把WAR目录的zip解压,放入JSP服务器
.NET 版本,使用 dotnet core app 3.1 编译运行

源码下载:
FTServer Java 1.3版
FTServer .NET 1.2.5版
与 Lucene 的《红楼梦》测试对比

人已赞赏
手机/移动开发新闻资讯

百度智能小程序基础库3.190版新增书架功能

2020-6-2 11:46:48

开发工具新闻资讯

OpenCV 开源许可协议拟从 BSD 变更为 Apache 2

2020-6-4 9:21:01

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索