FTServer(FTS)是一个轻量精准全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,精准搜索中文长句子,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词。非常容易按需定制,直接编译就可以使用,无需额外配置,同时可以嵌入到各种应用内部。
Java版本测试<<射雕英雄传>>全书在一个数据库事务内建完整索引在30秒内。查出里面3643个不同位置的”黄蓉”稳定在0.1秒内.无需词库,支持搜索”时察”这类没独立意义的词。
1.那时察合台还不知…
2.梅超风和他手掌相交,立时察觉…
3.这时察合台的六犬已快嗅到干草堆前…
测试支持 English, 简体中文, 正體中文, 日本語。 代码能支持 한국어, Русский, Deutsch。支持多语言混合搜索。
安装:
1. Java 版本可以从Release 中下载 fts.zip,解压后是一个War文件,直接在Tomcat或者Jetty上Deploy就可以使用了。
2. C#版本直接下载代码,放入一个支持asp.net的服务器中就可以了,例如Mono中带的xsp4 。
使用:
输入网址就可以录入内容,输入关键字就可以进行搜索
FTServer 无须分词,支持中文字符任意排列。
使用 CRUD + JSP 构建,非常容易整合到各类应用程序中,通过后台线程大量建索引,优化查询时的速度与内存使用。
支持: 中文 日文 英文 俄文 德文 等混合搜索。
更新内容:
- 支持页面的 keywords
- 对页面分段索引,更适合小内存(JVM 2GB)机器
- 支持真人工,智能归纳页面内容进行索引. 录入格式是“Title \n Text”
- 支持数千个搜索优先级
Java 版本使用 Netbeans 编译,或者直接把WAR目录的zip解压,放入JSP服务器
.NET 版本,使用 dotnet core app 3.1 编译运行
源码下载:
FTServer Java 1.3版
FTServer .NET 1.2.5版
与 Lucene 的《红楼梦》测试对比