postgresql全文搜索引擎

带权重的搜索引擎 双十一背后的技术 参考此文 对其进行改进和自定义 毫秒级的为该文章 具体实施流程 分词(英文基本无需分词) zhparser 安装 SCWS. wget -q -O - http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 | tar xf - cd scws-1.2.3 ; ./configure ; make install 注意:在FreeBSD release 10及以上版本上运行configure时,需要增加--with-pic选项。 如果是从github上下载的scws源码需要先运行以下命令生成configure文件: touch README;aclocal;autoconf;autoheader;libtoolize;automake --add-missing git clone https://github.com/amutu/zhparser.git cd zhparser make && make install CREATE EXTENSION zhparser; CREATE TEXT SEARCH CONFIGURATION zhcfg (PARSER = zhparser); ALTER TEXT SEARCH CONFIGURATION zhcfg ADD MAPPING FOR n,v,a,i,e,l,j,m WITH simple; 增加类型 select ts_debug('zhcfg','三一') ; ts_debug 可以查看到分词的token类型 如果不在之前的mapping内的话是不会被分词的 解决方案是 ALTER TEXT SEARCH CONFIGURATION zhcfg ADD MAPPING FOR [没有的类型] WITH simple; 设置分词参数 ...

October 18, 2019 · 4 min · 837 words · 水华