中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

coreseek是什么?coreseek入門教程詳解

2022-10-10    分類: 網(wǎng)站建設(shè)

coreseek是什么?Coreseek 是一款中文全文檢索/搜索軟件,以GPLv2許可協(xié)議開源發(fā)布,基于Sphinx研發(fā)并獨立發(fā)布,專攻中文搜索和信息處理領(lǐng)域,適用于行業(yè)/垂直搜索、論壇/站內(nèi)搜索、數(shù)據(jù)庫搜索、文檔/文獻檢索、信息檢索、數(shù)據(jù)挖掘等應(yīng)用場景,用戶可以免費下載使用。

coreseek安裝需要預(yù)裝的軟件:

yum install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-deve

cd /usr/local/src    wget http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz    tar -xzvf coreseek-3.2.14.tar.gz    cd coreseek-3.2.14      ##安裝mmseg    cd mmseg-3.2.14    ./bootstrap #輸出的warning信息可以忽略,如果出現(xiàn)error則需要解決    ./configure --prefix=/usr/local/mmseg3    make && make install    cd ..    ## 安裝完成后,mmseg使用的詞典和配置文件將自動安裝到/usr/local/mmseg3/etc中      ##安裝coreseek    cd csft-3.2.14    sh buildconf.sh #輸出的warning信息可以忽略,如果出現(xiàn)error則需要解決    ./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql ##如果提示mysql問題,可以查看MySQL數(shù)據(jù)源安裝說明    make && make install    cd ..      cd /usr/local/coreseek/etc    cp sphinx-min.conf.dist sphinx.conf    vi sphinx.conf    內(nèi)容示例如下(localhost,DB_USER,DB_PASSWORD,DB_NAME自行修改)    #    # Minimal Sphinx configuration sample (clean, simple, functional)    #      source content    {    type = mysql      sql_host = localhost    sql_user = DB_USER    sql_pass = DB_PASSWORD    sql_db = DB_NAME    sql_port = 3306 # optional, default is 3306    sql_query_pre = SET NAMES utf8      sql_query = \    SELECT id, title, pub_time, group_id, content FROM contents where status = '1'      sql_attr_uint = group_id    sql_attr_timestamp = pub_time      sql_query_info = SELECT * FROM contents WHERE id=$id    }    index content    {    source = content    path = /usr/local/coreseek/var/data/content    docinfo = extern    charset_dictpath = /usr/local/mmseg3/etc/    charset_type = zh_cn.utf-8    ngram_len = 0    }    indexer    {    mem_limit = 32M    }        searchd    {    port = 9312    log = /usr/local/coreseek/var/log/searchd.log    query_log = /usr/local/coreseek/var/log/query.log    read_timeout = 5    max_children = 30    pid_file = /usr/local/coreseek/var/log/searchd.pid    max_matches = 1000    seamless_rotate = 1    preopen_indexes = 1    unlink_old = 1    } 

然后根據(jù)以上配置建立索引文件

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate
 

啟動命令 /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf

然后在coreseek目錄下,新建3個sh腳本,以便操作 停止服務(wù)stop.sh

#!/bin/bash  /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf --stop 

建立索引build.sh

#!/bin/bash  /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate 

啟動服務(wù)start.sh

#!/bin/bash  /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf 

添加可執(zhí)行權(quán)限

chmod +x start.sh  chmod +x stop.sh  chmod +x build.sh 

運行start.sh后,使用crontab定時執(zhí)行build.sh,就可更新索引。(注:因為數(shù)據(jù)量小且更新不算很頻繁,未使用增量索引,只是定時重建主索引,新版本CoreSeek全文搜索 4.1 支持實時索引)

crontab -e  0 2 * * * sh /usr/local/coreseek/build.sh >/dev/null 2>&1 

每天凌晨2點重建一次索引,忽略日志輸出。

在/usr/local/src/coreseek.3.2.14/csft-3.2.14/api目錄下提供了PHP的接口文件 sphinxapi.php,這個文件包含一個SphinxClient的類,copy到自己的web目錄下 通過如下方式進行搜索

$s_key = trim($s_key);  if(strpos($s_key,'\'') || strpos($s_key,'\"') || strpos($s_key,'\;')) {  exit('非法字符');  }  require("sphinxapi.php");  $page_nums = 20;  $offset_start = ($page_index-1)*$page_nums;  $offset_end = $offset_start + $page_nums;  $cl = new SphinxClient();  $cl->SetServer('localhost', 9312);  $cl->SetArrayResult(true);  $cl->SetMatchMode(SPH_MATCH_ALL);  $cl->SetLimits($offset_start,$offset_end);  $cl->SetSortMode(SPH_SORT_RELEVANCE);  $res = $cl->Query($s_key,"content"); 

安裝包括兩個部分,mmseg和csft

安裝成功會在/usr/local文件夾下面出現(xiàn)coreseek文件夾

source bt {  sql_pass                = ****  #如果密碼里面有#號需要使用轉(zhuǎn)意字符,否則連接不了數(shù)據(jù)庫    sql_query_pre  = SET NAMES utf8 #要根據(jù)你自己數(shù)據(jù)庫的編碼改變,比如如果編碼是utf8mb4而編碼寫的是utf8 會出現(xiàn)沒有搜索結(jié)果的問題   }   index bt {     source                    = bt  #這個地方的值要和前面配置的source名對應(yīng) }

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf --stop  停止服務(wù) /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate  建立索引

/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf   開啟服務(wù)

默認配置文件是csft.conf 如果配置文件是其他名字的話,需要-c 來制定配置文件路徑 ---------------

配置文件中

sql_query                =   xxxx

xxxx代表一個sql語句,sql語句select的第一個字段將被sphinx認作表的主鍵來進行索引,所以數(shù)據(jù)表的主鍵字段不是int類型也沒有關(guān)系,選一個是int類型的字段排在select語句的第一個就行了,但是這個字段要保證唯一性,否則會導(dǎo)致搜索結(jié)果不完整,計算出來的值也可以被當(dāng)做主鍵來進行索引 比如SELECT unix_timestamp(time),name, age .......unix_timestamp(time)是計算出來的,它排在第一個的時候,就會被sphinx當(dāng)做表的主鍵來進行索引。 --------------------- 

新聞名稱:coreseek是什么?coreseek入門教程詳解
本文地址:http://www.rwnh.cn/news18/204268.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App設(shè)計、網(wǎng)站導(dǎo)航網(wǎng)站制作網(wǎng)站改版、App開發(fā)、做網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)
隆安县| 沙坪坝区| 郓城县| 普安县| 蓬莱市| 筠连县| 昆明市| 平邑县| 怀远县| 逊克县| 阳曲县| 宝清县| 景东| 大足县| 龙川县| 武陟县| 读书| 关岭| 五原县| 台州市| 沅陵县| 山丹县| 内乡县| 阿拉善左旗| 保山市| 永吉县| 洪雅县| 进贤县| 江阴市| 自贡市| 金川县| 巴里| 寿光市| 平潭县| 桦甸市| 木里| 滦平县| 西和县| 三穗县| 泰安市| 天长市|