在MySQL中提高全文搜索效率
MySQL針對這一問題提供了一種基于內(nèi)建的全文查找方式的解決方案。在此,開發(fā)者只需要簡單地標記出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段運行搜索,這不僅僅提高了性能和效率(因為MySQL對這些字段做了索引來優(yōu)化搜索),而且實現(xiàn)了更高質(zhì)量的搜索,因為MySQL使用自然語言來智能地對結果評級,以去掉不相關的項目。
1、設置基本表格
從創(chuàng)建例子表格開始,使用以下的SQL命令:
以下為引用的內(nèi)容: mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT); |
以上命令創(chuàng)建了一個簡單的音樂專集資料庫(主要是整段的文字),然后向這個表格中添加一些記錄:
以下為引用的內(nèi)容: mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (1, 'Gingerboy has a new single out called Throwing Rocks. It's great!'); mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (2, 'Hello all, I really like the new Madonna single. One of the hottest tracks currently playing...I've been listening to it all day'); mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (3, 'Have you heard the new band Hotter Than Hell? They have five members and they burn their instruments when they play in concerts. These guys totally rock! Like, awesome, dude!'); |
驗證數(shù)據(jù)的正確錄入:
以下為引用的內(nèi)容: mysql> SELECT * FROM reviews; +----+--------------------------------------------+ | id | data | +----+--------------------------------------------+ | 1 | Gingerboy has a new single out called ... | | 2 | Hello all, I really like the new Madon ... | | 3 | Have you heard the new band Hotter Than... | +----+--------------------------------------------+ 3 rows in set (0.00 sec) |
2、定義全文搜索字段
接下來,定義您要作為全文搜索索引的字段:
以下為引用的內(nèi)容: mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data); Query OK, 3 rows affected (0.21 sec) Records: 3 Duplicates: 0 Warnings: 0 |
使用SHOW INDEXES命令來檢查索引已經(jīng)被添加了:
以下為引用的內(nèi)容: mysql> SHOW INDEXES FROM reviews; +---------+---------------+--------+------+------------+---------+ | Table | Column_name | Packed | Null | Index_type | Comment | ----------+---------------+--------+------+------------+---------+ | reviews | id | NULL | | BTREE | | | reviews | data | NULL | YES | FULLTEXT | | +---------+---------------+--------+------+------------+---------+ 2 rows in set (0.01 sec) |
3、運行全文搜索
當您擁有了數(shù)據(jù)和索引,就可以使用MySQL的全文搜索了,最簡單的全文搜索方式是帶有MATCH...AGAINST語句的SELECT查詢,以下是一個簡單的例子,可以來查找含有單詞“single”的記錄:
以下為引用的內(nèi)容: mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+ | id | +----+ | 1 | | 2 | +----+ 2 rows in set (0.00 sec) |
在此,MATCH()將作為參數(shù)傳遞給它的字段中的文字與傳遞給AGAINST()的參數(shù)進行比較,如果有匹配的,那就按照正常的方式返回。注意您可以傳遞不止一個字段用MATCH()來查看-只需用逗號來分割字段列表。
當MySQL收到了一個全文搜索的請求,它就在內(nèi)部對每個記錄進行評分,不匹配的記錄得分為零,而“更相關”的記錄會得到比“不太相關”的記錄相對更高的分數(shù)。相關性是由MySQL的一系列區(qū)分標準來決定的,查看MySQL的用戶手冊可以得到更多的信息。
想看到每個記錄的評分如何,只需要返回MATCH()方法作為結果集的一部分,如下所示:
以下為引用的內(nèi)容: mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews; +----+-------------------------------+ | id | MATCH (data) AGAINST ('rock') | +----+-------------------------------+ | 1 | 0 | | 2 | 0 | | 3 | 1.3862514533815 | +----+-------------------------------+ 3 rows in set (0.00 sec) |
4、使用邏輯搜索修飾符(Boolean search modifiers)
您還可以使用邏輯搜索修飾符來進行更精確的搜索,這通過在AGAINST語句中添加特殊的IN BOOLEAN MODE修飾符來實現(xiàn),在以下的例子中,將查找含有單詞“single”但是沒有“Madonna”的記錄:
以下為引用的內(nèi)容: mysql> SELECT id FROM reviews WHERE MATCH (data) +----+ | id | +----+ | 1 | +----+ 1 row in set (0.00 sec) |
這一搜索特性通常用于搜索單詞片斷(而不是完整的詞語),這可以通過在IN BOOLEAN MODE語句中的*(星號)操作符來實現(xiàn),以下的例子展示了如何查找單詞中含有“hot”的記錄:
以下為引用的內(nèi)容: mysql> SELECT id FROM reviews WHERE MATCH (data) | id | +----+ | 3 | | 2 | +----+ 2 rows in set (0.00 sec) |
您還可以使用這種方法來查找至少一個傳遞到AGAINST的參數(shù)中,以下的例子查找了至少包含單詞“hell”和“rocks”中的一個的記錄:
以下為引用的內(nèi)容: mysql> SELECT id FROM reviews WHERE MATCH (data) +----+ | id | +----+ | 1 | | 3 | +----+ 2 rows in set (0.00 sec) |
以上的這些例子演示了相對于傳統(tǒng)的SELECT...LIKE語句,進行全文搜索的更有效的方法,當您下一次需要編寫MySQL數(shù)據(jù)庫搜索界面的時候,您可以嘗試這一方法。
關鍵字:MySQL、數(shù)據(jù)庫、全文搜索
新文章:
- CentOS7下圖形配置網(wǎng)絡的方法
- CentOS 7如何添加刪除用戶
- 如何解決centos7雙系統(tǒng)后丟失windows啟動項
- CentOS單網(wǎng)卡如何批量添加不同IP段
- CentOS下iconv命令的介紹
- Centos7 SSH密鑰登陸及密碼密鑰雙重驗證詳解
- CentOS 7.1添加刪除用戶的方法
- CentOS查找/掃描局域網(wǎng)打印機IP講解
- CentOS7使用hostapd實現(xiàn)無AP模式的詳解
- su命令不能切換root的解決方法
- 解決VMware下CentOS7網(wǎng)絡重啟出錯
- 解決Centos7雙系統(tǒng)后丟失windows啟動項
- CentOS下如何避免文件覆蓋
- CentOS7和CentOS6系統(tǒng)有什么不同呢
- Centos 6.6默認iptable規(guī)則詳解