日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

MySQL 全文檢索的使用示例

瀏覽:234日期:2023-10-02 07:51:14
目錄1. 環境準備2. 數據準備3. 開始表演4. 分詞引擎總結參考資料1. 環境準備

MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分詞器把中文段落預處理拆分成單詞,然后存入數據庫。 MySQL 5.7.6開始,MySQL內置了ngram全文解析器,用來支持中文、日文、韓文分詞。 本文使用的MySQL 版本是5.7.22,InnoDB數據庫引擎。

所以這里需要MySQL的版本大于5.7.6

-- 查看mysql的版本mysql> select version();+-----------+| version() |+-----------+| 5.7.33 |+-----------+1 row in set (0.02 sec)

在 mysql 配置文件中添加分詞以及最小詞語長度 (如果已經配置可以忽略)

ft_min_word_len 最小字符長度默認為 4,在英文條件下確實比較合理中文情況下需要修改;

ngram_token_size 分詞的最小長度 舉個例子 不同長度對 你好世界 的分詞

n=1: ’你’, ’好’, ’世’, ’界’ n=2: ’你好’, ’好世’, ’世界’ n=3: ’你好世’, ’好世界’ n=4: ’你好世界’

# /etc/mysql/mysql.conf.d/mysqld.cnfft_min_word_len = 2ngram_token_size = 2# 如果沒有則新增配置echo ’ft_min_word_len = 2ngram_token_size = 2’ >> mysqld.cnf# 重啟服務/etc/init.d/mysql restart

-- 查看配置mysql> SHOW VARIABLES LIKE ’ft_min_word_len’;SHOW VARIABLES LIKE ’ngram_token_size’;+-----------------+-------+| Variable_name | Value |+-----------------+-------+| ft_min_word_len | 2 |+-----------------+-------+1 row in set (0.02 sec) +------------------+-------+| Variable_name | Value |+------------------+-------+| ngram_token_size | 2 |+------------------+-------+1 row in set (0.03 sec)2. 數據準備

-- mysql 于全文檢索的demomysql> CREATE TABLE `articles` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `title` varchar(50) DEFAULT NULL COMMENT ’主題’, `content` longtext NOT NULL COMMENT ’內容’, PRIMARY KEY (`id`), FULLTEXT KEY `title_content_index` (`content`,`title`) /*!50100 WITH PARSER `ngram` */ ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8;Query OK, 0 rows affected (0.20 sec) mysql> INSERT INTO articles (`title`, `content`) VALUES(’如果’,’今生今世 永不再將你想起 除了除了在有些個因落淚而濕潤的夜里 如果如果你愿意’),(’愛情’,’有一天路標遷了希望你能從容有一天橋墩斷了希望你能渡越有一天棟梁倒了希望你能堅強有一天期待蔫了希望你能理解’),(’遠和近’,’你 一會看我一會看云我覺得你看我時很遠你看云時很近’),(’斷章’,’你站在橋上看風景,看風景人在樓上看你。明月裝飾了你的窗子,你裝飾了別人的夢。’),(’獨語’,’我向你傾吐思念你如石像沉默不應如果沉默是你的悲抑你知道這悲抑最傷我心’);Query OK, 5 rows affected (0.08 sec)Records: 5 Duplicates: 0 Warnings: 0 mysql> SELECT * from articles where match(content, title) against(’風景’ in NATURAL LANGUAGE MODE) LIMIT 10;+----+--------+--------------------------------------------------------------------------------------------------------------------------+| id | title | content |+----+--------+--------------------------------------------------------------------------------------------------------------------------+| 10 | 斷章 | 你站在橋上看風景,看風景人在樓上看你。明月裝飾了你的窗子,你裝飾了別人的夢。 |+----+--------+--------------------------------------------------------------------------------------------------------------------------+1 row in set (0.02 sec)3. 開始表演 自然語言模式(NATURAL LANGUAGE MODE)

自然語言模式是MySQL 默認的全文檢索模式。自然語言模式不能使用操作符,不能指定關鍵詞必須出現或者必須不能出現等復雜查詢。

布隆模式(BOOLEAN MODE)

BOOLEAN模式可以使用操作符,可以支持指定關鍵詞必須出現或者必須不能出現或者關鍵詞的權重高還是低等復雜查詢。

查詢擴展(QUERY EXPANSION)

查詢的結果不僅匹配出結果同時可以聯想出其他你需要的結果。(類似關聯查詢,但是官網推薦僅支持短語查詢 否則會出現很多臟數據)

-- 自然語言模式(NATURAL LANGUAGE MODE)查詢并得到評分mysql> SELECT id, title, MATCH ( content, title ) against ( ’風景’ IN NATURAL LANGUAGE MODE ) AS score FROM articles;+----+-----------+--------------------+| id | title | score |+----+-----------+--------------------+| 7 | 如果 | 0 || 8 | 愛情 | 0 || 9 | 遠和近 | 0 || 10 | 斷章 | 0.9771181344985962 || 11 | 獨語 | 0 |+----+-----------+--------------------+5 rows in set (0.02 sec)-- 布隆模式(BOOLEAN MODE) 可以組合查詢mysql> SELECT id, title FROM articles where MATCH ( content, title ) against ( ’+風景 -愛情’ IN BOOLEAN MODE );+----+--------+| id | title |+----+--------+| 10 | 斷章 |+----+--------+1 row in set (0.01 sec)-- 查詢擴展(QUERY EXPANSION) 可以聯想出其他結果 mysql> SELECT id, title FROM articles where MATCH ( content, title ) against ( ’風景’ WITH QUERY EXPANSION );+----+--------+| id | title |+----+--------+| 10 | 斷章 || 11 | 獨語 |+----+--------+2 rows in set (0.02 sec) 4. 分詞引擎

目前官網 MeCab Full-Text Parser 有支持日語的分詞插件(可以更好的理解語義)

內置的 full-text parser 因為英文中單詞的邊界默認是空格,所以在處理英文文本時可以簡單的使用空格作為分隔符。但是在處理中文時需要理解語義的基礎上進行有效的分詞,所以在處理中文、日文、韓文MySQL 提供了 ngram full-text (本文的配置就是 基于ngram的中文分詞)

總結

優點

對比 like 查詢效率有提升(具體提升的測試沒有做) 全文搜索可以同時對多個字段做索引,like只能對單一字段搜索

對于中文的分詞可能需要在理解語義的基礎上才能有效的分詞;比如上文中的 你好世界(hello world)對于英文按空格切分就可以,中文則需要理解語義的基礎才能分成 你好/世界。

這里分享一下python中jieba分詞,有助于理解中文分詞的魅力

結巴分詞利用一個中文詞庫,通過詞庫計算漢字之間構成詞語的關聯概率,所以通過計算漢字之間的概率,就可以形成分詞的結果。

In [1]: import jiebaIn [2]: jieba.lcut('你好世界')Building prefix dict from the default dictionary ...Dumping model to file cache /var/folders/st/b16fyn3s57x_5vszjl599njw0000gn/T/jieba.cacheLoading model cost 0.937 seconds.Prefix dict has been built successfully.Out[2]: [’你好’, ’世界’]In [3]: jieba.lcut('hello world')Out[3]: [’hello’, ’ ’, ’world’]

對于一般的項目mysql的全文索引可以解決80%的需求,它可以較為完美的支持中文的檢索、自動分詞、結果排序、組合查詢等功能;但性能應該是瓶頸,Elastissearch可以友好的實現全文檢索。

全文索引不能達到like的效果,連著的語句會因為分詞形成多個詞語。

參考資料

Mysql fulltext

以上就是MySQL 全文檢索的使用示例的詳細內容,更多關于MySQL 全文檢索的使用的資料請關注好吧啦網其它相關文章!

標簽: MySQL 數據庫
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
乱一区二区av| 亚洲欧美日韩国产| 91精品日本| 日本一区福利在线| 婷婷综合成人| 欧美日韩 国产精品| 丝袜亚洲另类欧美| 视频一区中文字幕| 日韩欧美激情| 国产精品一区二区三区美女| 欧美激情福利| 日韩av二区| 欧美日韩精品免费观看视欧美高清免费大片| 日韩中文欧美| 在线国产一区| 亚洲精品国产精品粉嫩| 日韩高清欧美激情| 国产精品sm| 日韩伦理福利| 在线综合亚洲| 欧美一区成人| 久久亚洲精品中文字幕| 国产精品专区免费| 亚洲激情二区| 日韩国产在线观看| 久久精品国产福利| 日本韩国欧美超级黄在线观看| av一区二区高清| 亚洲精品福利| 国产在视频一区二区三区吞精| av亚洲在线观看| 91av一区| 日韩久久精品| 在线日韩成人| 精品一区二区三区亚洲| 久久精品av| 蜜桃视频在线观看一区二区| 国产精品一级| 美女久久久久| 国产欧美高清| 国产一区久久| 国产日韩视频| 神马午夜久久| 日本久久二区| yellow在线观看网址| 夜夜嗨av一区二区三区网站四季av| 久久精品99久久久| 久久精品免费一区二区三区| 亚洲v天堂v手机在线| 成人国产精选| 在线精品一区| 狠狠久久伊人| 噜噜噜躁狠狠躁狠狠精品视频| 久久超级碰碰| 国产模特精品视频久久久久| 国产精品久久| 国产亚洲在线| 国产91在线精品| 婷婷综合福利| 国产一区清纯| 精品深夜福利视频| 热久久久久久久| 成人在线视频免费| 亚洲综合专区| 神马日本精品| 国产精品丝袜在线播放| 欧美/亚洲一区| 国产精品久久久久久模特| 亚洲二区三区不卡| 久久不见久久见中文字幕免费| 午夜在线一区| 桃色一区二区| 国产激情欧美| 婷婷成人av| 欧美日韩日本国产亚洲在线| 久久免费精品| 91福利精品在线观看| 欧美日韩国产免费观看| 精品中文在线| 91精品视频一区二区| 久久99伊人| 色爱av综合网| 国产精品亚洲产品| 最新亚洲国产| 九九在线精品| 日韩精品专区| 精品一区二区三区视频在线播放 | 亚洲午夜av| 成人精品国产亚洲| 国产精选一区| 色综合视频一区二区三区日韩| 亚洲特色特黄| av综合电影网站| 老牛国内精品亚洲成av人片 | 欧美日一区二区三区在线观看国产免| 亚洲在线网站| 蜜臀av免费一区二区三区| 成人国产精品一区二区网站| 国产精品3区| 国产亚洲久久| 日本视频中文字幕一区二区三区| 国产精品婷婷| 亚洲激情av| 亚洲激情久久| 欧美日韩国产一区二区三区不卡| 首页国产精品| 激情久久99| 精品资源在线| 精品午夜视频| 九九久久国产| 韩国女主播一区二区三区| 久久a爱视频| 精品亚洲成人| caoporn视频在线| 久久久久久婷| 日韩一区三区| 91精品蜜臀一区二区三区在线 | 欧美一区=区| 欧美日韩激情| 亚洲少妇一区| 亚洲有吗中文字幕| 日韩精品成人| 国产精品久久久久久久久久白浆| 欧美黄色一区| 日韩av有码| 久久久久国产一区二区| 99久精品视频在线观看视频| 在线日韩欧美| 免费欧美日韩| 97成人在线| 麻豆国产精品视频| 青青青免费在线视频| 久久久久中文| 国产专区一区| 99精品99| 日本亚洲不卡| 国产精品.xx视频.xxtv| 欧美国产小视频| 性感美女一区二区在线观看| 亚洲不卡av不卡一区二区| 在线精品视频在线观看高清| 久久福利精品| 国产日韩一区| 日韩大片在线观看| 黄色日韩在线| 日韩免费精品| 精品一区视频| 不卡在线一区二区| 综合激情五月婷婷| 国产欧美日韩免费观看| 久久精品九色| 久久精品卡一| 日韩有吗在线观看| 国产一区二区三区四区五区传媒| 久久裸体视频| 亚洲欧美久久精品| 久久只有精品| 亚洲网站视频| 欧美一区二区三区免费看| 国内精品伊人| 日韩视频久久| 国产情侣一区在线| 亚洲人成在线网站| 99在线精品免费视频九九视| 欧美日韩a区| 999国产精品永久免费视频app| 蜜桃av一区二区| 精品一区视频| 久久av在线| 欧美激情三区| 午夜欧美理论片| 国产免费播放一区二区| 久久视频一区| 欧美日韩视频免费看| 欧美13videosex性极品| 亚洲一二三区视频| 精品国产精品国产偷麻豆| 尹人成人综合网| 久久不卡国产精品一区二区| 日韩欧美一区二区三区免费观看| 亚洲精品国产精品粉嫩| 午夜久久中文| 欧美私人啪啪vps| 亚洲午夜黄色| 欧美国产免费| 男人操女人的视频在线观看欧美| 精品一区二区三区免费看| 夜夜嗨网站十八久久 | 国产综合亚洲精品一区二| 欧美一区成人| 红桃视频国产精品| 久久99性xxx老妇胖精品| 亚洲精品一区二区在线看| 欧美精品不卡| 蜜桃久久精品一区二区| 日韩理论视频| 国产精品啊v在线| 亚洲一区二区三区在线免费| 久久黄色影院| 精品视频网站|