位置:首頁 > 數據庫 > MongoDB基礎教程 > MongoDB文本搜索

MongoDB文本搜索

從2.4版本開始,MongoDB開始支持在內容裡使用文本索引搜索字符串。文本搜索使用詞乾技術通過降低所產生停止詞語,來查找在字符串字段中指定詞語如, a, an, the等等,到目前為止,MongoDB支持15種語言。

啟用文本搜索:

最初文本搜索是一個實驗性功能,但2.6版本開始,配置是默認啟用的。但是,如果使用的是以前 MongoDB 的版本,那麼必須啟用文本搜索,使用下麵的代碼:

>db.adminCommand({setParameter:true,textSearchEnabled:true})

創建文本索引:

考慮下文字後其標簽的帖子集合,包含以下文件:

{
   "post_text": "enjoy the mongodb articles on yiibai",
   "tags": [
      "mongodb",
      "yiibai"
   ]
}

我們將創建post_text字段的文本索引,以便我們能夠在我們的帖子中搜索文本:

>db.posts.ensureIndex({post_text:"text"})

使用文本索引:

現在,我們已經創建文本post_text字段的索引,我們將搜索所有含有 gitbook.net 一詞的帖子。

>db.posts.find({$text:{$search:"gitbook.net"}})

上麵的命令返回在文本中含有yiibai單詞的帖子,如以下結果文檔:

{ 
   "_id" : ObjectId("53493d14d852429c10000002"), 
   "post_text" : "enjoy the mongodb articles on gitbook.net", 
   "tags" : [ "mongodb", "gitbook.net" ]
}
{
   "_id" : ObjectId("53493d1fd852429c10000003"), 
   "post_text" : "writing tutorials on mongodb",
   "tags" : [ "mongodb", "tutorial" ] 
}

如果使用的是舊版本的MongoDB,必須使用下麵命令:

>db.posts.runCommand("text",{search:" gitbook.net "})

使用文本搜索比普通搜索的搜索效率有極大的提高。

刪除文本索引:

要刪除現有的文本索引,使用下麵的查詢首先找到索引的名稱:

>db.posts.getIndexes()

從上麵查詢得到索引的名稱後,運行以下命令。這裡,post_text_text是索引的名稱。

>db.posts.dropIndex("post_text_text")