Latest web development tutorials

MongoDB 概念解析

不管我們學習什麼數據庫都應該學習其中的基礎概念,在mongodb中基本的概念是文檔、集合、數據庫,下面我們挨個介紹。

下表將幫助您更容易理解Mongo中的一些概念:

SQL術語/概念 MongoDB術語/概念 解釋/說明
database database 數據庫
table collection 數據庫表/集合
row document 數據記錄行/文檔
column field 數據字段/域
index index 索引
table joins 表連接,MongoDB不支持
primary key primary key 主鍵,MongoDB自動將_id字段設置為主鍵

通過下圖實例,我們也可以更直觀的的了解Mongo中的一些概念:


數據庫

一個mongodb中可以建立多個數據庫。

MongoDB的默認數據庫為"db",該數據庫存儲在data目錄中。

MongoDB的單個實例可以容納多個獨立的數據庫,每一個都有自己的集合和權限,不同的數據庫也放置在不同的文件中。

"show dbs"命令可以顯示所有數據的列表。

$ ./mongo
MongoDB shell version: 3.0.6
connecting to: test
> show dbs
local  0.078GB
test   0.078GB
> 

執行"db"命令可以顯示當前數據庫對像或集合。

$ ./mongo
MongoDB shell version: 3.0.6
connecting to: test
> db
test
> 

運行"use"命令,可以連接到一個指定的數據庫。

> use local
switched to db local
> db
local
> 

以上實例命令中,"local" 是你要鏈接的數據庫。

在下一個章節我們將詳細講解MongoDB中命令的使用。

數據庫也通過名字來標識。 數據庫名可以是滿足以下條件的任意UTF-8字符串。

  • 不能是空字符串("")。
  • 不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
  • 應全部小寫。
  • 最多64字節。

有一些數據庫名是保留的,可以直接訪問這些有特殊作用的數據庫。

  • admin :從權限的角度來看,這是"root"數據庫。 要是將一個用戶添加到這個數據庫,這個用戶自動繼承所有數據庫的權限。 一些特定的服務器端命令也只能從這個數據庫運行,比如列出所有的數據庫或者關閉服務器。
  • local:這個數據永遠不會被複製,可以用來存儲限於本地單台服務器的任意集合
  • config :當Mongo用於分片設置時,config數據庫在內部使用,用於保存分片的相關信息。

文檔

文檔是一個鍵值(key-value)對(即BSON)。 MongoDB 的文檔不需要設置相同的字段,並且相同的字段不需要相同的數據類型,這與關係型數據庫有很大的區別,也是MongoDB 非常突出的特點。

一個簡單的文檔例子如下:

{"site":"www.w3big.com", "name":"本教程"}

下表列出了RDBMS 與MongoDB 對應的術語:

RDBMS MongoDB
數據庫 數據庫
表格 集合
文檔
字段
表聯合 嵌入文檔
主鍵 主鍵(MongoDB 提供了key 為_id )
數據庫服務和客戶端
Mysqld/Oracle mongod
mysql/sqlplus mongo

需要注意的是:

  1. 文檔中的鍵/值對是有序的。
  2. 文檔中的值不僅可以是在雙引號裡面的字符串,還可以是其他幾種數據類型(甚至可以是整個嵌入的文檔)。
  3. MongoDB區分類型和大小寫。
  4. MongoDB的文檔不能有重複的鍵。
  5. 文檔的鍵是字符串。 除了少數例外情況,鍵可以使用任意UTF-8字符。

文檔鍵命名規範:

  • 鍵不能含有\0 (空字符)。 這個字符用來表示鍵的結尾。
  • .和$有特別的意義,只有在特定環境下才能使用。
  • 以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。

集合

集合就是MongoDB 文檔組,類似於RDBMS (關係數據庫管理系統:Relational Database Management System)中的表格。

集合存在於數據庫中,集合沒有固定的結構,這意味著你在對集合可以插入不同格式和類型的數據,但通常情況下我們插入集合的數據都會有一定的關聯性。

比如,我們可以將以下不同數據結構的文檔插入到集合中:

{"site":"www.baidu.com"}
{"site":"www.google.com","name":"Google"}
{"site":"www.w3big.com","name":"本教程","num":5}

當第一個文檔插入時,集合就會被創建。

合法的集合名

  • 集合名不能是空字符串""。
  • 集合名不能含有\0字符(空字符),這個字符表示集合名的結尾。
  • 集合名不能以"system."開頭,這是為系統集合保留的前綴。
  • 用戶創建的集合名字不能含有保留字符。 有些驅動程序的確支持在集合名里麵包含,這是因為某些系統生成的集合中包含該字符。 除非你要訪問這種系統創建的集合,否則千萬不要在名字裡出現$。

如下實例:

db.col.findOne()

capped collections

Capped collections 就是固定大小的collection。

它有很高的性能以及隊列過期的特性(過期按照插入的順序). 有點和"RRD" 概念類似。

Capped collections是高性能自動的維護對象的插入順序。 它非常適合類似記錄日誌的功能和標準的collection不同,你必須要顯式的創建一個capped collection, 指定一個collection的大小,單位是字節。 collection的數據存儲空間值提前分配的。

要注意的是指定的存儲大小包含了數據庫的頭信息。

db.createCollection("mycoll", {capped:true, size:100000})
  • 在capped collection中,你能添加新的對象。
  • 能進行更新,然而,對像不會增加存儲空間。 如果增加,更新就會失敗。
  • 數據庫不允許進行刪除。 使用drop()方法刪除collection所有的行。
  • 注意: 刪除之後,你必須顯式的重新創建這個collection。
  • 在32bit機器中,capped collection最大存儲為1e9( 1X10 9 )個字節。

元數據

數據庫的信息是存儲在集合中。 它們使用了系統的命名空間:

dbname.system.*

在MongoDB數據庫中名字空間<dbname>.system.* 是包含多種系統信息的特殊集合(Collection),如下:

集合命名空間 描述
dbname.system.namespaces 列出所有名字空間。
dbname.system.indexes 列出所有索引。
dbname.system.profile 包含數據庫概要(profile)信息。
dbname.system.users 列出所有可訪問數據庫的用戶。
dbname.local.sources 包含複製對端(slave)的服務器信息和狀態。

對於修改系統集合中的對像有如下限制。

在{{system.indexes}}插入數據,可以創建索引。 但除此之外該表信息是不可變的(特殊的drop index命令將自動更新相關信息)。

{{system.users}}是可修改的。 {{system.profile}}是可刪除的。


MongoDB 數據類型

下表為MongoDB中常用的幾種數據類型。

數據類型 描述
String 字符串。 存儲數據常用的數據類型。 在MongoDB 中,UTF-8 編碼的字符串才是合法的。
Integer 整型數值。 用於存儲數值。 根據你所採用的服務器,可分為32 位或64 位。
Boolean 布爾值。 用於存儲布爾值(真/假)。
Double 雙精度浮點值。 用於存儲浮點值。
Min/Max keys 將一個值與BSON(二進制的JSON)元素的最低值和最高值相對比。
Arrays 用於將數組或列表或多個值存儲為一個鍵。
Timestamp 時間戳。 記錄文檔修改或添加的具體時間。
Object 用於內嵌文檔。
Null 用於創建空值。
Symbol 符號。 該數據類型基本上等同於字符串類型,但不同的是,它一般用於採用特殊符號類型的語言。
Date 日期時間。 用UNIX 時間格式來存儲當前日期或時間。 你可以指定自己的日期時間:創建Date 對象,傳入年月日信息。
Object ID 對象ID。 用於創建文檔的ID。
Binary Data 二進制數據。 用於存儲二進制數據。
Code 代碼類型。 用於在文檔中存儲JavaScript 代碼。
Regular expression 正則表達式類型。 用於存儲正則表達式。