mongoDB的安装及基本使用
1.mongoDB简介1.1 NoSQL数据库注:黑色加粗的为常用的数据库 1.2.MongoDB概述MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 优点: - C++编写的运行稳定性能高的数据
- 模式自由
- 面向集合
- 完整索引支持
- 复制和高可用性
1.3.Mongodb术语解释- database--database:数据库
- table – collection:数据库表 – 集合
- row – document: 数据记录 – 文档
- column – field:数据字段 – 域
- index – index :索引 – 索引
- table-join – None:表连接~
- primary key – primary key :主键
1.4.MongoDB基本语法——数据类型
{“name”:”admin”, “gender”:”男”}
集合:存储多个文档,结构不固定 {“name”:”admin”, “gender”:”男”}{“name”:”manager”, “age”:23}{“name”:”manager”, “phone”:”16868686868”}
数据库:存储多个集合 服务器:一个服务器中可以包含多个数据库
- ObjectID:文档id
- String:字符串
- Boolean:布尔值
- Integer:整数
- Double:浮点数
- Arrays:数组或者列表
- Object:嵌入的文档
- Null:空值
- Timestamp:时间戳
- Date:日期时间
2.Mongodb下载安装- 官方网站
注意:偶数为稳定版,如1.6,奇数为开发版,如1.7
2.1.Windows下Mongodb安装
直接下载msi文件或者点击All Verison Binaries下载都行
我这里用的是zip安装,安装完毕后,
mongo文件夹中创建db文件夹和log文件夹
mongod --dbpath D:\软件安装\MongoDB\data\db(此处是db的路径)
- 打开一个新的窗口输入命令mongo,用于数据库操作
2.2.Linux下Mongodb安装MongoDB安装很简单,无需下载源文件,可以直接用apt-get命令进行安装。 1 . 打开终端,输入以下命令: sudo apt-get install mongodb
2 . 安装完成后,在终端输入以下命令查看MongoDB版本: mongo -version
显示版本信息,即安装成功
3 . 启动mongo数据库 在终端输入命令 sudo mongo
3.安装pymongoPyMongo是Mongodb的Python接口开发包,是使用python和Mongodb的推荐方式。 用Python操作MongoDB需要通过PyMongo,输入命令安装 pip install pymongo 默认安装pip install pymongo==2.8 安装指定版本pip install –upgrade pymongo 升级PyMongo
安装成功
命令运行成功无报错
4.Mongodb基本使用4.1.基本操作4.2.基本语法[url=][/url]
show collections 查看当前库中所有的集合,后面的collections不要加括号db.createCollection(name, [optinos]) 创建一个名称为name的集合,后面的options表示创建的附带选项db.createCollection(“emp”):创建一个名称为emp的名称的集合db.createCollection(“dept”, {“capped”: true, size: 5}):capped默认false表示不设置上限,true表示设置上限需要设置size参数~表示达到上限时会将之前的数据覆盖[url=][/url]
db.student.insert({name:”jerry”, gender:”男”})db.student.insert({_id:”1”, name:”tom”, gender:”女”, age:18})
- 更新数据
语法:db.<集合名称>.update(<query>, <update>,[multi:<boolean>]) 指定属性更新:$opration multi:默认false更新符合条件第一条,设置true全集合更新
[url=][/url]
#更新符合条件的文档db.student.update({name:”tom”}, {name:”jerry”})#更新符合条件的文档中符合条件的域db.student.update({name:”tom”}, {$set:{name:”jerry”}})#更新符合条件的多行文档及对应的域db.student.update({}, {$set:{name:”donghua”}}, {multi:true})[url=][/url]
查询数据基本查询 find([{文档条件}]):全集合查询 findOne([{文档条件}]):查询第一个 pretty():将查询结果格式化展示
比较运算符
[url=][/url]
默认判断,无运算符 $lt:little~小于 < $lte:little or equals~小于等于 <= $gt:granter~大于 > $gte:granter or equals~大于等于 >=#查询名称为jerry的学生db.student.find({name:”jerry”})#查询年龄已经适婚年龄的学员db.student.find({age:{$gte:20}})[url=][/url]
- 逻辑运算符
逻辑与:并且运算,默认操作,无运算符 逻辑或:或者运算,$or
#查询年龄已经适婚年龄并且性别为女的学员db.student.find({age:{$gte:20}, gender:”女”})#查询年龄大于18或者性别为男的学员db.student.find({$or:[{age:{$gt:18}, {gender:”女”}]})
- 范围运算符
$in:判断指定条件是否包含在某个范围内 $nin:判断指定条件是否不包含在某个范围内
#查询年龄在18或者20的学员db.student.find({age: {$in:[18,20]}})#查询年龄不是18 的学员db.student.find({age: {$nin : [20]}})
<find>.limit(count)
<find>.sort({字段:1/-1, ...})db.student.find().sort({name:1}) 1.表示升序排列 -1表示降序排列,可以指定多个字段
<find>.count() db.<集合名称>.count({条件})
两种操作方式1.查询结果,通过count()统计数据2. 通过count()直接添加条件统计数据db.<集合名称>.distinct(“去重域名称”, {条件})查询数据列表中,所有的年龄分布情况db.student.distinct(“age”, {})
#隔n个数据查询m个数据db.hero.find().pretty().limit(m).skip(n)
5.Mongodb与python交互之前学习了爬虫,现在我们把爬取得到的数据存储于Mongodb中 [url=][/url]
#爬取英雄联盟英雄信息详情,并存储#-*- coding:utf-8 -*-import pymongoimport requestsfrom bs4 import BeautifulSoup#建立于MongoClient 的连接client = pymongo.MongoClient('localhost',27017)#得到数据库hero = client['hero']#得到一个数据集合sheet_tab = hero['sheet_tab']url = 'http://lol.duowan.com/hero/'req = requests.get(url)soup = BeautifulSoup(req.text,'html.parser')links = soup.find(id="champion_list").find_all('a')for link in links: link = link['href'] requ = requests.get(link) sop = BeautifulSoup(requ.text,'html.parser') data = { 'title' : sop.find('h2',class_="hero-title").get_text(), 'name' : sop.find('h1',class_="hero-name").get_text(), 'tags' : sop.find('div',class_="hero-box ext-attr").find_all('span')[1].get_text(), 'story' : sop.find('div',class_="hero-popup").find_all('p')[0].get_text(), } sheet_tab.insert_one(data)[url=][/url]
开启mongo,运行代码
通过Robo 3T可视化工具我们可以看到抓取到了137条数据,并且已存储到mongodb中
|