- 简单快速上手搭建PySpider爬虫服务 02-15
- 您应该了解的 redis 数据持久化的过程-PART 02-15
- 过年,咱少不了的八件事! 02-15
- 数据库的选择——SQL And NoSQL 02-15
- 互联网火车票购票知识点,也许你也应该看看。 02-15
- 您应该了解的 redis 数据持久化的过程-PART 02-15
- MySQL索引专题之认识索引 02-15
- MYSQL大型系统事务完整方案之一,XA强事务机制分 02-15
- 「安全审计」基于Tshark流量抓包的mysql审计 02-15
- 简单快速上手搭建PySpider爬虫服务 02-15
简单快速上手搭建PySpider爬虫服务
发布者: superzhang | 发布时间:2018-02-15环境准备
前置环境部署
在开始部署前,我们需要做一些前置准备 [?]。
yum 更新 [?]
yum update -y安装开发编译工具
yum install gcc gcc-c++ -y安装依赖库
yum install python-pip python-devel python-distribute libxml2 libxml2-devel python-lxml libxslt libxslt-devel openssl openssl-devel -y升级pip
pip install --upgrade pip该步骤可选,但为了部署的稳定性,推荐执行
该步骤耗时可能较长(5~10min),请耐心等待
部署 mariadb
任务时间:10min ~ 20min
由于 CentOS 7 中 MySQL 数据库已从默认的程序列表中移除,我们使用 mariadb 代替。
安装 mariadb
yum install mariadb-server mariadb -y启动 mariadb 服务
systemctl start mariadb设置 root 密码
默认的root用户密码为空,你可
您应该了解的 redis 数据持久化的过程-PART1 【持久化相关因素】
发布者: superzhang | 发布时间:2018-02-15原文 http://oldblog.antirez.com/post/redis-persistence-demystified.html
我参与的Redis的部分工作就是查阅留言,论坛消息和推特上Redis的消息列表。了解用户和非用户对产品的讨论内容,对于开发人员是很重要的。对与Redis来说,从讨论内容反馈来看,redis的众多功能中,数据持久化,是大家最难理解的内容了。
在这篇文章中,我公平公正的描述Redis和其他数据库在数据持久化方面的内容,不会偏袒Redis。尽量以简单,容易理解的文字描述Redis的数据持久化是如何工作的,还有他的可靠性如何实现的,和其他数据库产品的区别。
1. 先介绍操作系统和磁盘的操作首先说说数据库在持久性方面如果操作的,可以将写操作抽象为如下几个步骤:
1:客户端发送命令给数据库(数据存在于客户端的内存)
2:数据库服务端接收到写操作(数据存在于数据库服务端程序的内存)
3:数据
过年,咱少不了的八件事!
发布者: superzhang | 发布时间:2018-02-15转眼间,2018的脚步已然匆匆来临,小编为大家选了咱们过年必不可少的八件事~一起来看看双语的表达吧~1.扫房子
春节打扫房屋这个非常古老的习俗甚至可以追溯到几千年前。灰尘在传统上与“旧”联系在一起,所以打扫房屋和扫除灰尘意味着辞“旧”迎“新”。
春节的前几天,中国的各家各户都打扫房屋,扫地,清洗日用品,清除蛛网和疏浚沟渠。人们兴高采烈做所有这些事情,希望来年好运。
To clean houses on the New Year Eve is a very old custom dating back to thousands of years ago. The dust is traditionally associated with"old" so cleaning their houses and sweeping the dust mean to bid farewell to the "old" and usher in the " new".
Days before the New Year, Chinese families clean their houses,
数据库的选择——SQL And NoSQL
发布者: superzhang | 发布时间:2018-02-15序
看来大家对语言还比较敏感,每个人接触的东西不同,其实没有最好,只是用到那个方面更合适,PHP是最好的语言显然是主观态度,当然小编也不是认为它不好,每个语言的诞生都有其特性,技术是死的人是活的。今天介绍一下数据库,老样子,小编也是入门程序员,说的难免会有偏差,不当之处还望指正。
数据库
SQL以MySQL、SQL Server、Oracle为首的关系型数据库霸占了数据库市场多年,小编作为.Net程序员自然是和SQL Server数据库接触不少,SQL Server相对于其他两个数据库并不是很出色。当然SQL Server也有它的优点,对Access、FoxPro、Excel等有良好的ODBC接口,可以把数据转存到SQL Server数据库当中。SQL Server虽然和Oracle同样收费,但由于语言的限制问题,.Net也只能连SQL Server。MySQL应该是开发者用得比较多的数据库,小编也只是了解淘宝的数据库时MySQL,不过
互联网火车票购票知识点,也许你也应该看看。
发布者: superzhang | 发布时间:2018-02-15各位看官好:
网上时常流传12306很复杂,世界上没有互联网公司能够解决,而其中流传最为广泛的是其库存系统,核心思路就是出售一张票,需要对沿途所有站点的相关库存都进行更新,很多人认为马云搞得双十一都不如12306复杂,先看他们所说的库存设计:
其实这是一个谣传,核心思想就是卖出一个全程票,所有涉及站点的商品库存都要进行更新,某乎上有同样观点取得20W赞。实际上库存是依据席位复用产生,其中还包含共用(多站可卖)、预留(预留部分库存)、限售(只在某站出售)等。
举例高铁G6:上海(A)到北京(E),沿途有南京(B),徐州(C),济南(D)共5站。假设座位1000,最大运力1000AE:
席位复用原则为:开卖初期可能只允许出售AE AB BE,每卖一个AB则产生一个BE,再次开放C出售,卖一个AC,产生一个CE,最终临发车24小时开放全站。那么技术上完全可以分配做成独立商品出售!
AE300张,剩余700AE运力
AB BE各300张,A
您应该了解的 redis 数据持久化的过程-PART2【Redis可靠性】
发布者: superzhang | 发布时间:2018-02-15接上一篇,https://www.toutiao.com/i6521549332229915144/
我们已经总结评估数据库持久化可靠性的多个因素,下边看看Redis的持久化可靠性。
现在我们总结了所有的可以用来评估数据库持久化的因素。让我们来看看Redis可以得多少分。Redis提供了2种不同的持久化操作,我们分别看一下。
4.1 快照Redis快照是最简单的持久化模式。它在某些条件满足时在某个时间点生成快照,如距离前一次快照生成大于2分钟,且有多与100个新的写入操作,就需要生成新的快照。这些条件可以通过用户配置文件更改,可以在不重启服务器的条件下修改。快照是一个紧凑的.rdb后缀名的文件,包含整个数据集。
快照的持久化方案只能满足在用户指定的存储节点。如果数据集每15分钟后存一次,那么在Redis实例崩溃或者更严重事件发生时,那么15分钟的写入将会丢失。对于Redis事务,快照能够保证
MySQL索引专题之认识索引
发布者: superzhang | 发布时间:2018-02-15认识索引
认识索引是什么东西非常关键,一个非常恰当的比喻就是书的目录页与书的正文内容之间的关系,为了方便查找书中的内容,通过对内容建立索引形成目录。因此,首先你要明白的一点就是,索引它也是一个文件,它是要占据物理空间的。
比如对于MyISAM存储引擎来说:
.frm后缀的文件存储的是表结构。
.myd后缀的文件存储的是表数据。
.myi后缀的文件存储的就是索引文件。
如下图所示:
对于InnoDB 存储引擎来说:
.frm后缀的文件存储的是表结构。
.ibd后缀的文件存放索引文件和数据(需要开启innodb_file_per_table 参数)
如下图所示:
MYSQL大型系统事务完整方案之一,XA强事务机制分析!
发布者: superzhang | 发布时间:2018-02-15背景
rmdb
程序员或DBA在开发过程中经常会遇到这样的场景,一个数据库操作中因为业务原因,这个操作涉及多个表操作,需要同时去更新或插入删除数据,而这个操作必须全部完成这个操作才有效,否则这个插入或删除的数据就是一条脏数据,上一篇中的ACID就是为这种场景而设计的,各大互联网公司包括阿里、腾讯、百度都会有这样的方案。有需要的可以查看上一篇文章。
而我们如何去保证事务的ACID呢?这就是今天要分享的就是解决方案之一的强XA事务。
XA事务X/Open XA接口是一个开放的数据库双向的系统接口标准,在事务管理器(Transaction Manager)以及一个或多个资源管理器(Resource Manager)之间形成通信桥梁。事务管理器控制着JTA事务,管理事务生命周期,并协调资源。在JTA中,事务管理器抽象为javax.transaction.TransactionManager接口,并通过底层事务服务(即
「安全审计」基于Tshark流量抓包的mysql审计
发布者: superzhang | 发布时间:2018-02-15关于数据库安全,有数据库安全设置、及时更新漏洞,代码做安全渗透防止sql注入外,还有一个很重要的方面数据安全审计。我们有些小伙伴可能用过Oracle,Sql server等数据库,他们都提供了数据审计功能,可以方便使用。但是我们的Mysql却没有这个功能,使得mysql的安全性大打折扣。
Mysql Init-access表的方法通常地Mysql可以用创建Init-access表的形式,记录用户来源ip、时间、用户名和线程号的方式,结合mysqlbin日志来变相实现安全审计方法。这种方法比较繁琐,审计时候很不是便捷,对数据库性能还有一定的影响,这种方法网上很多也就不再赘述。
网络抓包小编在这里给你介绍另外一种很通用便捷的方法,虽然结果也有些小缺憾,比如同时登陆操作的,没法区分两个用户谁是谁。这种方法的原理基于网络抓包的,解析数据包中数据操作语句来实现的。这也是很多安全厂商都用的方法,那些高大上、动辄几百万的数据库审计产品,也是基于这样一个原理,不过人家的过滤器更强大,分析能力更好,细节更多而已。
Tshark 介绍说到网络抓包,大家可能马上想到的是Tcpdump,还有Windows下的Wireshark。对了今天咱们用的工具也跟Wireshark有点关系。Tshark,它是Wireshark的命令行版本,然会它只是在终端命令行下使用,但是它
简单快速上手搭建PySpider爬虫服务
发布者: superzhang | 发布时间:2018-02-15环境准备
前置环境部署
在开始部署前,我们需要做一些前置准备 [?]。
yum 更新 [?]
yum update -y安装开发编译工具
yum install gcc gcc-c++ -y安装依赖库
yum install python-pip python-devel python-distribute libxml2 libxml2-devel python-lxml libxslt libxslt-devel openssl openssl-devel -y升级pip
pip install --upgrade pip该步骤可选,但为了部署的稳定性,推荐执行
该步骤耗时可能较长(5~10min),请耐心等待
部署 mariadb
任务时间:10min ~ 20min
由于 CentOS 7 中 MySQL 数据库已从默认的程序列表中移除,我们使用 mariadb 代替。
安装 mariadb
yum install mariadb-server mariadb -y启动 mariadb 服务
systemctl start mariadb设置 root 密码
默认的root用户密码为空,你可
