环境:
centos6.5
mysql5.6
gearman简介:
Gearman是一个支持分布式的任务分发框架。设计简洁,获得了非常广泛的支持。一个典型的Gearman应用包括以下这些部分:
Gearman Job Server:Gearman核心程序,以守护进程形式运行在后台
Gearman Client:可以理解为任务的收件员,比如我要在后台执行一个发送邮件的任务,可以在程序中调用一个Gearman Client并传入邮件的信息,然后就可以将执行结果立即展示给用户,而任务本身会慢慢在后台运行。
Gearman Worker:任务的真正执行者,一般需要自己编写具体逻辑并通过守护进程方式运行,Gearman Worker接收到Gearman Client传递的任务内容后,会按顺序处理。
设计思路:
首先利用mysql UDF(通过了 lib_mysqludf_json和 gearman-mysql-udf的组合实现 )在mysql中的数据发生改变时触动触发器将数据传入Gearman中,这时的mysql相当于Gearman的clinet。然后运行自己编写的php程序作为worker,将Gearman中的数据传到Redis中去,这时的Redis相当于是Gearman的consumer。
1、安装gearman
实验中的系统yum源在centos6.5自带的网络yum源的基础上,增加了epel的源,EPEL (Extra Packages for Enterprise Linux,企业版Linux的额外软件包) 是Fedora小组维护的一个软件仓库项目,为RHEL/CentOS提供他们默认不提供的软件包。使用这个源可以免去很多麻烦,省去源码编译的麻烦,需要注意的是,不论是使用centos自带的网络yum源还是epel扩展源,都需要你的IP能够访问到公网。
安装gearman、php、php的gearman扩展、nc工具 yum install -y php-pecl-gearman libgearman libgearman-devel gearmand nc
启动gearman服务 /etc/init.d/gearmand start
验证gearman是否成功启动,如果返回的结果中有4730端口,那么表示服务已经正常启动了 [root@hadoop1 ~]# netstat -alnutp |grep gearman
2、模拟Gearman的工作原理:
使用下列命令查看Gearman的队列 watch -n 1 "(echo status; sleep 0.1) | nc 127.0.0.1 4730"
结果如下
writeLog 0 0 0
四列含义:1-任务名称;2-等待队列任务数;3-运行中的任务数;4-正在运行的worker进程数;
编译一段php代码模拟Gearman的Client:client.php<?php
$client = new GearmanClient();
$client->addServer();
$client->doBackground('writeLog', 'Log content');
echo '文件已经在后台操作';
echo "\n";
执行client.php
php client.php
这时,再次查看Gearman的队列,发现等待队列中有一个任务
writeLog 1 0 0
编写一段php代码模拟Gearman的Worker:worker.php
该worker的作用是将客户端传递给Gearman的字符串'Log content'写入到当前目录下的gearman.log文件中<?php
$worker = new GearmanWorker();
$worker->addServer();
$worker->addFunction('writeLog', 'writeLog');
while($worker->work());
function writeLog($job)
{
$log = $job->workload();
file_put_contents(__DIR__ . '/gearman.log', $log . "\n", FILE_APPEND | LOCK_EX);
}
以nohup的方式后台启动worker.phpnohup php worker.php &
再次查看Gearman的队列,发现等待的任务变成0,worker进程变成了1,gearman.log有了内容writeLog 0 0 1
[root@hadoop1 ~]# cat gearman.log
Log content
3、安装mysql-server、mysql、php-mysql(php连接mysql的驱动,非必须,这里是为了稍后用程序比较从Redis和Mysql中分别读取数据的效率)。实验中,由于我的机子上之前已将安装了mysql5.6,所以就直接使用mysql5.6做实验了。当然也可以使用yum开安装mysql,可能安装的mysql版本不是5.6,但是完全没有关系。
安装mysql相关软件
yum install -y mysql-server mysql php-mysql
启动mysql
/etc/init.d/mysql start
4、安装lib_mysqludf_json wget https://github.com/mysqludf/lib_mysqludf_json/archive/master.zip
mv master master.zip
unzip master.zip
cd lib_mysqludf_json-master
rm -rf lib_mysqludf_json.so
gcc $(mysql_config --cflags) -shared -fPIC -o lib_mysqludf_json.so lib_mysqludf_json.c
这时重新编译生成了lib_mysqludf_json.so,然后需要把lib_mysqludf_json.so拷贝到mysql的插件目录下,查看mysql的插件目录:[root@hadoop1 ~]# mysql -u root -pupbjsxt --execute="show variables like '%plugin%';"
+---------------+--------------------------+
| Variable_name | Value |
+---------------+--------------------------+
| plugin_dir | /usr/lib64/mysql/plugin/ |
+---------------+--------------------------+
[root@hadoop1 lib_mysqludf_json-master]# cp lib_mysqludf_json.so /usr/lib64/mysql/plugin/
5、安装gearman-mysql-udf wget https://launchpad.net/gearman-mysql-udf/trunk/0.6/+download/gearman-mysql-udf-0.6.tar.gz
tar xf gearman-mysql-udf-0.6.tar.gz -C ./
cd gearman-mysql-udf-0.6
./configure --with-mysql=/usr/bin/mysql_config --libdir=/usr/lib64/mysql/plugin/
make && make install
该插件直接安装到了mysql的插件目录下。
6、连入mysql,创建对应的function、trigger及设置gearman server信息[root@hadoop1 ~]# mysql -u root -p******
mysql> CREATE FUNCTION json_object RETURNS STRING SONAME 'lib_mysqludf_json.so';
mysql> CREATE FUNCTION gman_do_background RETURNS STRING SONAME 'libgearman_mysql_udf.so';
mysql> CREATE FUNCTION gman_servers_set RETURNS STRING SONAME 'libgearman_mysql_udf.so'
## 为javashop中的test表建立触发器
mysql> use javashop;
mysql> describe test;
+-------+----------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------+----------+------+-----+---------+-------+
| id | int(11) | YES | | NULL | |
| name | char(20) | YES | | NULL | |
+-------+----------+------+-----+---------+-------+
2 rows in set (0.00 sec)
mysql> source trigger.sql
## 设置gearman server信息
mysql>SELECT gman_servers_set('127.0.0.1:4730');
trigger.sql脚本文件内容如下DELIMITER $$
CREATE TRIGGER datatoredis AFTER UPDATE ON test FOR EACH ROW BEGIN
SET @ret=gman_do_background('syncToRedis', json_object(NEW.id as `id`, NEW.name as `name`));
END$$
DELIMITER ;
7、在mysql中更新一条数据,然后查看gearman的队列mysql> update test set name='redis' where id=10;
Query OK, 1 row affected (0.03 sec)
Rows matched: 1 Changed: 1 Warnings: 0
writeLog 0 0 1
syncToRedis 1 0 0
可见mysql触发器已经成功的将数据传入到gearman中了。
8、安装redis、php-pecl-redis(php连接redis的驱动)yum install php-pecl-redis redis -y
启动redis
/etc/init.d/redis start
登录redis客户端,查看当前内存中的数据
[root@hadoop1 ~]# redis-cli
redis 127.0.0.1:6379> keys *
(empty list or set)
这时,redis中并没有数据。
9、编写一个worker程序,负责将gearman中的数据传入到redis中去:redis_worker.php<?php
$worker = new GearmanWorker();
$worker->addServer();
$worker->addFunction('syncToRedis', 'syncToRedis');
$redis = new Redis();
$redis->connect('127.0.0.1');
while($worker->work());
function syncToRedis($job)
{
global $redis;
$workString = $job->workload();
$work = json_decode($workString);
if(!isset($work->id)){
return false;
}
$redis->set($work->id, $workString);
}
10、以nohup的方式后台运行redis_worker.phpnohup php redis_worker.php &
这时,再查看gearman的队列
writeLog 0 0 1
syncToRedis 0 0 1
发现syncToRedis任务之前等待的任务数变为了0,正在运行的worker进程数变为了1。
检查redis中是否缓存了数据
[root@hadoop1 ~]# redis-cli
redis 127.0.0.1:6379> keys *
1) "10"
redis 127.0.0.1:6379> get 10
"{"id":10,"name":"redis"}"
发现redis中已经成功的缓存了mysql中更新的数据,至此功能实现。
11、从redis中读取数据和从mysql中读取数据性能比较
编写php代码,从redis中读取数据:php_redis.php
<?php
$stime=microtime(true); //获取程序开始执行的时间
$redis = new Redis();
$redis->connect('127.0.0.1');
echo $redis->get('10');
echo "\n";
$redis->close();
$etime=microtime(true);//获取程序执行结束的时间
$total=$etime-$stime; //计算差值
echo "$total".'秒';
echo "\n";
?>
编写php代码,从mysql中读取数据:php_mysql.php
<?php
$stime=microtime(true); //获取程序开始执行的时间
$con = mysql_connect("127.0.0.1","root","******");
$r2 = mysql_select_db("javashop");
$result = mysql_query("SELECT * FROM test limit 1");
while ($row = mysql_fetch_array($result)) {
echo $row['id'] . " --> " . $row['name'];
echo "\n";
}
mysql_close($con);
$etime=microtime(true);//获取程序执行结束的时间
$total=$etime-$stime; //计算差值
echo "$total".'秒';
echo "\n"
?>
分别运行两个php程序
[root@hadoop1 ~]# php php_redis.php
{"id":10,"name":"redis"}
0.00059199333190918秒
[root@hadoop1 ~]# php php_mysql.php
10 --> redis
0.0043718814849854秒
[root@hadoop1 ~]# bc <<< 0.0043718814849854/0.00059199333190918
7
通过对一条记录的查询,可以发现,从mysql中获取数据的时长是redis中获取数据时长的7倍,可见性能的提升几乎达一个数量级。
注意点:
亲测印证了mysql在重启后会丢失之前设置的gearman server的信息,解决办法如下:
在mysql的datadir目录下创建init_file.sql文件,内容为gearman server的信息的设置echo "SELECT gman_servers_set('127.0.0.1:4730');" > /var/lib/mysql/init_file.sql
然后在mysql的配置文件的[mysqld]项中添加如下内容
init-file=/var/lib/mysql/init_file.sql
然后重启mysql,更新一条记录再试试看!
参考:http://avnpc.com/pages/mysql-replication-to-redis-by-gearman
PS:完成了第一篇博客,希望大家多多指教,祝生活愉快!