nanomsg通信库的pubsub及survey

更新时间：2016年11月25日 16:53 点击：1909

nanomsg是一个实现了几种“可扩展协议”的高性能通信库;可扩展协议的任务是定义多个应用系统如何通信,从而组成一个大的分布式系统。本文我们来讲讲nanomsg的pubsub及survey

nanomsg实验——pubsub

发布订阅模式是很多消息中间件提供的常见功能。通过消息机制，能够将消息发布者和消息接收（消费）者
进行解耦。pubsub模式也是nanomsg直接支持的一直消息模型之一，因此通过pubsub模式实验，
同时也大致了解了下nanomsg的基础用法。

服务端

代码如下

复制代码

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <string.h>
#include <unistd.h>
#include <nanomsg/nn.h>
#include <nanomsg/pubsub.h>

void usage(const char *name)
{
    fprintf(stderr, "%s [ bind url]n", name);
}

int main(int argc, char **argv)
{
    if(argc != 2) {
        usage(argv[0]);
        exit(-1);
    }

    const char *url = argv[1];
    int sock = nn_socket(AF_SP, NN_PUB);
    if(sock < 0) {
        fprintf (stderr, "nn_socket failed: %sn", nn_strerror (errno));
        exit(-1);
    }

    if(nn_bind(sock, url) < 0) {
        fprintf(stderr, "nn_bind failed: %sn", nn_strerror(errno));
        exit(-1);
    }

    while(1) {
        time_t rawtime;
        struct tm * timeinfo;

        time (&rawtime);
        timeinfo = localtime (&rawtime);
        char *text = asctime (timeinfo);
        int textLen = strlen(text);
        text[textLen - 1] = '';

        printf ("SERVER: PUBLISHING DATE %sn", text);
        nn_send(sock, text, textLen, 0);
        sleep(1);
    }

    return 0;
}

nanomsg使用非常简单，只要直接include nanomsg/nn.h，即可使用基本API。使用内置的通信模式，
需要引入对应的头文件，如pubsub模式，引入nonomsg/pubsub.h即可。

pubsub server，需要首先通过nn_socket调用创建socket，这里模仿了POSIX接口，
函数返回一个文件描述符。因此直接通过判断返回值是否大于0，判断是否创建成功。注意第二个参数为协议，
在协议相关头文件中会定义对应的宏。然后所有操作都将基于这个文件描述符。
和berkeley sockets一样，server需要bind一个端口，nanomsg需要bind一个url。目前nanomsg支持的格式有：
* 进程内通信（inproc）：url格式为inproc://test
* 进程间同in想（ipc）：url格式为ipc:///tmp/test.ipc
* tcp通信：url格式为tcp://*:5555

github上源码貌似已经支持websocket了。

nanomsg的错误和UNIX相同，失败之后会设置errno，可以通过nn_strerror获取对应的错误文本。

bind完了之后，就可以通过nn_send函数向socket发送消息了。这个函数参数和berkeley sockets api接口类似。
这里直接获取当前时间，然后发出给所有订阅者。

客户端

代码如下

复制代码

#include <stdio.h>
#include <stdlib.h>

#include <nanomsg/nn.h>
#include <nanomsg/pubsub.h>

int main(int argc, char **argv)
{
    if(argc != 3) {
        fprintf(stderr, "usage: %s NAME BIND_URLn", argv[0]);
        exit(-1);
    }
    const char *name = argv[1];
    const char *url = argv[2];

    int sock = nn_socket (AF_SP, NN_SUB);
    if(sock < 0) {
        fprintf(stderr, "fail to create socket: %sn", nn_strerror(errno));
        exit(-1);
    }
    if(nn_setsockopt (sock, NN_SUB, NN_SUB_SUBSCRIBE, "", 0) < 0) {
        fprintf(stderr, "fail to set sorket opts: %sn", nn_strerror(errno));
        exit(-1);
    }

    if (nn_connect(sock, url) < 0) {
        fprintf(stderr, "fail to connect to %s : %sn", url, nn_strerror(errno));
        exit(-1);
    }

    while ( 1 ) {
        char *buf = NULL;
        int bytes = nn_recv (sock, &buf, NN_MSG, 0);
        printf ("CLIENT (%s): RECEIVED %sn", name, buf);
        nn_freemsg (buf);
    }

    nn_shutdown(sock, 0);

    return 0;
}

客户端初始化和服务端差不多，在连接服务端之前，需要通过nn_setsockopt将当前socket设置成消息订阅者。
然后通过nn_connect连接发布者，参数和服务端bind的差不多，也是一个socket、一个url。
这里的url要和服务端bind的url相同。之后就是一个死循环不停的接收发布者的消息。

测试

首先是编译，和普通c程序相同，只是增加链接nanomsg。

gcc -o pubserver pubserver.c -lnanomsg
gcc -o pubclient pubclient.c -lnanomsg

为了方便测试，写了一个简单的shell脚本：

代码如下

复制代码

#!/bin/bash

BASE="$( cd "$( dirname "$0" )" && pwd )"
PUB=$BASE/pubserver
SUB=$BASE/pubclient

URL="tcp://127.0.0.1:1234"

echo "start pubserver to bind tcp: $URL"

$PUB tcp://127.0.0.1:1234 &

echo "start to start pubclient"
for((i = 0; i < 10; i++))
    do
    echo "start client$i"
    $SUB client$i $URL &
    sleep 1
done

sleep 20
echo "kill all process and exit"

for pid in `jobs -p`
do
    echo "kill $pid"
    kill $pid
done

wait

脚本很简单，首先启动一个消息发布者，然后每秒启动一个消息接受者。等待20s之后，kill掉所有子进程。

脚本的输出：

代码如下

复制代码

start pubserver to bind tcp: tcp://127.0.0.1:1234
start to start pubclient
start client0
SERVER: PUBLISHING DATE Tue Feb 17 15:12:11 2015
start client1
SERVER: PUBLISHING DATE Tue Feb 17 15:12:12 2015
CLIENT (client0): RECEIVED Tue Feb 17 15:12:12 2015
CLIENT (client1): RECEIVED Tue Feb 17 15:12:12 2015
start client2
SERVER: PUBLISHING DATE Tue Feb 17 15:12:13 2015
CLIENT (client0): RECEIVED Tue Feb 17 15:12:13 2015
CLIENT (client1): RECEIVED Tue Feb 17 15:12:13 2015
CLIENT (client2): RECEIVED Tue Feb 17 15:12:13 2015
start client3
SERVER: PUBLISHING DATE Tue Feb 17 15:12:14 2015
CLIENT (client0): RECEIVED Tue Feb 17 15:12:14 2015
CLIENT (client1): RECEIVED Tue Feb 17 15:12:14 2015
CLIENT (client2): RECEIVED Tue Feb 17 15:12:14 2015
...
SERVER: PUBLISHING DATE Tue Feb 17 15:12:41 2015
CLIENT (client0): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client1): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client2): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client3): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client4): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client5): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client6): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client7): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client8): RECEIVED Tue Feb 17 15:12:41 2015
CLIENT (client9): RECEIVED Tue Feb 17 15:12:41 2015
kill all process and exit

可以看见每次启动一个新的订阅者，每个订阅者都能够收到发布者发布的当前时间。

nanomsg实验——survey

survey模式是由server发出询问，client针对请求回复响应的一种模式。这种模式在分布式系统中非常有用，
可以用来做服务发现、分布式事物等分布式询问。
客户端

客户端实现比较方便，除了基础调用（创建socket、连接url）之外，就是先接收服务端询问
（例子中比较简单，服务端询问是固定的，所以没有对内容进行检查）针对询问发送响应
（例子中是发送服务端当前时间）

代码如下

复制代码

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <ctime>
#include <nanomsg/nn.h>
#include <nanomsg/survey.h>

using namespace std;

int main(int argc, const char **argv) {
    if(argc != 3) {
        fprintf(stderr, "usage: %s NAME URLn", argv[0]);
        exit(-1);
    }
    const char *name = argv[1];
    const char *url = argv[2];

    int sock = nn_socket(AF_SP, NN_RESPONDENT);
    if(sock < 0){
        fprintf(stderr, "nn_socket fail: %sn", nn_strerror(errno));
        exit(-1);
    }
    if(nn_connect(sock, url) < 0) {
        fprintf(stderr, "nn_connect fail: %sn", nn_strerror(errno));
        exit(-1);
    }

    while(1){
        char *buf = NULL;
        int bytes = nn_recv (sock, &buf, NN_MSG, 0);

        if(bytes > 0) {
            printf ("CLIENT (%s): RECEIVED "%s" SURVEY REQUESTn", name, buf);
            nn_freemsg (buf);

            char sendBuffer[128];
            time_t rawtime;
            struct tm * timeinfo;

            time (&rawtime);
            timeinfo = localtime (&rawtime);
            char *timeText = asctime (timeinfo);
            int textLen = strlen(timeText);
            timeText[textLen - 1] = '';
            sprintf(sendBuffer, "[ %s ] %s", name, timeText);
            int sendSize = strlen(sendBuffer) + 1;
            int actualSendSize = nn_send(sock, sendBuffer, sendSize, 0);

            if(actualSendSize != sendSize) {
                fprintf(stderr, "nn_send fail, expect length %d, actual length %dn", sendSize, actualSendSize);
                continue;
            }
        }
    }

    nn_shutdown(sock, 0);

    return 0;
}

这里收到消息后，就简单的打印，然后将响应数据写会给服务端。

服务端

服务端有个问题，之前搜索了几个例子都不太正常。经过尝试和简单查看代码之后发现，通过nanomsg基础api，
无法获取当前有多少客户端。但是，如果当前所有连接的客户端的响应都已经收到，再次调用nn_recv之后，
会直接返回-1，表示读取失败，同时errno（通过errno函数获取）被设置为EFSM，表示当前状态机状态不正确。

代码如下

复制代码

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <unistd.h>
#include <nanomsg/nn.h>
#include <nanomsg/survey.h>

using namespace std;

const char *SURVEY_TYPE = "DATE";

int main(int argc, char** argv)
{

    if ( argc != 2 ) {
        fprintf(stderr, "usage: %s URLn", argv[0]);
        exit(-1);
    }
    const char *url = argv[1];
    int sock = nn_socket(AF_SP, NN_SURVEYOR);
    if(sock < 0) {
        fprintf (stderr, "nn_socket failed: %sn", nn_strerror (errno));
        exit(-1);
    }

    if(nn_bind(sock, url) < 0) {
        fprintf(stderr, "nn_bind fail: %sn", nn_strerror(errno));
        exit(-1);
    }

    while(1) {
        int sendSize = strlen(SURVEY_TYPE) + 1;
        int actualSendSize;
        printf ("SERVER: SENDING DATE SURVEY REQUESTn");
        if ((actualSendSize = nn_send(sock, SURVEY_TYPE, sendSize, 0)) != sendSize) {
            fprintf(stderr, "nn_send fail, expect length %d, actual length %dn", sendSize, actualSendSize);
            continue;
        }

        int count = 0;
        while(1) {
            char *buf = NULL;
            int bytes = nn_recv (sock, &buf, NN_MSG, 0);
            if (bytes < 0 && nn_errno() == ETIMEDOUT) break;
            if (bytes >= 0) {
                printf ("SERVER: RECEIVED "%s" SURVEY RESPONSEn", buf);
                ++count;
                nn_freemsg (buf);
            } else {
                fprintf(stderr, "nn_recv fail: %sn", nn_strerror(errno));
                break;
            }
        }
        printf("SERVER: current receive %d survey response.n", count);
        sleep(1);
    }

    nn_shutdown(sock, 0);

    return 0;

}

这里用了两个死循环，外层循环不停尝试向客户端发起询问。完成询问后，通过另外一个死循环读取所有的客户端响应，
当读取失败时退出循环。

之前找到的源码是直接判断错误是否ETIMEDOUT，经过打印会发现每次都没有超时，而是状态机错误：

代码如下	复制代码
/* If no survey is going on return EFSM error. */ if (nn_slow (!nn_surveyor_inprogress (surveyor))) return -EFSM;

测试

测试和前文差不多，先启动一个server，然后再一个个启动client：

代码如下

复制代码

#!/bin/bash

BASE="$( cd "$( dirname "$0" )" && pwd )"
SERVER=$BASE/surveyserver
CLIENT=$BASE/surveyclient

URL="tcp://127.0.0.1:1234"

echo "start surveyserver to bind tcp: $URL"
$SERVER tcp://127.0.0.1:1234 &

echo "start to start surveyclient"
for((i = 0; i < 10; i++))
do
    echo "start client$i"
    $CLIENT client$i $URL &
    sleep 1
done

sleep 20
echo "kill all process and exit"

for pid in `jobs -p`
do
    echo "kill $pid"
    kill $pid
done

wait

输出为：

代码如下

复制代码

start surveyserver to bind tcp: tcp://127.0.0.1:1234
start to start surveyclient
start client0
SERVER: SENDING DATE SURVEY REQUEST
start client1
nn_recv fail: Operation cannot be performed in this state
SERVER: current receive 0 survey response.
start client2
SERVER: SENDING DATE SURVEY REQUEST
CLIENT (client0): RECEIVED "DATE" SURVEY REQUEST
SERVER: RECEIVED "[ client0 ] Tue Feb 17 23:32:43 2015" SURVEY RESPONSE
CLIENT (client1): RECEIVED "DATE" SURVEY REQUEST
SERVER: RECEIVED "[ client1 ] Tue Feb 17 23:32:43 2015" SURVEY RESPONSE
nn_recv fail: Operation cannot be performed in this state
SERVER: current receive 2 survey response.
start client3
SERVER: SENDING DATE SURVEY REQUEST
CLIENT (client0): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client1): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client2): RECEIVED "DATE" SURVEY REQUEST
...
SERVER: SENDING DATE SURVEY REQUEST
CLIENT (client0): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client1): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client2): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client3): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client4): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client5): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client6): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client7): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client9): RECEIVED "DATE" SURVEY REQUEST
CLIENT (client8): RECEIVED "DATE" SURVEY REQUEST
SERVER: RECEIVED "[ client0 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client1 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client2 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client3 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client4 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client5 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client6 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client7 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client9 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
SERVER: RECEIVED "[ client8 ] Tue Feb 17 23:33:09 2015" SURVEY RESPONSE
nn_recv fail: Operation cannot be performed in this state
SERVER: current receive 10 survey response.

从输出可以看见，每次最后一个接收完成之后，都会有一个“Operation cannot be performed in this state”
错误，也就是EFSM错误。

本文我们来分享一下自动化配置和管理工具saltstack mine如何通过自定义收集minion的状态及应用场景的，对minion开发感兴趣的朋友可以看一下。

mine是做什么？就是你在mine定义了收集模块，他自己会把数据收集的，存到了哪里，不知道，但是肯定是客户端minino本地。有兴趣的朋友可以check saltstack的代码。

这里先粘贴下，官方的doc用法：

代码如下

复制代码

mine.delete:

    Remove specific function contents of minion. Returns True on success.

    CLI Example:

        salt '*' mine.delete 'network.interfaces'


mine.flush:

    Remove all mine contents of minion. Returns True on success.

    CLI Example:

        salt '*' mine.flush


mine.get:

    Get data from the mine based on the target, function and expr_form

    Targets can be matched based on any standard matching system that can be
    matched on the master via these keywords::

        glob
        pcre
        grain
        grain_pcre

    CLI Example:

        salt '*' mine.get '*' network.interfaces
        salt '*' mine.get 'os:Fedora' network.interfaces grain


mine.send:

    Send a specific function to the mine.

    CLI Example:

        salt '*' mine.send network.interfaces eth0


mine.update:

    Execute the configured functions and send the data back up to the master
    The functions to be executed are merged from the master config, pillar and
    minion config under the option "function_cache":

        mine_functions:
          network.ip_addrs:

配置起来很简单，跑到minion端，配置下文件，开启几个模块的检测。

代码如下

复制代码

[root@vm-10-154-252-46 utils]# tail /etc/salt/minion

mine_functions:

test.ping: []

network.dig:

   - www.naver.com

network.usage: []

mine_interval: 1

然后咱们跑到master端去抓数据。

[root@vm-10-154-252-82 ~/clusterops/templates]$salt '10.154.252.46' mine.get '*' network.dig

10.154.252.46:

    ----------

    10.154.252.46:



        ; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.10.rc1.el6 <<>> www.baidu.com

        ;; global options: +cmd

        ;; Got answer:

        ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 5279

        ;; flags: qr rd ra; QUERY: 1, ANSWER: 3, AUTHORITY: 5, ADDITIONAL: 2

        ;; QUESTION SECTION:

        ;www.baidu.com.                 IN      A


        ;; ANSWER SECTION:

        www.baidu.com.          186     IN      CNAME   www.a.shifen.com.

        www.a.shifen.com.       149     IN      A       220.181.111.188

        www.a.shifen.com.       149     IN      A       220.181.112.244

        ;; AUTHORITY SECTION:

        a.shifen.com.           186     IN      NS      ns3.a.shifen.com.

        a.shifen.com.           186     IN      NS      ns1.a.shifen.com.

        a.shifen.com.           186     IN      NS      ns5.a.shifen.com.

        a.shifen.com.           186     IN      NS      ns2.a.shifen.com.

        a.shifen.com.           186     IN      NS      ns4.a.shifen.com.

        ;; ADDITIONAL SECTION:

        ns5.a.shifen.com.       70      IN      A       119.75.219.43

        ns2.a.shifen.com.       186     IN      A       180.149.133.241



        ;; Query time: 1 msec

        ;; SERVER: 10.150.0.253#53(10.150.0.253)

        ;; WHEN: Wed Jul 2 14:42:55 2014

        ;; MSG SIZE rcvd: 212

[root@vm-10-154-252-82 ~/clusterops/templates]$

我先前定义的是一分钟来生成一次数据。在minon的日志端是可以体现出来的。

代码如下

复制代码

2014-07-03 09:15:05,054 [salt.loaded.int.module.mine
2014-07-03 09:15:05,186 [salt.loaded.int.module.mine
2014-07-03 09:16:05,149 [salt.loaded.int.module.mine
2014-07-03 09:16:05,274 [salt.loaded.int.module.mine
2014-07-03 09:17:05,242 [salt.loaded.int.module.mine
2014-07-03 09:17:05,366 [salt.loaded.int.module.mine
2014-07-03 09:18:05,336 [salt.loaded.int.module.mine
2014-07-03 09:18:05,463 [salt.loaded.int.module.mine
2014-07-03 09:19:05,430 [salt.loaded.int.module.mine
2014-07-03 09:19:05,554 [salt.loaded.int.module.mine
2014-07-03 09:20:05,523 [salt.loaded.int.module.mine
2014-07-03 09:20:05,648 [salt.loaded.int.module.mine
2014-07-03 09:21:05,619 [salt.loaded.int.module.mine
2014-07-03 09:21:05,748 [salt.loaded.int.module.mine
2014-07-03 09:22:05,713 [salt.loaded.int.module.mine
2014-07-03 09:22:05,843 [salt.loaded.int.module.mine
2014-07-03 09:23:05,808 [salt.loaded.int.module.mine
2014-07-03 09:23:05,938 [salt.loaded.int.module.mine
2014-07-03 09:24:05,901 [salt.loaded.int.module.mine
2014-07-03 09:24:06,026 [salt.loaded.int.module.mine
2014-07-03 09:25:05,995 [salt.loaded.int.module.mine
2014-07-03 09:25:06,120 [salt.loaded.int.module.mine
2014-07-03 09:26:05,088 [salt.loaded.int.module.mine
2014-07-03 09:26:05,214 [salt.loaded.int.module.mine
2014-07-03 09:27:05,183 [salt.loaded.int.module.mine
2014-07-03 09:27:05,319 [salt.loaded.int.module.mine
2014-07-03 09:28:05,287 [salt.loaded.int.module.mine
2014-07-03 09:28:05,418 [salt.loaded.int.module.mine
2014-07-03 09:29:05,373 [salt.loaded.int.module.mine
2014-07-03 09:29:05,502 [salt.loaded.int.module.mine
2014-07-03 09:30:05,466 [salt.loaded.int.module.mine
2014-07-03 09:30:05,591 [salt.loaded.int.module.mine
2014-07-03 09:31:05,560 [salt.loaded.int.module.mine
2014-07-03 09:31:05,689 [salt.loaded.int.module.mine
2014-07-03 09:32:05,655 [salt.loaded.int.module.mine
2014-07-03 09:32:05,785 [salt.loaded.int.module.mine
2014-07-03 09:33:05,749 [salt.loaded.int.module.mine
2014-07-03 09:33:05,874 [salt.loaded.int.module.mine
2014-07-03 09:34:05,845 [salt.loaded.int.module.mine
2014-07-03 09:34:05,969 [salt.loaded.int.module.mine
2014-07-03 09:35:05,937 [salt.loaded.int.module.mine
2014-07-03 09:35:06,068 [salt.loaded.int.module.mine
2014-07-03 09:36:05,017 [salt.loaded.int.module.mine
2014-07-03 09:36:05,141 [salt.loaded.int.module.mine
2014-07-03 09:37:05,113 [salt.loaded.int.module.mine
2014-07-03 09:37:05,238 [salt.loaded.int.module.mine
2014-07-03 09:38:05,208 [salt.loaded.int.module.mine
2014-07-03 09:38:05,336 [salt.loaded.int.module.mine
2014-07-03 09:39:05,304 [salt.loaded.int.module.mine
2014-07-03 09:39:05,428 [salt.loaded.int.module.mine
2014-07-03 09:40:05,687 [salt.loaded.int.module.mine
2014-07-03 09:40:05,810 [salt.loaded.int.module.mine
2014-07-03 09:41:05,781 [salt.loaded.int.module.mine
2014-07-03 09:41:05,908 [salt.loaded.int.module.mine

咱们也可以利用mine.send来发送数据。

代码如下	复制代码
[root@vm-10-154-252-82 ~/clusterops/templates]$salt '10.154.252.46' mine.send network.dig youku.com 10.154.252.46: True [root@vm-10-154-252-82 ~/clusterops/templates]$

我们又重新定义了mine的规则。

代码如下	复制代码
mine_functions: test.ping: [] cmd.run: - date;df

咱们定义了有时间特征的收集，用来判断下，他获取的数据是不是一分钟间隔，你就算mine.get也只是获取到他先前生成的数据，而不是实时的。

有些朋友还是再疑惑这些东西也可以用直接推送模块来实现，但是你看下面，我定义了sleep 10s，如果用模块去取值的话，一定要sleep 10秒之后，才能获取到数据。但这里master去get数据的时候，还是很即时的回来。当然取得数据是一分钟之前的。对一些场合这已经足够了。

上面说了，是什么场合？来个简单渲染haproxy配置。

代码如下

复制代码

/srv/pillar/top.sls:

base:

'G@roles:web':

    - web

/srv/pillar/web.sls:

mine_functions:

network.ip_addrs: [eth0]

/etc/salt/minion.d/mine.conf:

mine_interval: 5

/srv/salt/haproxy.sls:

haproxy_config:

file:

    - managed

    - name: /etc/haproxy/config

    - source: salt://haproxy_config

    - template: jinja

/srv/salt/haproxy_config:

<...file contents snipped...>

{% for server, addrs in salt['mine.get']('roles:web', 'network.ip_addrs', expr_form='grain').items() %}

server {{ server }} {{ addrs[0] }}:80 check

{% endfor %}

<...file contents snipped...>

根据monin客户端的一些特征来渲染配置，估计大家已经学会了用根据grains取渲染配置，但是grains的数据有些不及时，虽然也有办法让他及时。

我这里也只是阐述下mine和grains在通过jinja2渲染配置的场景。我自己看来，grains更适合很久很久才变化的。 mine适合变化比较大的。

大家show下saltstack grains的数据，几乎都是系统和硬件的信息。

代码如下

复制代码

[root@vm-10-154-252-82 ~/clusterops]$salt '10.154.252.46' grains.item productname
10.154.252.46:
productname: OpenStack Nova
[root@vm-10-154-252-82 ~/clusterops]$salt '10.154.252.46' grains.item lang
10.154.252.46:
lang: python erlang
[root@vm-10-154-252-82 ~/clusterops]$
[root@vm-10-154-252-82 ~/clusterops]$
[root@vm-10-154-252-82 ~/clusterops]$
[root@vm-10-154-252-82 ~/clusterops]$salt '10.154.252.46' sys.reload_modules
10.154.252.46:
True
[root@vm-10-154-252-82 ~/clusterops]$

用mine的话，咱们可以定义自己感兴趣的。可以根据现在minon使用的负载和内存情况，来分配不同的配置选项。。。。 pillar 和 mine我想大家应该能区分开来。

代码如下

复制代码

[root@vm-10-154-252-82 ~/clusterops]$time salt '10.154.252.46' mine.get '*' status.meminfo|more
10.154.252.46:
    ----------
    10.154.252.46:
        ----------
        Active:
            ----------
            unit:
                kB
            value:
                506876
        Active(anon):
            ----------
            unit:
                kB
            value:
                94456
        Active(file):
            ----------
            unit:
                kB
            value:
                412420
        AnonHugePages:
            ----------
            unit:
                kB
            value:
                20480
        AnonPages:
            ----------
            unit:
                kB
            value:
                94232
        Bounce:
            ----------

总结，一定要区分直接推送模块和mine的区别，还有grains和mine的区别。仁者见仁，智者见智。想怎么用，还是需要你自己掌控的。

CVS 太古老已经没有多少人用了，很多人都转到了 Git 上，现在我们来介绍一下如何将项目从 CVS 上转到 Git 并和 Github 上 Fork 的项目合并的步骤

在捣鼓我的 Gregarius 时，发现无法读取 HTTPS 的 RSS ，追查发现是他所使用的 HTTP 客户端类 Snoopy 的原因。想升级新版 Snoopy 却发现原作者已经几年都不更新了， Github 上倒是有人弄了几个镜像，其中 hurrycaner 的这个还对 README 进行了一些改进。但所有镜像都没有 SourceForge 上的修改历史。

所以，我想作的是，基于 hurrycaner 的镜像进行 Fork，但是要把 SourceForge 上的修改历史也弄进来。

CVS –> Git

现在应该没有人用 CVS 了把，SourceForge 也支持 Git 了，但上面有些古老项目依然只有 CVS 。

把 CVS 转换成 Git 的工具还是有一些的，但从一些讨论看来似乎都做不到完美。也难怪，CVS 的存储格式实在是有些奇怪，代码、修改记录、修改注释都堆在一个文件中，解析起来肯定头疼。

由于害怕 cvs2git 会像 svn2git 那样转换时把作者缀上 UUID，我先试了试 parsecvs ，但这货连使用说明都没有，放弃了。然后用的是 StackOverflow 上最后一个人推荐的 crap 。和上面的一样，都是简单 make 一下就有可执行文件用，但比上面的帮助全，还有一个非常简单的例子。

这就可以开始了，先把 SourceForge 上的仓库下载下来：

$ mkdir Snoopy.cvs

$ rsync -av rsync://snoopy.cvs.sourceforge.net/cvsroot/snoopy/ Snoopy.cvs
receiving incremental file list
./
CVSROOT/
CVSROOT/.#checkoutlist
CVSROOT/.#commitinfo
CVSROOT/.#config
CVSROOT/.#cvswrappers
CVSROOT/.#editinfo
CVSROOT/.#loginfo
CVSROOT/.#modules
CVSROOT/.#notify
CVSROOT/.#rcsinfo
CVSROOT/.#taginfo
CVSROOT/.#verifymsg
CVSROOT/checkoutlist
CVSROOT/checkoutlist,v
CVSROOT/commitinfo
CVSROOT/commitinfo,v
CVSROOT/config
CVSROOT/config,v
CVSROOT/cvswrappers
CVSROOT/cvswrappers,v
CVSROOT/editinfo
CVSROOT/editinfo,v
CVSROOT/history
CVSROOT/loginfo
CVSROOT/loginfo,v
CVSROOT/modules
CVSROOT/modules,v
CVSROOT/notify
CVSROOT/notify,v
CVSROOT/passwd
CVSROOT/rcsinfo
CVSROOT/rcsinfo,v
CVSROOT/readers
CVSROOT/taginfo
CVSROOT/taginfo,v
CVSROOT/val-tags
CVSROOT/verifymsg
CVSROOT/verifymsg,v
CVSROOT/writers
CVSROOT/Emptydir/
Snoopy/
Snoopy/AUTHORS,v
Snoopy/COPYING.lib,v
Snoopy/ChangeLog,v
Snoopy/FAQ,v
Snoopy/INSTALL,v
Snoopy/Makefile.am,v
Snoopy/NEWS,v
Snoopy/README,v
Snoopy/Snoopy.class.php,v
Snoopy/TODO,v
Snoopy/autogen.sh,v
Snoopy/configure.in,v
Snoopy/Attic/
Snoopy/Attic/.cvsignore,v
Snoopy/Attic/COPYING,v
Snoopy/Attic/Snoopy.class.inc,v

sent 1,066 bytes received 229,013 bytes 17,042.89 bytes/sec
total size is 225,573 speedup is 0.98

注意这和下载 CVS 代码是不一样的，这里下载的是 CVSROOT，仓库的原始码。

然后初始化一个 Git 仓库目录，用 crap 开始转换：

$ mkdir Snoopy.git
$ cd Snoopy.git

$ git init

$ ../crap/crap-clone /home/fwolf/dev/Snoopy.cvs Snoopy
Valid-requests Root Valid-responses valid-requests Repository Directory Max-dotdot Static-directory Sticky Entry Kopt Checkin-time Modified Is-modified Empty-conflicts UseUnchanged Unchanged Notify Questionable Argument Argumentx Global_option Gzip-stream wrapper-sendme-rcsOptions Set Gssapi-authenticate expand-modules ci co update diff log rlog add remove update-patches gzip-file-contents status rdiff tag rtag import admin export history release watch-on watch-off watch-add watch-remove watchers editors init annotate rannotate noop version
*********** CYCLE **********
Changeset andrei
*** empty log message ***

    INSTALL:1.1
    Makefile.am:1.1
    NEWS:1.1
    autogen.sh:1.1
    configure.in:1.1
    .cvsignore:1.1
Deferring:
    autogen.sh:1.2
Tag 'Snoopy' placing on branch ''
Tag 'start' placing on branch 'Snoopy'
opening version cache failed: No such file or directory
1970-01-01 08:00:00 CST BRANCH
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST BRANCH Snoopy
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST TAG start
2000-02-04 00:10:54 CST COMMIT
2000-02-04 00:10:54 CST COMMIT
2000-02-04 00:28:59 CST COMMIT
2000-02-22 23:44:57 CST COMMIT
2000-03-10 04:52:59 CST COMMIT
2000-03-10 04:54:47 CST COMMIT
2000-05-18 22:50:14 CST COMMIT
2000-05-18 23:36:34 CST COMMIT
2000-05-18 23:44:00 CST COMMIT
2000-06-30 02:37:25 CST COMMIT
2000-08-23 04:36:52 CST COMMIT
2000-09-14 04:52:04 CST COMMIT
2000-09-14 22:09:58 CST COMMIT
2000-09-15 21:11:11 CST COMMIT
2000-09-16 05:57:37 CST COMMIT
2000-09-27 03:34:38 CST COMMIT
2000-09-27 04:28:45 CST COMMIT
2000-10-09 21:13:52 CST COMMIT
2001-03-25 04:15:18 CST COMMIT
2001-07-07 05:24:11 CST COMMIT
2001-08-22 23:43:24 CST COMMIT
2001-11-21 04:23:02 CST COMMIT
2002-10-03 22:38:49 CST COMMIT
2002-10-03 22:55:06 CST COMMIT
2002-10-03 22:57:39 CST COMMIT
2002-10-10 04:25:50 CST COMMITMissed first time round: ChangeLog 1.11
Missed first time round: Snoopy.class.inc 1.21

2002-10-10 04:41:24 CST COMMITcvs checkout ChangeLog 1.14 - version is duplicate
cvs checkout Snoopy.class.inc 1.24 - version is duplicate
Missed first time round: ChangeLog 1.12
Missed first time round: Snoopy.class.inc 1.22

2002-10-10 04:51:57 CST COMMITcvs checkout ChangeLog 1.14 - version is duplicate
cvs checkout Snoopy.class.inc 1.24 - version is duplicate
Missed first time round: ChangeLog 1.13
Missed first time round: Snoopy.class.inc 1.23

2002-10-10 04:56:14 CST COMMIT
2003-03-12 22:40:55 CST COMMIT
2003-09-15 21:58:28 CST COMMIT
2003-10-22 03:18:39 CST COMMIT
2003-11-08 03:52:58 CST COMMIT
2003-12-24 03:34:35 CST COMMIT
2004-01-08 03:16:10 CST COMMIT
2004-07-25 02:23:27 CST COMMITMissed first time round: ChangeLog 1.19
Missed first time round: Snoopy.class.php 1.5

2004-07-25 02:34:28 CST COMMITcvs checkout ChangeLog 1.22 - version is duplicate
cvs checkout Snoopy.class.php 1.8 - version is duplicate
Missed first time round: ChangeLog 1.20
Missed first time round: Snoopy.class.php 1.6

2004-07-25 08:49:02 CST COMMIT
2004-07-25 10:42:48 CST COMMIT
2004-07-25 10:46:34 CST COMMIT
2004-07-25 10:46:59 CST COMMIT
2004-07-25 11:18:32 CST COMMIT
2004-10-16 13:14:11 CST COMMIT
2004-10-16 13:17:41 CST COMMIT
2004-10-16 13:44:51 CST COMMIT
2004-10-16 14:27:09 CST COMMIT
2004-10-16 14:28:30 CST COMMIT
2004-10-16 14:40:42 CST COMMIT
2004-10-17 00:33:58 CST COMMIT
2004-10-17 00:36:18 CST COMMIT
2004-10-18 13:12:55 CST COMMIT
2004-10-18 13:18:27 CST COMMIT
2004-10-18 13:19:04 CST COMMIT
2004-10-18 13:19:28 CST COMMIT
2004-10-18 13:19:51 CST COMMIT
2004-11-18 13:51:32 CST COMMIT
2004-11-18 13:52:28 CST COMMIT
2004-11-18 14:37:05 CST COMMIT
2005-02-03 12:43:26 CST COMMIT
2005-02-03 12:57:05 CST COMMIT
2005-10-23 10:08:40 CST COMMIT
2005-10-23 10:16:26 CST COMMIT
2005-10-24 00:30:34 CST COMMIT
2005-10-24 23:34:50 CST COMMIT
2005-10-24 23:44:12 CST COMMIT
2005-10-24 23:44:59 CST COMMIT
2005-10-24 23:46:10 CST COMMIT
2005-10-30 13:33:15 CST COMMIT
2005-10-30 13:45:09 CST COMMIT
2005-10-31 02:32:42 CST COMMIT
2005-10-31 02:51:35 CST COMMIT
2005-11-08 14:53:56 CST COMMIT
2005-11-08 15:01:47 CST COMMIT
2008-10-22 23:30:41 CST COMMIT
2008-10-22 23:53:14 CST COMMIT
2008-11-09 05:09:09 CST COMMIT
Emitted 79 commits (= total 79).
Exact     2 +     1 =     3 branches + tags.
Fixup     0 +     0 =     0 branches + tags.
Download 147 cvs versions in 84 transactions.
String cache: 141 items, 132/1024 buckets used, mean search 1.06383
git-fast-import statistics:
---------------------------------------------------------------------
Alloc'd objects:       5000
Total objects:          289 (         8 duplicates                  )
      blobs :          134 (         7 duplicates         46 deltas of        133 attempts)
      trees :           77 (         0 duplicates         70 deltas of         71 attempts)
      commits:           78 (         1 duplicates          0 deltas of          0 attempts)
      tags   :            0 (         0 duplicates          0 deltas of          0 attempts)
Total branches:           3 (         2 loads     )
      marks:           1024 (       220 unique    )
      atoms:             15
Memory total:          2294 KiB
       pools:          2098 KiB
     objects:           195 KiB
---------------------------------------------------------------------
pack_report: getpagesize()            =       4096
pack_report: core.packedGitWindowSize =   33554432
pack_report: core.packedGitLimit      = 268435456
pack_report: pack_used_ctr            =          7
pack_report: pack_mmap_calls          =          3
pack_report: pack_open_windows        =          1 /          1
pack_report: pack_mapped              =     350104 /     350104
---------------------------------------------------------------------

这样这个 Git 仓库就包含了已经转换过了的 CVS 历史记录，如果看不到文件可以 reset 一下。

按说后续的操作理论上可以在这个仓库目录中操作，但为了更好的和 Fork 的项目合并，我使用导出 Patch 的方法，后面再 am：

$ git log --pretty=oneline |wc -l
78

$ git format-patch -78

其实在这里，也可以在目标 repo 里面，通过添加 Snoopy.git 为 Git remote，然后 merge remote 的方式进行，效果更好，还不用修改提交时间。

Fork 项目，移花接木

在 Github 上 Fork https://github.com/hurrycaner/snoopy ，得到 https://github.com/fwolf/snoopy ，但先不下载到本地，后面的操作方法和正常 Fork 项目是不一样的。

在本地再新建一个 Git 仓库，这个仓库是我们今后维护 Snoopy 的主仓库：

$ mkdir Snoopy
$ cd Snoopy
$ git init
$ git remote add origin git@github.com:fwolf/snoopy.git
$ touch .gitignore
$ git add .gitignore
$ git commit -a -m "Initial commit"
$ git push -f origin master

和新建项目的方法基本一样，不同点是我们的 origin 是 Fork 后的项目，并且进行了 push -f 操作，覆盖掉了 hurrycaner 的所有提交。

接下来新建一个 sourceforge 分支，保留 SourceForge 上 CVS 代码的最终状态，提交是通过 am 导入的， --committer-date-is-author-date 参数是将作者的时间作为提交时间，也可以不要。Patch 0002 是空的，会导致 am 失败，所以删除掉：

$ git branch sourceforge
$ git checkout sourceforge

$ rm ../Snoopy.git/0002-Initial-check-in.patch
$ git am ../Snoopy.git/00* --committer-date-is-author-date

$ git checkout master
$ git merge sourceforge
$ git push

现在，master 分支上是我作的一个初始提交，加上 CVS 上导过来的提交内容，相当于是 CVS 被完整的导入了 Git。

添加只有一个空 .gitignore 文件的初始提交是 Git 的一个习惯，因为 Git 的初始提交可以视为是“不可以操作”的，所以最好是空或者只包含最少内容。

接下来，我们要将 hurrycaner 所作的修改合并进来。由于他是基于 Snoopy 1.2.4 代码修改的，和我导入的最终代码差距不大，所以合并还比较顺利，只有几处冲突而已：

$ git branch hurrycaner
$ git checkout hurrycaner
$ git remote add upstream git@github.com:hurrycaner/snoopy.git
$ git fetch upstream
$ git merge upstream/master     # 手工解决冲突

$ git checkout master
$ git merge hurrycaner
$ git push

这就基本上完成了，保留了从 CVS 到 hurrycaner 的完整修改记录，并且还能像正常 Fork 的项目那样继续工作。

修改记录看起来是这个样子的：

将项目从 CVS 转 Git 并和 Github 上 Fork 的项目合并的详细步骤

我已经向原项目作者推送 Pull Request 了。 hurrycaner 在 Github 上并不活跃，不知道能不能看到、会不会收啊。

尾声

Git 的使用是比较灵活的，我相信其他分布式 SCM 也能做到，没研究过，不对比。话说回来，本文中的做法，是不是有点鸠占鹊巢的感觉？

实时传输协议RTP（Real-time Transport Protocol）是一个网络传输协议，RTP协议详细说明了在互联网上传递音频和视频的标准数据包格式。

为何NAT里面的主机可以访问NAT外的WEB服务器，但不能获取RTSP流媒体服务器码流？

原因：

对于 HTTP 这样的协议，客户端与 WEB 服务器建立 socket 连接，是由 WEB 服务器绑定一个固定的 TCP 端口，在这个端口监听。位于 NAT 后面的客户端随机选择一个 TCP 端口 connect(2) WEB SERVER。

而对于 RTSP 流媒体服务器，采用 RTP 封装多媒体荷载的话，一般的实现是位于客户端这边的播放器看 UDP 5000 这个端口(也可定义为其他端口, 不过主流的播放器大多是这个端口)是否占用，未占用则绑定这个端口；如果 UDP 5000 这个端口已经被占用了，则向上检查 UDP 5002(习惯上RTP使用偶数号端口，紧挨着的奇数号端口给RTCP使用)等,直到找到一个未使用的端口。然后请求流媒体码流前通过 RTSP 数据包交互告诉服务器播放器这边接收 RTP 数据包的端口，流媒体服务器随机选择一个端口发送 RTP 包，并把即将启动的会话信息通过 SDP 格式以 RTSP 封装通知播放器。因此，对于 RTP 通信来说，真正的服务端是在播放器这边，被动地接收 RTSP 服务器那边发送过来的 RTP 码流。

一般类型的 NAT 允许一个数据包通过的条件是：

    如果这个数据包是从 NAT 里面的设备向外网发送的，允许通过。NAT 设备会查看这个数据包的源ip地址与端口及目的地址与端口信息，如果没有建立过映射关系就新建一个NAT映射关系: 把源ip与端口映射为NAT地址与一个新分配的端口,根据NAT设备类型的不同，映射关系不同:
        完全锥型、地址受限锥型和端口受限锥型是根据(源IP:源端口)建立一个(NAT地址:端口)的映射，
        对称型NAT把(源IP:源端口,目的IP:目的端口)映射为(NAT IP:NAT 端口)。

    如果这个数据包是从 NAT 外面发送给里面的，看这个数据包的信息能否在NAT映射表里找到对应的映射，找不到则禁止通过；若找的到，不同类型的 NAT 有不同的处理:
        完全锥型: 允许通过。
        地址受限锥型: 如果这个映射对应的NAT内部主机之前发送过数据包给这个外网主机，则允许通过，否则不允许。
        端口受限锥型: 如果这个映射对应的NAT内部主机之前发送过数据包给这个外网主机的端口，则允许通过，否则不允许。
        对称型: 因为映射就包含了源IP、源端口、目的IP、目的端口的所有信息，找到这个映射说明之前NAT里面对应的主机发过包给对应的外网主机，所以允许通过。

因此，位于 NAT 里面的主机可以这样正常的访问外网的 HTTP WEB服务器：发起HTTP请求时， NAT 会为这个会话建立一个映射关系，这样 WEB 服务器回应的包正好匹配这个映射，于是可以被客户端浏览器接收。

但是NAT里面的主机要请求流媒体就不行了：对于 RTSP 来说，和 HTTP 一样可以正常通信，关键是对于 RTP 包，服务端是在 NAT 里面的播放器的，即使 RTSP 知道NAT里面播放器主机的地址以及NAT地址， RTP 包到达 NAT 时，属于上述的2的情况，由于之前没有建立映射关系，这个包将被 NAT 丢弃。

有的流媒体服务器会使用 HTTP 来封装流媒体，可以获取较好的穿透性，不过需要实现自己的播放器才能解码了。
RTP 丢包的一个原因

用 UDP 封装的 RTP 传输视频码流，播放出现花屏、马赛克的一个可能原因是丢包严重。UDP 在局域网丢包不太可能是物理传输中的干扰(一般表现为 UDP 校验出错，可用 netstat -su 查看). 这里说说一个较常见的原因以及表现方式，从Linux内核的角度来看，就是 socket 缓存区满，在播放器读取缓存区之前，又一个视频码流数据过来，那么，这个udp数据包将丢失。

为什么会造成这个socket内核缓存区满呢？有可能是下面的原因：

    播放器的平均处理数据速度小于流媒体服务器端发包速度；
    播放器平均处理速度大于对端发包速度，但是发包速度抖动大，而且内核socket读缓存区设置过小。

本文我们来学习常用的代码版本控制C/S系统软件CVS转到分布式版本控制系统Git上，并和Github上Fork的项目合并。

CVS –> Git

现在应该没有人用 CVS 了把，SourceForge 也支持 Git 了，但上面有些古老项目依然只有 CVS 。

把 CVS 转换成 Git 的工具还是有一些的，但从一些讨论看来似乎都做不到完美。也难怪，CVS 的存储格式实在是有些奇怪，代码、修改记录、修改注释都堆在一个文件中，解析起来肯定头疼。

由于害怕 cvs2git 会像 svn2git 那样转换时把作者缀上 UUID，我先试了试 parsecvs ，但这货连使用说明都没有，放弃了。然后用的是 StackOverflow 上最后一个人推荐的 crap 。和上面的一样，都是简单 make 一下就有可执行文件用，但比上面的帮助全，还有一个非常简单的例子。

这就可以开始了，先把 SourceForge 上的仓库下载下来：

$ mkdir Snoopy.cvs

$ rsync -av rsync://snoopy.cvs.sourceforge.net/cvsroot/snoopy/ Snoopy.cvs
receiving incremental file list
./
CVSROOT/
CVSROOT/.#checkoutlist
CVSROOT/.#commitinfo
CVSROOT/.#config
CVSROOT/.#cvswrappers
CVSROOT/.#editinfo
CVSROOT/.#loginfo
CVSROOT/.#modules
CVSROOT/.#notify
CVSROOT/.#rcsinfo
CVSROOT/.#taginfo
CVSROOT/.#verifymsg
CVSROOT/checkoutlist
CVSROOT/checkoutlist,v
CVSROOT/commitinfo
CVSROOT/commitinfo,v
CVSROOT/config
CVSROOT/config,v
CVSROOT/cvswrappers
CVSROOT/cvswrappers,v
CVSROOT/editinfo
CVSROOT/editinfo,v
CVSROOT/history
CVSROOT/loginfo
CVSROOT/loginfo,v
CVSROOT/modules
CVSROOT/modules,v
CVSROOT/notify
CVSROOT/notify,v
CVSROOT/passwd
CVSROOT/rcsinfo
CVSROOT/rcsinfo,v
CVSROOT/readers
CVSROOT/taginfo
CVSROOT/taginfo,v
CVSROOT/val-tags
CVSROOT/verifymsg
CVSROOT/verifymsg,v
CVSROOT/writers
CVSROOT/Emptydir/
Snoopy/
Snoopy/AUTHORS,v
Snoopy/COPYING.lib,v
Snoopy/ChangeLog,v
Snoopy/FAQ,v
Snoopy/INSTALL,v
Snoopy/Makefile.am,v
Snoopy/NEWS,v
Snoopy/README,v
Snoopy/Snoopy.class.php,v
Snoopy/TODO,v
Snoopy/autogen.sh,v
Snoopy/configure.in,v
Snoopy/Attic/
Snoopy/Attic/.cvsignore,v
Snoopy/Attic/COPYING,v
Snoopy/Attic/Snoopy.class.inc,v

sent 1,066 bytes received 229,013 bytes 17,042.89 bytes/sec
total size is 225,573 speedup is 0.98

注意这和下载 CVS 代码是不一样的，这里下载的是 CVSROOT，仓库的原始码。

然后初始化一个 Git 仓库目录，用 crap 开始转换：

$ mkdir Snoopy.git
$ cd Snoopy.git

$ git init

$ ../crap/crap-clone /home/fwolf/dev/Snoopy.cvs Snoopy
Valid-requests Root Valid-responses valid-requests Repository Directory Max-dotdot Static-directory Sticky Entry Kopt Checkin-time Modified Is-modified Empty-conflicts UseUnchanged Unchanged Notify Questionable Argument Argumentx Global_option Gzip-stream wrapper-sendme-rcsOptions Set Gssapi-authenticate expand-modules ci co update diff log rlog add remove update-patches gzip-file-contents status rdiff tag rtag import admin export history release watch-on watch-off watch-add watch-remove watchers editors init annotate rannotate noop version
*********** CYCLE **********
Changeset andrei
*** empty log message ***

    INSTALL:1.1
    Makefile.am:1.1
    NEWS:1.1
    autogen.sh:1.1
    configure.in:1.1
    .cvsignore:1.1
Deferring:
    autogen.sh:1.2
Tag 'Snoopy' placing on branch ''
Tag 'start' placing on branch 'Snoopy'
opening version cache failed: No such file or directory
1970-01-01 08:00:00 CST BRANCH
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST BRANCH Snoopy
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST COMMIT
2000-02-03 23:40:59 CST TAG start
2000-02-04 00:10:54 CST COMMIT
2000-02-04 00:10:54 CST COMMIT
2000-02-04 00:28:59 CST COMMIT
2000-02-22 23:44:57 CST COMMIT
2000-03-10 04:52:59 CST COMMIT
2000-03-10 04:54:47 CST COMMIT
2000-05-18 22:50:14 CST COMMIT
2000-05-18 23:36:34 CST COMMIT
2000-05-18 23:44:00 CST COMMIT
2000-06-30 02:37:25 CST COMMIT
2000-08-23 04:36:52 CST COMMIT
2000-09-14 04:52:04 CST COMMIT
2000-09-14 22:09:58 CST COMMIT
2000-09-15 21:11:11 CST COMMIT
2000-09-16 05:57:37 CST COMMIT
2000-09-27 03:34:38 CST COMMIT
2000-09-27 04:28:45 CST COMMIT
2000-10-09 21:13:52 CST COMMIT
2001-03-25 04:15:18 CST COMMIT
2001-07-07 05:24:11 CST COMMIT
2001-08-22 23:43:24 CST COMMIT
2001-11-21 04:23:02 CST COMMIT
2002-10-03 22:38:49 CST COMMIT
2002-10-03 22:55:06 CST COMMIT
2002-10-03 22:57:39 CST COMMIT
2002-10-10 04:25:50 CST COMMITMissed first time round: ChangeLog 1.11
Missed first time round: Snoopy.class.inc 1.21

2002-10-10 04:41:24 CST COMMITcvs checkout ChangeLog 1.14 - version is duplicate
cvs checkout Snoopy.class.inc 1.24 - version is duplicate
Missed first time round: ChangeLog 1.12
Missed first time round: Snoopy.class.inc 1.22

2002-10-10 04:51:57 CST COMMITcvs checkout ChangeLog 1.14 - version is duplicate
cvs checkout Snoopy.class.inc 1.24 - version is duplicate
Missed first time round: ChangeLog 1.13
Missed first time round: Snoopy.class.inc 1.23

2002-10-10 04:56:14 CST COMMIT
2003-03-12 22:40:55 CST COMMIT
2003-09-15 21:58:28 CST COMMIT
2003-10-22 03:18:39 CST COMMIT
2003-11-08 03:52:58 CST COMMIT
2003-12-24 03:34:35 CST COMMIT
2004-01-08 03:16:10 CST COMMIT
2004-07-25 02:23:27 CST COMMITMissed first time round: ChangeLog 1.19
Missed first time round: Snoopy.class.php 1.5

2004-07-25 02:34:28 CST COMMITcvs checkout ChangeLog 1.22 - version is duplicate
cvs checkout Snoopy.class.php 1.8 - version is duplicate
Missed first time round: ChangeLog 1.20
Missed first time round: Snoopy.class.php 1.6

2004-07-25 08:49:02 CST COMMIT
2004-07-25 10:42:48 CST COMMIT
2004-07-25 10:46:34 CST COMMIT
2004-07-25 10:46:59 CST COMMIT
2004-07-25 11:18:32 CST COMMIT
2004-10-16 13:14:11 CST COMMIT
2004-10-16 13:17:41 CST COMMIT
2004-10-16 13:44:51 CST COMMIT
2004-10-16 14:27:09 CST COMMIT
2004-10-16 14:28:30 CST COMMIT
2004-10-16 14:40:42 CST COMMIT
2004-10-17 00:33:58 CST COMMIT
2004-10-17 00:36:18 CST COMMIT
2004-10-18 13:12:55 CST COMMIT
2004-10-18 13:18:27 CST COMMIT
2004-10-18 13:19:04 CST COMMIT
2004-10-18 13:19:28 CST COMMIT
2004-10-18 13:19:51 CST COMMIT
2004-11-18 13:51:32 CST COMMIT
2004-11-18 13:52:28 CST COMMIT
2004-11-18 14:37:05 CST COMMIT
2005-02-03 12:43:26 CST COMMIT
2005-02-03 12:57:05 CST COMMIT
2005-10-23 10:08:40 CST COMMIT
2005-10-23 10:16:26 CST COMMIT
2005-10-24 00:30:34 CST COMMIT
2005-10-24 23:34:50 CST COMMIT
2005-10-24 23:44:12 CST COMMIT
2005-10-24 23:44:59 CST COMMIT
2005-10-24 23:46:10 CST COMMIT
2005-10-30 13:33:15 CST COMMIT
2005-10-30 13:45:09 CST COMMIT
2005-10-31 02:32:42 CST COMMIT
2005-10-31 02:51:35 CST COMMIT
2005-11-08 14:53:56 CST COMMIT
2005-11-08 15:01:47 CST COMMIT
2008-10-22 23:30:41 CST COMMIT
2008-10-22 23:53:14 CST COMMIT
2008-11-09 05:09:09 CST COMMIT
Emitted 79 commits (= total 79).
Exact     2 +     1 =     3 branches + tags.
Fixup     0 +     0 =     0 branches + tags.
Download 147 cvs versions in 84 transactions.
String cache: 141 items, 132/1024 buckets used, mean search 1.06383
git-fast-import statistics:
---------------------------------------------------------------------
Alloc'd objects:       5000
Total objects:          289 (         8 duplicates                  )
      blobs :          134 (         7 duplicates         46 deltas of        133 attempts)
      trees :           77 (         0 duplicates         70 deltas of         71 attempts)
      commits:           78 (         1 duplicates          0 deltas of          0 attempts)
      tags   :            0 (         0 duplicates          0 deltas of          0 attempts)
Total branches:           3 (         2 loads     )
      marks:           1024 (       220 unique    )
      atoms:             15
Memory total:          2294 KiB
       pools:          2098 KiB
     objects:           195 KiB
---------------------------------------------------------------------
pack_report: getpagesize()            =       4096
pack_report: core.packedGitWindowSize =   33554432
pack_report: core.packedGitLimit      = 268435456
pack_report: pack_used_ctr            =          7
pack_report: pack_mmap_calls          =          3
pack_report: pack_open_windows        =          1 /          1
pack_report: pack_mapped              =     350104 /     350104
---------------------------------------------------------------------

这样这个 Git 仓库就包含了已经转换过了的 CVS 历史记录，如果看不到文件可以 reset 一下。

按说后续的操作理论上可以在这个仓库目录中操作，但为了更好的和 Fork 的项目合并，我使用导出 Patch 的方法，后面再 am：

$ git log --pretty=oneline |wc -l
78

$ git format-patch -78

其实在这里，也可以在目标 repo 里面，通过添加 Snoopy.git 为 Git remote，然后 merge remote 的方式进行，效果更好，还不用修改提交时间。

Fork 项目，移花接木

在 Github 上 Fork https://github.com/hurrycaner/snoopy ，得到 https://github.com/fwolf/snoopy ，但先不下载到本地，后面的操作方法和正常 Fork 项目是不一样的。

在本地再新建一个 Git 仓库，这个仓库是我们今后维护 Snoopy 的主仓库：

$ mkdir Snoopy
$ cd Snoopy
$ git init
$ git remote add origin git@github.com:fwolf/snoopy.git
$ touch .gitignore
$ git add .gitignore
$ git commit -a -m "Initial commit"
$ git push -f origin master

和新建项目的方法基本一样，不同点是我们的 origin 是 Fork 后的项目，并且进行了 push -f 操作，覆盖掉了 hurrycaner 的所有提交。

接下来新建一个 sourceforge 分支，保留 SourceForge 上 CVS 代码的最终状态，提交是通过 am 导入的， --committer-date-is-author-date 参数是将作者的时间作为提交时间，也可以不要。Patch 0002 是空的，会导致 am 失败，所以删除掉：

$ git branch sourceforge
$ git checkout sourceforge

$ rm ../Snoopy.git/0002-Initial-check-in.patch
$ git am ../Snoopy.git/00* --committer-date-is-author-date

$ git checkout master
$ git merge sourceforge
$ git push

现在，master 分支上是我作的一个初始提交，加上 CVS 上导过来的提交内容，相当于是 CVS 被完整的导入了 Git。

添加只有一个空 .gitignore 文件的初始提交是 Git 的一个习惯，因为 Git 的初始提交可以视为是“不可以操作”的，所以最好是空或者只包含最少内容。

接下来，我们要将 hurrycaner 所作的修改合并进来。由于他是基于 Snoopy 1.2.4 代码修改的，和我导入的最终代码差距不大，所以合并还比较顺利，只有几处冲突而已：

$ git branch hurrycaner
$ git checkout hurrycaner
$ git remote add upstream git@github.com:hurrycaner/snoopy.git
$ git fetch upstream
$ git merge upstream/master # 手工解决冲突

$ git checkout master
$ git merge hurrycaner
$ git push

这就基本上完成了，保留了从 CVS 到 hurrycaner 的完整修改记录，并且还能像正常 Fork 的项目那样继续工作。

修改记录看起来是这个样子的：

版本控制CVS转到分布式Git并和Github上Fork的项目合并

我已经向原项目作者推送 Pull Request 了。 hurrycaner 在 Github 上并不活跃，不知道能不能看到、会不会收啊。

尾声

Git 的使用是比较灵活的，我相信其他分布式 SCM 也能做到，没研究过，不对比。话说回来，本文中的做法，是不是有点鸠占鹊巢的感觉？

@link https://github.com/fwolf/snoopy

[!--infotagslink--]

上一篇: PHP个人网站架设连环讲(四)

下一篇: php中文件上传的安全问题

Java8 实现stream将对象集合list中抽取属性集合转化为map或list
这篇文章主要介绍了Java8 实现stream将对象集合list中抽取属性集合转化为map或list的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-05
PHP 数据库缓存Memcache操作类
操作类就是把一些常用的一系列的数据库或相关操作写在一个类中，这样调用时我们只要调用类文件，如果要执行相关操作就直接调用类文件中的方法函数就可以实现了，下面整理了...2016-11-25
java8如何用Stream查List对象某属性是否有重复
这篇文章主要介绍了java8如何用Stream查List对象某属性是否有重复的操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教...2021-09-11
C#连接SQL数据库和查询数据功能的操作技巧
本文给大家分享C#连接SQL数据库和查询数据功能的操作技巧，本文通过图文并茂的形式给大家介绍的非常详细，需要的朋友参考下吧...2021-05-17
C#从数据库读取图片并保存的两种方法
这篇文章主要介绍了C#从数据库读取图片并保存的方法，帮助大家更好的理解和使用c#，感兴趣的朋友可以了解下...2021-01-16
解决:failed to open stream: No such file or directory in
本教程来给各位同学介绍failed to open stream: No such file or directory in解决办法，有需要了解的朋友可进入参考。 Warning: include_once(./include/main.i...2016-11-25
C#学习笔记- 随机函数Random()的用法详解
下面小编就为大家带来一篇C#学习笔记- 随机函数Random()的用法详解。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧...2020-06-25
Intellij IDEA连接Navicat数据库的方法
这篇文章主要介绍了Intellij IDEA连接Navicat数据库的方法,本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借价值，需要的朋友可以参考下...2021-03-25
c++中的system("pause")的作用和含义解析
这篇文章主要介绍了c++中system("pause")的作用和含义，非常不错，具有参考借鉴价值，需要的朋友参考下吧...2020-04-25
解决Pycharm的项目目录突然消失的问题
今天小编就为大家分享一篇解决Pycharm的项目目录突然消失的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-22
pycharm2021激活码使用教程(永久激活亲测可用)
pycharm2021激活码是一个可以轻松帮助用户免费激活pycharm2021.1软件的文件，虽然说pycharm现在只是推出了2021.1的EAP版，但是如果你想先率先体验一波，那么就可以利用小编提供的这个激活码来进行使用啦，并这个激活码是永久有效的...2021-03-30
在数据库里将毫秒转换成date格式的方法
在开发过程中，我们经常会将日期时间的毫秒数存放到数据库，但是它对应的时间看起来就十分不方便，我们可以使用一些函数将毫秒转换成date格式。一、在MySQL中，有内置的函数from_unixtime()来做相应的转换，使用如下：复制...2014-05-31
pycharm实现print输出保存到txt文件
这篇文章主要介绍了pycharm实现print输出保存到txt文件，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-02
pycharm 实现光标快速移动到括号外或行尾的操作
这篇文章主要介绍了pycharm 实现光标快速移动到括号外或行尾的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-06
超实用Internet Download Manager(IDM)破解注册码,全版本通用
IDM下载器是一个十分好用的文件下载工具。IDM下载器它能够帮助你提升5倍的下载速度，强大的续传功能，让你不再担心因网络问题、计算机宕机、停电等原因所造成的数据不全问题，下面小编给大家带来了InternetDownloadManager(IDM)破解注册码，感兴趣的朋友参考下吧...2023-01-06
C#操作本地文件及保存文件到数据库的基本方法总结
C#使用System.IO中的文件操作方法在Windows系统中处理本地文件相当顺手,这里我们还总结了在Oracle中保存文件的方法,嗯,接下来就来看看整理的C#操作本地文件及保存文件到数据库的基本方法总结...2020-06-25
如何解决局域网内mysql数据库连接慢
通过内网连另外一台机器的mysql服务，确发现速度N慢！等了大约几十秒才等到提示输入密码。但是ping mysql所在服务器却很快！想到很久之前有过类似的经验， telnet等一些服务在连接请求的时候，会做一些反向域名解析（如果...2015-10-21
vue项目页面嵌入代码块vue-prism-editor的实现
这篇文章主要介绍了vue项目页面嵌入代码块vue-prism-editor的实现,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2020-10-30
vue3如何按需加载第三方组件库详解
距离 Vue 3.0 正式版发布已经有一段时间了,关于vue3组件库相关的问题还是挺多人感兴趣的,这篇文章主要给大家介绍了关于vue3如何按需加载第三方组件库的相关资料,需要的朋友可以参考下...2021-06-02
MySQL快速复制数据库数据表的方法
某些时候，例如为了搭建一个测试环境，或者克隆一个网站，需要复制一个已存在的mysql数据库。使用以下方法，可以非常简单地实现。假设已经存在的数据库名字叫db1，想要复制一份，命名为newdb。步骤如下：1. 首先创建新的数据库newd...2015-10-21

nanomsg通信库的pubsub及survey

相关文章

阁下可能感兴趣的内容

推荐阅读