关闭后绑定的TCP本地套接字地址多长时间不可用?


13

在Linux上(我的实时服务器在RHEL 5.5上-下面的LXR链接是其中的内核版本),man 7 ip说:

除非已设置SO_REUSEADDR标志,否则已绑定的TCP本地套接字地址在关闭后的一段时间内不可用。

我没有使用SO_REUSEADDR。“一段时间”是多长时间?我如何知道它有多长时间,以及如何更改它?

我一直在仔细研究这个问题,发现了一些信息,但是从应用程序程序员的角度来看,这些信息都无法真正解释。以机智:

我遇到的困难是弥合TCP生命周期的内核模型与程序员的端口模型不可用之间的差距,即了解这些状态与“某个时间”的关系。


@Caleb:关于标签,bind也是系统调用!man 2 bind如果您不相信我,请尝试。诚然,当有人说“绑定”时,Unix并不是人们首先想到的,这是如此公平。
汤姆·安德森

我非常了解的替代用法bind,但此处的标记专门应用于DNS服务器。我们没有每个可能的系统调用的标签。
卡莱布

Answers:


14

我认为,程序无法使用套接字的想法是允许仍在传输中的任何TCP数据段到达并被内核丢弃。也就是说,应用程序可以close(2)在套接字上调用,但是路由延迟或控制数据包的意外情况,或者您可以允许TCP连接的另一端发送数据一段时间。该应用程序已表明它不再希望处理TCP数据段,因此内核应在它们进入时将其丢弃。

我用C语言破解了一个小程序,您可以编译该程序并使用它来查看超时时间:

#include <stdio.h>        /* fprintf() */
#include <string.h>       /* strerror() */
#include <errno.h>        /* errno */
#include <stdlib.h>       /* strtol() */
#include <signal.h>       /* signal() */
#include <sys/time.h>     /* struct timeval */
#include <unistd.h>       /* read(), write(), close(), gettimeofday() */
#include <sys/types.h>    /* socket() */
#include <sys/socket.h>   /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h>    /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
        int opt;
        int listen_fd = -1;
        unsigned short port = 0;
        struct sockaddr_in  serv_addr;
        struct timeval before_bind;
        struct timeval after_bind;

        while (-1 != (opt = getopt(ac, av, "p:"))) {
                switch (opt) {
                case 'p':
                        port = (unsigned short)atoi(optarg);
                        break;
                }
        }

        if (0 == port) {
                fprintf(stderr, "Need a port to listen on\n");
                return 2;
        }

        if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
                fprintf(stderr, "Opening socket: %s\n", strerror(errno));
                return 1;
        }

        memset(&serv_addr, '\0', sizeof(serv_addr));
        serv_addr.sin_family      = AF_INET;
        serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
        serv_addr.sin_port        = htons(port);

        gettimeofday(&before_bind, NULL);
        while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
                fprintf(stderr, "binding socket to port %d: %s\n",
                        ntohs(serv_addr.sin_port),
                        strerror(errno));

                sleep(1);
        }
        gettimeofday(&after_bind, NULL);
        printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));

        printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
        if (0 > listen(listen_fd, 100)) {
                fprintf(stderr, "listen() on fd %d: %s\n",
                        listen_fd,
                        strerror(errno));
                return 1;
        }

        {
                struct sockaddr_in  cli_addr;
                struct timeval before;
                int newfd;
                socklen_t clilen;

                clilen = sizeof(cli_addr);

                if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
                        fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
                        exit(2);
                }
                gettimeofday(&before, NULL);
                printf("At %ld.%06ld\tconnected to: %s\n",
                        before.tv_sec, before.tv_usec,
                        inet_ntoa(cli_addr.sin_addr)
                );
                fflush(stdout);

                while (close(newfd) == EINTR) ;
        }

        if (0 > close(listen_fd))
                fprintf(stderr, "Closing socket: %s\n", strerror(errno));

        return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
        float r = 0.0;

        if (before.tv_usec > after.tv_usec) {
                after.tv_usec += 1000000;
                --after.tv_sec;
        }

        r = (float)(after.tv_sec - before.tv_sec)
                + (1.0E-6)*(float)(after.tv_usec - before.tv_usec);

        return r;
}

当内核拒绝允许非root用户重新打开套接字时,我在3台不同的计算机上尝试了该程序,并且得到了55到59秒之间的可变时间。我将上面的代码编译为名为“ opener”的可执行文件,并按以下方式运行:

./opener -p 7896; ./opener -p 7896

我打开另一个窗口并执行以下操作:

telnet otherhost 7896

这将导致“打开器”的第一个实例接受连接,然后关闭它。“ opener”的第二个实例每秒尝试访问bind(2)TCP端口7896。“开瓶器”报告延迟55到59秒。

到处搜寻,我发现人们建议这样做:

echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout

缩短间隔时间。它对我不起作用。在我可以访问的4台linux机器中,两台有30台,两台有60台。我还将该值设置为低至10。

这样做:

echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle

确实改变了一切。第二个“开瓶器”仅用了大约3秒钟即可获得新的插槽。


3
我大致了解不可用期的目的是什么。我想知道的是Linux上的期限到底有多长,以及如何更改。Wikipedia页面上有关TCP的数字存在的问题是,它一定是一个通用值,而不是我的特定平台绝对正确的值。
汤姆·安德森

您的猜测很有趣!只需将其标记为带有标题而不是将其删除即可,它提供了搜索原因的方法!
Philippe Gachoud
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.