Farlanki

Unix下关于套接字的一些细节

字数统计: 1.6k阅读时长: 5 min
2017/07/04 Share

socket方法

1
int  socket(int protofamily, int type, int protocol);

sockfd是描述符。

socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。

返回值:

  • 套接字描述符

正如可以给fopen的传入不同参数值,以打开不同的文件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket函数的三个参数分别为:

  • protofamily:即协议域,又称为协议族(family)。常用的协议族有,AF_INET(IPV4)、AF_INET6(IPV6)、AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
  • type:指定socket类型。常用的socket类型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等(socket的类型有哪些?)。
  • protocol:故名思意,就是指定协议。常用的协议有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议(这个协议我将会单独开篇讨论!)。

当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect()、listen()时系统会自动随机分配一个端口。

bind方法

1
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

返回值:

  • 若成功,返回0;若失败,返回-1

参数:

  • sockfd:socket描述字
  • addr:一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。
  • addrlen : 地址的长度

通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。

listen方法

1
int listen(int sockfd, int backlog);

服务器调用listen函数来宣告他愿意接受连接请求。

返回值:

  • 若成功,返回0;若失败,返回-1

参数:

  • sockfd:套接字描述符
  • backlog:要进入队列的未完成连接请求数量。一旦队列满,系统就会拒绝多余的连接请求。

accept方法

accept()函数:

1
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
  • 返回值:返回的文件描述符是套接字描述符
  • 参数:
    • sockfd为socket描述符
    • addr是一个结果参数,它用来接受一个返回值,这返回值指定客户端的地址,当然这个地址是通过某个地址结构来描述的,用户应该知道这一个什么样的地址结构。如果对客户的地址不感兴趣,那么可以把这个值设置为NULL
    • len也是结果的参数,用来接受上述addr的结构的大小的,它指明addr结构所占有的字节个数。同样的,它也可以被设置为NULL
      accept默认会阻塞进程,直到有一个客户连接建立后返回,它返回的是一个新可用的套接字,这个套接字是连接套接字。

#connect方法#

1
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

返回值:

  • 若成功,返回0;若失败,返回-1

参数:

  • sockfd为socket描述符
  • addr为我们想与之通信的服务器的地址
  • len为地址长度

connect一般由客户端调用,客户端通过调用connect函数来建立与TCP服务器的连接。

监听socket和连接socket

  • 在服务器调用int listen(int sockfd,int backlog)方法后,参数中sockfd相应的socket被称为监听socket。
  • 在服务器调用int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen)方法后返回的套接字描述符所对应的socket被称为连接socket。

一般来说,监听socket被绑定在80端口,连接socket使用的也是80端口,而连接socket记录了客户端的地址和端口,系统因此可以由此识别连接socket和监听socket,或者数个不同的连接socket。

三次握手与socket

既然套接字是通信端口的抽象,而TCP/IP协议在网络通讯中被大规模应用,那么在我们使用和socket相关的方法的时候,究竟什么时候体现了TCP/IP协议呢,例如,三次握手在抽象的socket中是怎样被实现的呢?


上面这张图介绍了Unix下各个相关的方法在三次握手时的作用。

流程

  1. 服务器调用listen方法,调用后监听socket的状态变为LISTEN
  2. 服务器调用accept方法,之后accept方法会休眠,直到协议层(protocol layer)将其唤醒。
  3. 客户端调用connect方法,在此方法中传输SYN数据包,调用后客户端的socket状态变为SYN_SENT,之后connect方法会休眠,直到协议层将其唤醒。
  4. 服务器收到SYN数据包后会引发一个软中断,经过一系列系统调用后,服务器端的socket状态变为SYN_RCVD,该 SYN 连接信息保存在相应监听socket的半连接队列里。之后发送SYN ACK数据包。此时accept函数仍未返回。
  5. 客户端收到SYN ACK数据包,引起软中断,connect方法终止休眠,客户端的socket状态变为established,并向服务器发送ACK数据包。
    6.服务器收到ACK数据包,服务器的socket状态变为establishedaccept方法返回。

由此可见,TCP/IP协议的三次握手就隐藏在客户端和服务端的各个调用中。

参考资料

CATALOG
  1. 1. socket方法
  2. 2. bind方法
  3. 3. listen方法
  4. 4. accept方法
  5. 5. 监听socket和连接socket
  6. 6. 三次握手与socket
    1. 6.1. 流程
    2. 6.2. 参考资料