与socket网络编程有关的函数

与socket网络编程有关的函数以下内容源于网络资源的学习与整理 如有侵权请告知删除

大家好,欢迎来到IT知识分享网。

以下内容源于网络资源的学习与整理,如有侵权请告知删除。

目录

一、与服务器端有关的函数

1.1 socket函数

1.2 bind函数

1.3 listen函数

1.4 accept函数

二、与客户端有关的函数

2.1 socket函数

2.2 connect函数

三、常见通用的函数 

3.1 write函数

3.2 read函数

3.3 send函数

3.4 recv函数

3.5 htons函数

3.6 inet_addr函数


下面这些函数所涉及的头文件以及更多细节,可以利用man手册查阅,比如“man 3 recv”可以查阅recv函数(1shell,2api,3库)。

一、与服务器端有关的函数

服务器端涉及以下函数:

(1)socket函数:创建一个网络套接字,获取网络连接的文件描述符。

(2)bind函数:将服务器的端口、IP地址与socket函数创建的文件描述符绑定。

(3)listen函数:监听服务器的当前端口(其他端口不监听)。

(4)accept函数,阻塞以等待用户连接。

1.1 socket函数

函数原型

int socket(int af, int type, int protocol); //IP地址 //套接字类型 //传输协议

函数作用

此函数用来创建一个网络套接字,并确定套接字的各种属性。该函数返回一个socket的文件描述符,是int类型的整数。

参数说明

(1)af,表示IP地址类型。可取值为 AF_INET(表示IPv4 地址)、AF_INET6(表示IPv6 地址)。

(2)type,表示数据传输方式(或者说套接字类型)。可取值为 SOCK_STREAM(表示流格式套接字、面向连接的套接字)、SOCK_DGRAM(表示数据报套接字、无连接的套接字)。

(3)protocol,表示传输协议,常用选项包括 IPPROTO_TCP(表示TCP 传输协议)、IPPTOTO_UDP(表示UDP传输协议)。

补充说明

(1)socket函数在<sys/socket.h> 头文件中,调用该函数时要包含该文件。

(2)为什么需要指定protocol这个参数?

一般情况下,我们指定 af 和 type 参数就可以创建套接字了,操作系统会自动推演出协议类型(此时protocol参数的值可以设置为0),除非有两种不同的协议支持同一种地址类型和数据传输类型,此时操作系统没办法自动推演,需要指定protocol这个参数。

比如使用IPv4地址而且使用 SOCK_STREAM 传输数据的协议只有 TCP,那么操作系统会自动推导出协议类型为TCP,那么调用socket函数的方式有两种:将protocol的值设为0,或者显式地设为 IPPROTO_TCP,如下所示:

int tcp_socket = socket(AF_INET, SOCK_STREAM, 0); //或者 int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

1.2 bind函数

函数原型

int bind(int sock, struct sockaddr *addr, socklen_t addrlen); //服务器端的IP和端口信息

函数作用

此函数将(服务器端的)套接字与(服务器端的)特定的IP地址、端口绑定起来。

绑定之后,流经该IP地址、端口的数据才能交给这个套接字处理。

参数说明

(1)sock,表示(服务器端)使用socket函数创建套接字时,所返回的文件描述符。

(2)addr,表示指向(struct sockaddr 这个结构体类型所定义的、表示服务器端的)变量的指针。

(3)addrlen,表示struct sockaddr 结构体类型所定义的变量的大小,可由 sizeof() 计算得出。

代码分析

下面代码的作用,是将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定。

//创建套接字 int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP); //创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口 //将套接字和IP、端口绑定 bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr)); //这里进行数据类型强制转化

(1) struct sockaddr_in 结构体

我们来看一下struct sockaddr_in 结构体的定义:

struct sockaddr_in{ sa_family_t sin_family; //地址族(Address Family),也就是地址类型 uint16_t sin_port; //16位的端口号 struct in_addr sin_addr; //32位IP地址 char sin_zero[8]; //不使用,一般用0填充 };
  • sin_family 和 socket 函数的第一个参数的含义相同,取值也保持一致(不过它是unsigned short类型的,占两个字节,而socket 函数的第一个参数是int类型的,占4个字节)。
  • sin_prot 为端口号。uint16_t 的长度为两个字节,理论上端口号的取值范围为 0~65536,但是 0~1023 的端口一般由系统分配给特定的服务程序,例如 Web 服务的端口号为 80,FTP 服务的端口号为 21,所以我们的程序要尽量在 1024~65536 之间分配端口号。
  • sin_addr 是 struct in_addr 结构体类型的变量。
  • sin_zero[8] 是多余的8个字节,没有用,一般使用 memset() 函数填充为 0。

这里的 struct in_addr 结构体只包含一个成员,如下所示:

struct in_addr{ in_addr_t s_addr; //32位的IP地址 };

in_addr_t 在头文件 <netinet/in.h> 中定义,它等价于 unsigned long,长度为4个字节。这说明 s_addr 是一个整数,而代码中定义的IP地址是字符串“127.0.0.1”,所以上面代码中使用 inet_addr() 函数进行转换。转后serv_addr.sin_addr.s_addr =。

为什么要搞这么复杂,struct sockaddr_in结构体中嵌套struct in_addr结构体,而不用 sockaddr_in 的一个成员变量来直接指明IP地址呢?另外,socket() 函数的第一个参数已经指明了地址类型,为什么在 sockaddr_in 结构体中还要再说明一次呢?这些繁琐的细节确实给初学者带来了一定的障碍,我想,这或许是历史原因吧,后面的接口总要兼容前面的代码。

(2)struct sockaddr 结构体

上述代码先创建 struct sockaddr_in 类型变量,然后在bind()函数中强制转换为 struct sockaddr 类型。为何不直接创建 struct sockaddr 类型变量呢?毕竟bind()函数第二个参数类型就是 struct sockaddr 类型的 。

我们看一下struct sockaddr 结构体的定义:

struct sockaddr{ sa_family_t sin_family; //地址族(Address Family),也就是地址类型 char sa_data[14]; //IP地址和端口号 };

下图是 struct sockaddr 与 struct sockaddr_in 的对比(括号中的数字表示所占用的字节数):

与socket网络编程有关的函数

可见struct sockaddr 和 struct sockaddr_in 的长度相同,都是16字节,只是将IP地址和端口号合并到一起,用一个成员 sa_data 表示。要想给 sa_data 赋值,必须同时指明IP地址和端口号,例如”127.0.0.1:80“。遗憾的是,没有相关函数将这个字符串转换成需要的形式,也就很难给 sockaddr 类型的变量赋值,所以使用 sockaddr_in 来代替。这两个结构体的长度相同,强制转换类型时不会丢失字节,也没有多余的字节。

可以认为,struct sockaddr 是一种通用的结构体,可以用来保存多种类型的IP地址和端口号,但由于它使用不便,才针对不同的地址类型定义了不同的结构体,然后在使用的时候再强制类型转换。比如 struct  sockaddr_in 是专门用来保存 IPv4 地址的结构体;而struct sockaddr_in6是专门用来保存 IPv6 地址的结构体,它的定义如下:

struct sockaddr_in6 { sa_family_t sin6_family; //(2)地址类型,取值为AF_INET6 in_port_t sin6_port; //(2)16位端口号 uint32_t sin6_flowinfo; //(4)IPv6流信息 struct in6_addr sin6_addr; //(4)具体的IPv6地址 uint32_t sin6_scope_id; //(4)接口范围ID };

1.3 listen函数

函数原型

int listen(int sock, int backlog);

函数作用

该函数可以让(服务器端的)套接字进入被动监听状态。

参数说明

(1)sock,表示(服务器端的)需要进入监听状态的套接字的文件描述符。

(2)backlog,表示请求队列的最大长度。

补充说明

(1)被动监听

指当没有客户端请求时,套接字处于“睡眠”状态,只有当接收到客户端请求时,套接字才会被“唤醒”来响应请求。

(2)请求队列

当套接字正在处理客户端请求时,如果有新的请求进来,套接字是没法处理的,只能把它放进缓冲区,待当前请求处理完毕后,再从缓冲区中读取出来处理。如果不断有新的请求进来,它们就按照先后顺序在缓冲区中排队,直到缓冲区满。这个缓冲区,就称为请求队列(Request Queue)。

缓冲区的长度(能存放多少个客户端请求)可以通过 listen() 函数的 backlog 参数指定,但究竟为多少并没有什么标准,可以根据你的需求来定,并发量小的话可以是10或者20。

如果将 backlog 的值设置为 SOMAXCONN,就由系统来决定请求队列长度,这个值一般比较大,可能是几百,或者更多。

当请求队列满时,就不再接收新的请求。对于 Linux,客户端会收到 ECONNREFUSED 错误,对于 Windows,客户端会收到 WSAECONNREFUSED 错误。

(3)listen函数只是让套接字处于监听状态,并没有接收请求,接收请求需要使用 accept 函数。

1.4 accept函数

函数原型

int accept(int sock, struct sockaddr *addr, socklen_t *addrlen); //参数1:服务器端创建的套接字文件描述符 //参数2:保存了客户端的IP和端口号信息

函数作用

当(服务器端的)套接字处于监听状态时,可以通过accept函数来接收客户端请求。

如果该函数返回一个新的套接字的文件描述符,则表示服务器和客户端成功建立一个TCP连接。

参数说明

(1)sock,表示(服务器端)创建的套接字的文件描述符。

(2)addr,表示指向(struct sockaddr_in这个结构体变量所定义的、表示客户端的)变量的指针。

(3)addrlen,表示addr这个指针指向的变量所占空间大小,可由 sizeof() 求得。

补充说明

(1)该函数的第一个参数 sock 是服务器端创建的套接字的文件描述符(我们把它叫做监听fd),而该函数的返回值是一个新的套接字的文件描述符(我们把它叫做连接fd)。编写代码的时候要特别注意:服务器端和客户端通信时,服务器端要使用连接fd,不再使用监听fd。

(2)addr保存了客户端(注意不是服务器端)的IP地址和端口号。

(3)listen函数只是让套接字进入监听状态,并没有真正接收客户端请求,listen函数后面的代码会继续执行,直到遇到 accept函数。accept函数会阻塞程序执行(后面代码不能被执行),以等待客户端的连接。

二、与客户端有关的函数

客户端涉及以下函数: 

(1)socket函数:获取网络连接的文件描述符。

(2)connect函数:连接服务器。

连接上之后:

(3)send函数:客服端给服务器发送数据。

(4)recv函数:客服端接收服务器的回复。

2.1 socket函数

同1.1。

2.2 connect函数

函数原型

#include <sys/socket.h> int connect(int socket, const struct sockaddr *address, socklen_t address_len); 

函数作用

该函数在客户端和服务器端之间建立连接。

参数说明

(1)socket,表示(客户端)使用socket函数创建套接字时,所返回的文件描述符。

(2)address,表示指向(struct sockaddr_in这个结构体变量所定义的、表示服务器端的)变量的指针。

(3)address_len,表示address这个指针所指向的变量所占空间大小,可由 sizeof() 求得。

三、常见通用的函数 

Linux平台和Windows平台,对于socket,使用不同的发送函数、接收函数。Linux不区分套接字文件和普通文件,统一使用write、read函数,比如使用 write 向套接字中写入数据,使用 read 从套接字中读取数据。Windows区分普通文件和套接字,并定义了专门的接收和发送的函数,即send函数和recv函数。

学习下面内容前,先建立这样的认识:对于socket机制,它内部设置有接收缓冲区和发送缓冲区。利用 write 或者 send 函数,可以把我们想要发送给对方的内容(这些内容目前放在我们自己设置的缓冲区里,而且这个缓冲区与socket自带的接收/发送缓冲区,是不同的缓冲区),拷贝到socket的发送缓冲区中,然后它会自动完成发送;同样地,利用 read 或者 recv 函数,可以将对方发送给我们的数据,从socket的接收缓冲区中,拷贝到我们自己设置的缓冲区里)。

3.1 write函数

函数原型

#include <unistd.h> ssize_t write(int fildes, const void *buf, size_t nbyte); 

函数作用

该函数将缓冲区buf中的nbytes个字节,写入文件描述符fildes对应的文件中,成功则返回写入的字节数,失败则返回 -1。

参数说明

(1)fildes,表示要将数据写入哪个文件中(该文件所对应的文件描述符)。比如服务器要向客户端发送数据,则这里的fildes一般是accept函数返回的连接fd

(2)buf,表示待写入的数据目前存放在哪个地址。

(3)nbytes,表示要写入多少字节的数据。

3.2 read函数

函数原型

ssize_t read(int fd, void *buf, size_t nbytes);

函数作用

从文件描述符fd对应的文件中读取 nbytes 个字节,并保存到缓冲区 buf。

该函数读取成功,则返回读取到的字节数(但遇到文件结尾则返回0),读取失败则返回 -1。

参数说明

(1)fd,表示要读取的文件对应的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

(2)buf,表示要将数据读到哪个地方。

(3)nbytes,表示要读取多少字节的数据。size_t 是通过 typedef 声明的 unsigned int 类型。

3.3 send函数

函数模型

#include <sys/socket.h> ssize_t send(int socket, const void *buffer, size_t length, int flags); 

函数作用

该函数用来将信息发送到一个套接字中,即把缓冲区 buffer 中的 length 个字节写入文件描述符socket对应的文件中。

(1)ssize_t类型,相当于long。

(2)socket,表示要发送数据的套接字的文件描述符。比如服务器要向客户端发送数据,则这里的socket一般是accept函数返回的连接fd。

(3)buffer,表示要发送的消息(或者说要发送的数据目前存放在哪里)。

(4)length,表示要发送多少字节的数据。

(5)flags,该参数一般设置为 0 或 NULL,初学者不必深究。

补充说明

(1)send函数只能在套接字处于连接状态的时候才能使用,因为只有这样才知道接收者是谁。

(2)send函数与 write函数的唯一区别,在于send函数的最后一个参数。当设置flags为0时,send和wirte是同等的。

(3)当消息不适合套接字的发送缓冲区时,send通常会阻塞,除非事先将套接字设置为非阻塞的模式(那样就不会阻塞,而是返回EAGAIN或者EWOULDBLOCK错误,此时可以调用select函数来监视何时可以发送数据)。

3.4 recv函数

函数模型

#include <sys/socket.h> ssize_t recv(int socket, void *buffer, size_t length, int flags); 

函数作用

该用于从一个已连接的socket中接收信息,也就是从socket文件中拷贝信息到缓冲区buffer中,拷贝的长度是length。

参数说明

(1)socket,表示已连接套接字的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

(2)buffer,表示把接收到的数据存放在哪里。

(3)length,表示要接收多少字节的数据。

(4)flags,表示标志位,它会影响函数的行为,比如控制是否阻塞函数等等。

3.5 htons函数

函数模型

uint16_t htons(uint16_t hostshort)

函数作用

该函数用来将当前主机字节序转换为网络字节序(即转换成大端模式)。

代码示例

//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号

补充说明

(1)网络字节序是大端模式,而x86架构的cpu一般是小端模式,所以需要进行转换。

(2)htons这字母组合中,h 代表主机字节序,n 代表网络字节序,s代表short,可以理解为“将 short 型数据从当前主机字节序转换为网络字节序”。

(3)通常,以s为后缀的函数中,s代表 2 个字节 short,因此用于端口号转换;以l为后缀的函数中,l代表 4 个字节的 long,因此用于 IP 地址转换。常见的网络字节转换函数如下。

  • htons():host to network short,将 short 类型数据从主机字节序转换为网络字节序。
  • ntohs():network to host short,将 short 类型数据从网络字节序转换为主机字节序。
  • htonl():host to network long,将 long 类型数据从主机字节序转换为网络字节序。
  • ntohl():network to host long,将 long 类型数据从网络字节序转换为主机字节序。

3.6 inet_addr函数

函数原型

unsigned long inet_addr( const char *cp ) 

函数作用

该函数将字符串形式(即点分十进制形式)的IPv4地址(不能处理IPv6地址)转换成32位的长整型,同时还进行网络字节序转换。

代码示例

//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号
#include<netinet/in.h> #include<arpa/inet.h> #define IPADDR "192.168.1.102" int main(void) { int_addr_t addr = 0; //int_addr_t 是 unsigned long addr = inet_addr(IPADDR); printf("addr = 0x%x\n",addr); return 0; } // 0x66 01 a8 c0 // 102 1 168 192

补充说明

(1)为sockaddr_in成员赋值时,需要显式地将主机字节序转换为网络字节序,所以需要调用htons、inet_addr函数。而通过 write/send 发送数据时,TCP协议会自动将数据转换为网络字节序,不需要再调用相应的函数。

(2)关于inet_addr函数的内部代码是怎样的,这里不详细列出。有兴趣可以查阅手册。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/116072.html

(0)
上一篇 2024-11-18 17:33
下一篇 2024-11-18 17:45

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信