大家好,欢迎来到IT知识分享网。
以下内容源于网络资源的学习与整理,如有侵权请告知删除。
目录
下面这些函数所涉及的头文件以及更多细节,可以利用man手册查阅,比如“man 3 recv”可以查阅recv函数(1shell,2api,3库)。
一、与服务器端有关的函数
服务器端涉及以下函数:
(1)socket函数:创建一个网络套接字,获取网络连接的文件描述符。
(2)bind函数:将服务器的端口、IP地址与socket函数创建的文件描述符绑定。
(3)listen函数:监听服务器的当前端口(其他端口不监听)。
(4)accept函数,阻塞以等待用户连接。
1.1 socket函数
函数原型
int socket(int af, int type, int protocol); //IP地址 //套接字类型 //传输协议
函数作用
此函数用来创建一个网络套接字,并确定套接字的各种属性。该函数返回一个socket的文件描述符,是int类型的整数。
参数说明
(1)af,表示IP地址类型。可取值为 AF_INET(表示IPv4 地址)、AF_INET6(表示IPv6 地址)。
(2)type,表示数据传输方式(或者说套接字类型)。可取值为 SOCK_STREAM(表示流格式套接字、面向连接的套接字)、SOCK_DGRAM(表示数据报套接字、无连接的套接字)。
(3)protocol,表示传输协议,常用选项包括 IPPROTO_TCP(表示TCP 传输协议)、IPPTOTO_UDP(表示UDP传输协议)。
补充说明
(1)socket函数在<sys/socket.h> 头文件中,调用该函数时要包含该文件。
(2)为什么需要指定protocol这个参数?
一般情况下,我们指定 af 和 type 参数就可以创建套接字了,操作系统会自动推演出协议类型(此时protocol参数的值可以设置为0),除非有两种不同的协议支持同一种地址类型和数据传输类型,此时操作系统没办法自动推演,需要指定protocol这个参数。
比如使用IPv4地址而且使用 SOCK_STREAM 传输数据的协议只有 TCP,那么操作系统会自动推导出协议类型为TCP,那么调用socket函数的方式有两种:将protocol的值设为0,或者显式地设为 IPPROTO_TCP,如下所示:
int tcp_socket = socket(AF_INET, SOCK_STREAM, 0); //或者 int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
1.2 bind函数
函数原型
int bind(int sock, struct sockaddr *addr, socklen_t addrlen); //服务器端的IP和端口信息
函数作用
此函数将(服务器端的)套接字与(服务器端的)特定的IP地址、端口绑定起来。
绑定之后,流经该IP地址、端口的数据才能交给这个套接字处理。
参数说明
(1)sock,表示(服务器端)使用socket函数创建套接字时,所返回的文件描述符。
(2)addr,表示指向(struct sockaddr 这个结构体类型所定义的、表示服务器端的)变量的指针。
(3)addrlen,表示struct sockaddr 结构体类型所定义的变量的大小,可由 sizeof() 计算得出。
代码分析
下面代码的作用,是将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定。
//创建套接字 int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP); //创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口 //将套接字和IP、端口绑定 bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr)); //这里进行数据类型强制转化
(1) struct sockaddr_in 结构体
我们来看一下struct sockaddr_in 结构体的定义:
struct sockaddr_in{ sa_family_t sin_family; //地址族(Address Family),也就是地址类型 uint16_t sin_port; //16位的端口号 struct in_addr sin_addr; //32位IP地址 char sin_zero[8]; //不使用,一般用0填充 };
- sin_family 和 socket 函数的第一个参数的含义相同,取值也保持一致(不过它是unsigned short类型的,占两个字节,而socket 函数的第一个参数是int类型的,占4个字节)。
- sin_prot 为端口号。uint16_t 的长度为两个字节,理论上端口号的取值范围为 0~65536,但是 0~1023 的端口一般由系统分配给特定的服务程序,例如 Web 服务的端口号为 80,FTP 服务的端口号为 21,所以我们的程序要尽量在 1024~65536 之间分配端口号。
- sin_addr 是 struct in_addr 结构体类型的变量。
- sin_zero[8] 是多余的8个字节,没有用,一般使用 memset() 函数填充为 0。
这里的 struct in_addr 结构体只包含一个成员,如下所示:
struct in_addr{ in_addr_t s_addr; //32位的IP地址 };
in_addr_t 在头文件 <netinet/in.h> 中定义,它等价于 unsigned long,长度为4个字节。这说明 s_addr 是一个整数,而代码中定义的IP地址是字符串“127.0.0.1”,所以上面代码中使用 inet_addr() 函数进行转换。转后serv_addr.sin_addr.s_addr =。
为什么要搞这么复杂,struct sockaddr_in结构体中嵌套struct in_addr结构体,而不用 sockaddr_in 的一个成员变量来直接指明IP地址呢?另外,socket() 函数的第一个参数已经指明了地址类型,为什么在 sockaddr_in 结构体中还要再说明一次呢?这些繁琐的细节确实给初学者带来了一定的障碍,我想,这或许是历史原因吧,后面的接口总要兼容前面的代码。
(2)struct sockaddr 结构体
上述代码先创建 struct sockaddr_in 类型变量,然后在bind()函数中强制转换为 struct sockaddr 类型。为何不直接创建 struct sockaddr 类型变量呢?毕竟bind()函数第二个参数类型就是 struct sockaddr 类型的 。
我们看一下struct sockaddr 结构体的定义:
struct sockaddr{ sa_family_t sin_family; //地址族(Address Family),也就是地址类型 char sa_data[14]; //IP地址和端口号 };
下图是 struct sockaddr 与 struct sockaddr_in 的对比(括号中的数字表示所占用的字节数):
可见struct sockaddr 和 struct sockaddr_in 的长度相同,都是16字节,只是将IP地址和端口号合并到一起,用一个成员 sa_data 表示。要想给 sa_data 赋值,必须同时指明IP地址和端口号,例如”127.0.0.1:80“。遗憾的是,没有相关函数将这个字符串转换成需要的形式,也就很难给 sockaddr 类型的变量赋值,所以使用 sockaddr_in 来代替。这两个结构体的长度相同,强制转换类型时不会丢失字节,也没有多余的字节。
可以认为,struct sockaddr 是一种通用的结构体,可以用来保存多种类型的IP地址和端口号,但由于它使用不便,才针对不同的地址类型定义了不同的结构体,然后在使用的时候再强制类型转换。比如 struct sockaddr_in 是专门用来保存 IPv4 地址的结构体;而struct sockaddr_in6是专门用来保存 IPv6 地址的结构体,它的定义如下:
struct sockaddr_in6 { sa_family_t sin6_family; //(2)地址类型,取值为AF_INET6 in_port_t sin6_port; //(2)16位端口号 uint32_t sin6_flowinfo; //(4)IPv6流信息 struct in6_addr sin6_addr; //(4)具体的IPv6地址 uint32_t sin6_scope_id; //(4)接口范围ID };
1.3 listen函数
函数原型
int listen(int sock, int backlog);
函数作用
该函数可以让(服务器端的)套接字进入被动监听状态。
参数说明
(1)sock,表示(服务器端的)需要进入监听状态的套接字的文件描述符。
(2)backlog,表示请求队列的最大长度。
补充说明
(1)被动监听
指当没有客户端请求时,套接字处于“睡眠”状态,只有当接收到客户端请求时,套接字才会被“唤醒”来响应请求。
(2)请求队列
当套接字正在处理客户端请求时,如果有新的请求进来,套接字是没法处理的,只能把它放进缓冲区,待当前请求处理完毕后,再从缓冲区中读取出来处理。如果不断有新的请求进来,它们就按照先后顺序在缓冲区中排队,直到缓冲区满。这个缓冲区,就称为请求队列(Request Queue)。
缓冲区的长度(能存放多少个客户端请求)可以通过 listen() 函数的 backlog 参数指定,但究竟为多少并没有什么标准,可以根据你的需求来定,并发量小的话可以是10或者20。
如果将 backlog 的值设置为 SOMAXCONN,就由系统来决定请求队列长度,这个值一般比较大,可能是几百,或者更多。
当请求队列满时,就不再接收新的请求。对于 Linux,客户端会收到 ECONNREFUSED 错误,对于 Windows,客户端会收到 WSAECONNREFUSED 错误。
(3)listen函数只是让套接字处于监听状态,并没有接收请求,接收请求需要使用 accept 函数。
1.4 accept函数
函数原型
int accept(int sock, struct sockaddr *addr, socklen_t *addrlen); //参数1:服务器端创建的套接字文件描述符 //参数2:保存了客户端的IP和端口号信息
函数作用
当(服务器端的)套接字处于监听状态时,可以通过accept函数来接收客户端请求。
如果该函数返回一个新的套接字的文件描述符,则表示服务器和客户端成功建立一个TCP连接。
参数说明
(1)sock,表示(服务器端)创建的套接字的文件描述符。
(2)addr,表示指向(struct sockaddr_in这个结构体变量所定义的、表示客户端的)变量的指针。
(3)addrlen,表示addr这个指针指向的变量所占空间大小,可由 sizeof() 求得。
补充说明
(1)该函数的第一个参数 sock 是服务器端创建的套接字的文件描述符(我们把它叫做监听fd),而该函数的返回值是一个新的套接字的文件描述符(我们把它叫做连接fd)。编写代码的时候要特别注意:服务器端和客户端通信时,服务器端要使用连接fd,不再使用监听fd。
(2)addr保存了客户端(注意不是服务器端)的IP地址和端口号。
(3)listen函数只是让套接字进入监听状态,并没有真正接收客户端请求,listen函数后面的代码会继续执行,直到遇到 accept函数。accept函数会阻塞程序执行(后面代码不能被执行),以等待客户端的连接。
二、与客户端有关的函数
客户端涉及以下函数:
(1)socket函数:获取网络连接的文件描述符。
(2)connect函数:连接服务器。
连接上之后:
(3)send函数:客服端给服务器发送数据。
(4)recv函数:客服端接收服务器的回复。
2.1 socket函数
同1.1。
2.2 connect函数
函数原型
#include <sys/socket.h> int connect(int socket, const struct sockaddr *address, socklen_t address_len);
函数作用
该函数在客户端和服务器端之间建立连接。
参数说明
(1)socket,表示(客户端)使用socket函数创建套接字时,所返回的文件描述符。
(2)address,表示指向(struct sockaddr_in这个结构体变量所定义的、表示服务器端的)变量的指针。
(3)address_len,表示address这个指针所指向的变量所占空间大小,可由 sizeof() 求得。
三、常见通用的函数
Linux平台和Windows平台,对于socket,使用不同的发送函数、接收函数。Linux不区分套接字文件和普通文件,统一使用write、read函数,比如使用 write 向套接字中写入数据,使用 read 从套接字中读取数据。Windows区分普通文件和套接字,并定义了专门的接收和发送的函数,即send函数和recv函数。
学习下面内容前,先建立这样的认识:对于socket机制,它内部设置有接收缓冲区和发送缓冲区。利用 write 或者 send 函数,可以把我们想要发送给对方的内容(这些内容目前放在我们自己设置的缓冲区里,而且这个缓冲区与socket自带的接收/发送缓冲区,是不同的缓冲区),拷贝到socket的发送缓冲区中,然后它会自动完成发送;同样地,利用 read 或者 recv 函数,可以将对方发送给我们的数据,从socket的接收缓冲区中,拷贝到我们自己设置的缓冲区里)。
3.1 write函数
函数原型
#include <unistd.h> ssize_t write(int fildes, const void *buf, size_t nbyte);
函数作用
该函数将缓冲区buf中的nbytes个字节,写入文件描述符fildes对应的文件中,成功则返回写入的字节数,失败则返回 -1。
参数说明
(1)fildes,表示要将数据写入哪个文件中(该文件所对应的文件描述符)。比如服务器要向客户端发送数据,则这里的fildes一般是accept函数返回的连接fd。
(2)buf,表示待写入的数据目前存放在哪个地址。
(3)nbytes,表示要写入多少字节的数据。
3.2 read函数
函数原型
ssize_t read(int fd, void *buf, size_t nbytes);
函数作用
从文件描述符fd对应的文件中读取 nbytes 个字节,并保存到缓冲区 buf。
该函数读取成功,则返回读取到的字节数(但遇到文件结尾则返回0),读取失败则返回 -1。
参数说明
(1)fd,表示要读取的文件对应的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。
(2)buf,表示要将数据读到哪个地方。
(3)nbytes,表示要读取多少字节的数据。size_t 是通过 typedef 声明的 unsigned int 类型。
3.3 send函数
函数模型
#include <sys/socket.h> ssize_t send(int socket, const void *buffer, size_t length, int flags);
函数作用
该函数用来将信息发送到一个套接字中,即把缓冲区 buffer 中的 length 个字节写入文件描述符socket对应的文件中。
(1)ssize_t类型,相当于long。
(2)socket,表示要发送数据的套接字的文件描述符。比如服务器要向客户端发送数据,则这里的socket一般是accept函数返回的连接fd。
(3)buffer,表示要发送的消息(或者说要发送的数据目前存放在哪里)。
(4)length,表示要发送多少字节的数据。
(5)flags,该参数一般设置为 0 或 NULL,初学者不必深究。
补充说明
(1)send函数只能在套接字处于连接状态的时候才能使用,因为只有这样才知道接收者是谁。
(2)send函数与 write函数的唯一区别,在于send函数的最后一个参数。当设置flags为0时,send和wirte是同等的。
(3)当消息不适合套接字的发送缓冲区时,send通常会阻塞,除非事先将套接字设置为非阻塞的模式(那样就不会阻塞,而是返回EAGAIN或者EWOULDBLOCK错误,此时可以调用select函数来监视何时可以发送数据)。
3.4 recv函数
函数模型
#include <sys/socket.h> ssize_t recv(int socket, void *buffer, size_t length, int flags);
函数作用
该用于从一个已连接的socket中接收信息,也就是从socket文件中拷贝信息到缓冲区buffer中,拷贝的长度是length。
参数说明
(1)socket,表示已连接套接字的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。
(2)buffer,表示把接收到的数据存放在哪里。
(3)length,表示要接收多少字节的数据。
(4)flags,表示标志位,它会影响函数的行为,比如控制是否阻塞函数等等。
3.5 htons函数
函数模型
uint16_t htons(uint16_t hostshort)
函数作用
该函数用来将当前主机字节序转换为网络字节序(即转换成大端模式)。
代码示例
//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号
补充说明
(1)网络字节序是大端模式,而x86架构的cpu一般是小端模式,所以需要进行转换。
(2)htons这字母组合中,h 代表主机字节序,n 代表网络字节序,s代表short,可以理解为“将 short 型数据从当前主机字节序转换为网络字节序”。
(3)通常,以s为后缀的函数中,s代表 2 个字节 short,因此用于端口号转换;以l为后缀的函数中,l代表 4 个字节的 long,因此用于 IP 地址转换。常见的网络字节转换函数如下。
- htons():host to network short,将 short 类型数据从主机字节序转换为网络字节序。
- ntohs():network to host short,将 short 类型数据从网络字节序转换为主机字节序。
- htonl():host to network long,将 long 类型数据从主机字节序转换为网络字节序。
- ntohl():network to host long,将 long 类型数据从网络字节序转换为主机字节序。
3.6 inet_addr函数
函数原型
unsigned long inet_addr( const char *cp )
函数作用
该函数将字符串形式(即点分十进制形式)的IPv4地址(不能处理IPv6地址)转换成32位的长整型,同时还进行网络字节序转换。
代码示例
//创建sockaddr_in结构体变量 struct sockaddr_in serv_addr; memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充 serv_addr.sin_family = AF_INET; //使用IPv4地址 serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址 serv_addr.sin_port = htons(1234); //端口号
#include<netinet/in.h> #include<arpa/inet.h> #define IPADDR "192.168.1.102" int main(void) { int_addr_t addr = 0; //int_addr_t 是 unsigned long addr = inet_addr(IPADDR); printf("addr = 0x%x\n",addr); return 0; } // 0x66 01 a8 c0 // 102 1 168 192
补充说明
(1)为sockaddr_in成员赋值时,需要显式地将主机字节序转换为网络字节序,所以需要调用htons、inet_addr函数。而通过 write/send 发送数据时,TCP协议会自动将数据转换为网络字节序,不需要再调用相应的函数。
(2)关于inet_addr函数的内部代码是怎样的,这里不详细列出。有兴趣可以查阅手册。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/116072.html