websocket实现原理,网络socket编程

目录socket编程基本概念编程过程socket函数协议TCPUDPDNSHTTPHTTPS

套接字编程的基本概念

套接字编程是一种计算机网络编程，目的是允许两台主机远程连接，连接两者至少需要一个信息发送端和一个信息接收端，因此目前大多数套接字编程形成s架构客户端[客户端] /服务器[服务端] ]，最典型的APP应用程序是web服务器/客户端

在Unix/Linux上，执行任何形式的I/O操作(如网络连接)时都会读取或写入文件描述符，但在Windows上称为文件句柄，其本质都是一个，但Windows

套接字是抽象层，程序发送和接收数据。可以使用套接字将程序置于网络中，以便打开句柄并将数据写入存储器，然后与同一网络上的其他计算机进行通信。

这里发生了问题。如果在主机内部的APP应用程序之间进行通信，并且不同的APP应用程序可以将进程号用作唯一标识符，那么在网间通信中使用什么作为唯一标识符呢？实际上，TCP/IP协议群集已经解决了问题，网络层的IP地址可以用作网络中主机的唯一标识符，传输层的“协议端口”可以用作主机APP应用的唯一标识符，因此可以利用识别网络APP应用程序，网络APP应用程序之间可以以三组为标记与其他APP应用程序进行交互，套接字通信大致如下：

如图所示，APP应用程序过程的网络之间的通信都是通过套接字与基础协议进行交互，进行网络通信，但是套接字没有层的概念，只是设计模式(软件抽象层)，编程是

由于编程套接字编程的基础实现基于TCP和UDP，因此其编程流程也围绕这两种协议的客户端、服务端进行。大致流程如下图所示。

套接字函数使用许多接口函数来实现上述功能。本节详细介绍了这些接口函数。

1、插座()。

此函数的作用是为套接字创建操作对象。它用作套接字描述符的唯一标识符(相当于文件描述符)，在本地可以使用此对象执行文件操作，如果主机远程连接，则可以用于建立连接和发送数据。

2、bind () )。

这是一个特定于服务器端的接口函数，它将套接字对象与服务器的IP地址、开放端口联系起来，并通过调用listen () )提供服务，客户端现在可以连接到服务器。但是，客户端没有绑定地址和端口。因为客户端不需要开始监听，并且系统在客户端调用connect ) )时随机生成。

3、listen () )。

它还是服务器端特有的接口函数，负责监听是否从一个端口发送来数据。函数运行时为bind ) )调用函数以获取中的套接字、地址和端口信息。收到此套接字描述符、自身服务器地址和到此端口的监听连接后，它将通过并开始建立连接。

4、连接()。

此函数接口特定于TCP客户端，用于请求与服务器建立连接。在connect ()参数中输入目标服务器的地址和端口后，将向目标发送连接请求，在服务端收到请求后，将调用accept ) )自动启动三次握手并建立连接。

5、accept ()。

此函数接口特定于TCP服务端，当listen ()接收到请求时，它将调用此函数建立连接。也就是说，如果此函数成功运行，则与客户端的连接将完成，并且数据可以相互传输。

6、recv (、recvfrom ) )。

这两个函数接口用于接收数据，recv (方法对应于TCP数据流，recvfrom )对应于UDP数据流。由于TCP是面向连接的，UDP在传输数据时不会创建连接，因此可以分为两种方式接收数据。

7、发送(、发送到) )。

与第六个函数接口类似，只是用于发送数据的与recv ()、recvfrom )一起实现了网络中不同进程之间的通信。其中，send ) )支持TCP的传输方式，sendto ) )支持UDP的传输方式。

8、读取(、写入) )。

这两个函数实际上是通用的I/O读写操作，可以用于读写本地文件。当然，也可以用于网络间的读写操作。

9、close () )

客户端与服务端建立连接并完成业务后，关闭相应的套接字描述符以节约系统资源。 close ) )调用后，套接字描述符的引用数-1在相应的调用进程中不再可用，但只有当引用数=0时，TCP客户端才会向服务端发出连接终止请求。

OSI层模型是必不可少的，因为协议通过基本协议传递信息。

这里详细介绍了许多文章，但只介绍套接字编程中使用的协议。

TCP TCP协议是基于面向连接、可靠的字节流的传输层通信协议，专门为在互联网上提供可靠的端到端字节流而设计。因此，TCP协议中有数据切片、到达确认、超时重发、滑动窗口、失序处理、重复处理、数量等规定

据校验。
作为可靠传输的一种协议，它有以下特点：
1.基于流的方式
2.面向连接
3.网络不佳时尽量降低系统由于重传带来的带宽开销
4.连接维护面向通信的两个端点
在连接上，因为是可靠的，所以在建立连接的时候会进行三次握手，断开连接的时候则会进行四次挥手，在 socket 编程中体现如下：

在 socket 编程中，因为可靠性，TCP 是用的最多的连接协议，就连 http 协议也是基于 TCP 的。
当两台主机要建立 TCP 连接时，客户端要向服务端发送 SYN 包发起连接请求，服务端收到 SYN 包后获取到客户端地址然后响应一个 SYN+ACK 包进行确认，表示接受连接，客户端收到这个确认包后也会返回一个用于确认的 ACK，到这里连接就建立完成了，接下来就可以传输数据了；
如图所示，TCP 为了保证可靠性和降低开销，每次传输的数据是分片传输的，第一个分片会告诉服务端这一次有多少个分片要传输，传输序号为最后一个的分片则会告诉服务端数据传输完毕，服务端每接收一次数据包就会响应一个 ACK 确认，反过来也一样；
在断开连接的时候则要经过四次挥手，断开连接的发起方可以是客户端也可以是服务端，其中一方发送 FIN+ACK 包告诉另一端数据传输完毕，询问是否能够断开连接，另一端收到后响应一个 ACK ，如果数据未接收完成，则通过这个 ACK 告诉对方未接收完成，暂时不要断开连。若数据传输完毕，则会发送 FIN 给信息发送方，告诉对方数据接收完成，准备好关闭连接了，另一端接收到 FIN 包后响应一个 ACK，同时状态变成 TIME_WAIT，接收方收到 ACK 确认后就断开连接，发送端等待 2msl 后若没收到接收端新的信息也会断开连接。
上面的原理看起来很复杂，但是在 socket 层面就简化了很多，双方在连接前都要先建立好套接字，服务端还要开启监听，准备工作就完成了。客户端用 connect() 向服务端发起连接请求，服务端监听到请求后用 accept() 建立连接，这样三次握手就完成了；接下来连接双方都可以用 recv() 方法和 send() 方法进行数据的收发；数据传输完成后直接调用 close() 方法就可以完成四次挥手从而断开连接。

UDP

UDP 协议和 TCP 一样用来处理数据包，并且都位于传输层，不同的是 UDP 提供面向事务的简单不可靠信息传送服务，也就是说 UDP 协议的数据包发送后是没法知道是否安全、完整到达的，而且也不提供向 TCP 那样分片、重传、确认等功能，但是有个优点就是传输性能比 TCP 要高很多，毕竟不用分配资源去保证可靠性。因此在一些条件下 UDP 传输会更加实用。
在 socket 编程中，用 UDP 协议传输数据也非常简单，客户端和服务端双方分别绑定套接字，服务端开始监听，客户端用 sendto() 直接发送数据，然后调用 close() 关闭数据出口，服务端则用 recvfrom() 接收；一次 UDP 数据传输就结束了。虽然 UDP 传输非常节省资源，但是会存在各种问题，因此在编程的时候要注意：一个 UDP 包允许报文长度 <512 字节，而 TCP 报文允许 >512 字节。

DNS

DNS 协议即地址解析协议，作用是将域名和 IP 地址互相转换，因为是基于 TCP、UDP 协议工作的，因此可以通过 socket 编程来实现其中的一些功能。在这之前我们先简单了解一下 DNS：
首先，DNS（域名系统）是一个分布式数据库，被用来维护系统内每个主机名和 IP 的对应关系，用户输入域名时会自动查询 DNS 服务器，由服务器检索数据库，返回相应的 IP 地址；
如果指定的 DNS 服务器没有记录，则会向上一层次的 DNS 服务器发起查找请求，各逻辑的树形结构（域名空间结构）如下图：

在解析请求时，如果本地（hosts文件）没有目标信息，就会去询问其他 DNS 服务器，这个过程是逐级提交的，其由高到低的层次划分可以分为下面几大类：

分类作用根域名服务器最高层次的域名服务器，全世界仅13台，负责管理顶级域名顶级域名服务器负责管理在该顶级域名服务器下注册的二级子域权威域名服务器负责一个区的域名解析工作本地域名服务器当主机发起DNS查询请求时第一个查询的对象，一般为主机hosts文件/本地DNS服务器

当其他 DNS 服务器返回查询结果时，该 DNS 服务器会把结果记录在本地缓存中，成为 DNS 缓存。
查询方式分为两种：
1.递归查询：在该模式下 DNS 服务器接收到客户机请求，必须使用一个准确的查询结果回复客户机。如果 DNS 服务器本地没有存储查询 DNS 信息，那么该服务器会询问其他服务器，并将返回的查询结果提交给客户机；
2.迭代查询：当客户机发送查询请求时，DNS 服务器并不直接回复查询结果，而是告诉客户机另一台 DNS 服务器地址，客户机再向这台 DNS 服务器提交请求，依次循环直到返回查询的结果为止。
基于这些理论，我们可以利用 socket 构造 DNS 查询请求，甚至可以把连接产生的 TCP 流量封装到 DNS 查询里，实现内网穿透。

HTTP

HTTP 协议（超文本传输协议）是现在互联网中最常用的一种网络协议，是一个标准的请求-应答模型（B/S），也就是说通信过程永远都是客户端发起请求，服务器返回响应信息，当然，也是基于 TCP 协议进行通信的。在客户机与服务器建立连接后，浏览器可以向 web 服务器发送请求并显示收到的网页，当用户在浏览器地址栏中输入一个 URL 时就会向 web 服务器发出 HTTP 请求，信息包括请求修饰符、客户端信息、提交的数据等，web 服务器接收到请求后对其进行处理并响应，响应的内容包括响应状态码、协议版本、服务器的部分信息、实体信息等，这些内容以 HTTP 规定的格式送回给客户端浏览器，浏览器对其进行显示。另外，HTTP 协议是无状态协议，即对事务处理没有记忆能力，在服务器不需要先前信息时应答速度就会很快。
在 socket 编程中也遵循这个模型，分为客户端、服务端，客户端可以构造请求，发送数据给服务器，服务端可以发布静态/动态资源，供客户端获取，或者提供 I/O 接口，进行数据交互，也可以通过连接数据库，实现数据存储、查询等功能。
其工作流程如下：
1.浏览器根据域名解析 IP 地址；
2.客户端通过浏览器与 web 服务器建立一个 TCP 连接；
3.客户端向服务端发起请求；
4.服务端响应客户端的 HTTP 请求，返回 html 代码；
5.客户端解析 html 代码，请求资源；
6.资源下载完毕后关闭 TCP 连接，浏览器对页面进行渲染然后呈现给用户。
客户端根据服务器的设置发起的请求有很多种，下面列出一些常见的请求方式：

方法作用GET申请获取资源POST客户端向服务器提交数据的方法HEAD申请获取响应的头部信息PUT用于上传资源DELETE用于删除资源TRACE用于返回原始请求内容，可用来查看中间服务器对http请求的影响OPTIONS用于查看服务器对特定URL都支持哪些请求CONNECT用于代理服务器，可把请求的连接转换成隧道PATCH对资源做部分修改

每次请求的请求头都会附加一些信息，补充了请求的附加内容、客户端信息、相应内容相关优先级信息，下面是一些常见的请求头信息：

头部字段名说明Accept用户代理可处理的媒体类型Accept-Charset优先的字符集Accept-Encoding优先的内容编码Accept-Language优先的语言Authorizationweb认证信息Expect期待服务器的特定行为From用户邮箱地址Host请求资源所在的服务器Proxy-Authorization代理服务器要求客户端的认证信息Range实体的字节范围请求Referer对请求中uri的原始获取方式TE传输编码优先级User-Agent浏览器信息

而响应头则补充了资源内容更新时间等与实体有关的信息

头部字段名说明Accept-Ranges是否接收字节范围的请求Age资源创建时间ETag资源匹配信息Location让客户端重定向到某uriProxy-Authenticate代理服务器对客户端的认证信息Retry-After对再次请求的发起时机要求Server服务器的banner信息Vary代理缓存的管理信息WW-Authenticate服务器对客户端的认证信息

实体资源的头部：

头部字段名说明Allow资源可支持的http方法Content-Encoding适用的编码方式Content-Language优先语言Content-Length网页资源的大小Content-Location替代对应资源的uriContent-MD5资源的md5值Content-Range资源的位置范围Content-Type接收的数据格式类型Expires资源过期的时间Last-Modified资源最后修改日期

除了上面的特征头部字段，还有通用的头部字段：

头部字段名说明Cache-Control进行缓存操作的工作机制Connection控制不在转发给代理的首部字段，管理持久连接Date创建报文的时间Pragma编译报文指令Transfer-Encoding指定主体传输的编码方式Upgrade用于检测HTTP及其他协议是否可使用更高的版本进行通信Via代理相关信息Warning报错通知HTTPS

HTTPS 是加密的 HTTP 通道，因为 HTTP 传输是明文的，存在信息泄露的风险，因此HTTPS就是在这基础上通过传输加密和身份认证保证了传输过程的安全性。
HTTPS 其实并不是应用层的新协议，而是在 http 接口通过 SSL、TLS 来加密和认证的机制，其加密过程如下：
1.客户端和服务器进行握手请求（https的握手）
2.协商加密算法
（客户端告诉服务器自己支持多少种加密组合，一个组合里面有对称、非对称、hash、密钥交换算法，服务器选择自己支持的加密强度最高的一种）
3.服务器发公钥证书给客户端
4.客户端收到后在本地进行证书匹配（验证）
（本地有根证书能解开的就说明这个公钥是那个根证书的公司签名的，没有能解开的就是不受信任的）
5.客户端收到后在本地随机生成对称密钥（本次会话结束失效）
6.客户端把生成的对称密钥用服务器给的公钥加密发给服务器
7.服务器拿到用自己公钥加密的密文后用私钥解开，取得内容
开始传输数据（两边都有加密密钥）
8.客户端把加密的信息和对应的hash值、加了密的hash值发给服务器
（明文信息用对称密钥加密，然后做hash计算，生成固定长度的hash值，用得到的公钥证书里的公钥对这个hash进行加密，生成hash值（给hash加密））
9.服务器拿到这3部分信息后，用自己的私钥解开由自己公钥加了密的hash值，和客户端发的对应的hash值做比较，如果相同就表示没被篡改，再用客户端发的对称密钥解开加密的信息，再做hash计算，计算出的hash值和对应的hash值做比较，相同的话表示数据完整性没被破坏（身份验证）
10.服务器开始接收数据
在 socket 编程中也是可以实现 https，只是除了基本的 http 模块外还需要导入 SSL 相关的模块，编程的流程大致如下：

如果有不对的地方，还请各位大佬指出 ^ _ ^

相关文章：
多线程编程概念
Golang socket 编程
Python socket 编程
PHP socket 编程
Java socket 编程