【网络原理】Udp报文结构,保姆级详解,建议收藏

news/2024/10/4 0:19:24 标签: 网络, udp, 网络协议, java, 网络编程, 网络安全, python

 💐个人主页:初晴~

📚相关专栏:计算机网络那些事


一、UDP报文格式

可以看出UDP报文主要由报头正文两部分构成,报头存储了此次报文的一些重要信息,而正文才是真正需要传输的内容。本篇文章就主要来介绍一下UDP报头的组成与作用了。

二、UDP报头的结构与作用

我们可以看到报头又被分为了源端口目的端口长度校验和四个部分,每个部分各占 16 个比特也就是 2 个字节,故UDP报头的总长度就为固定8 个字节

注意:

UDP报头的各字段的长度与作用是规定好的,我们作为普通程序员是没有权限修改的,换句话说,我们就算单方面修改了协议,由于其他人遵守的是官方协议,将会导致我们写的报文无法被其它人正确解读。因此,为了能正常地传输与解读数据,这里的这些协议细节我们一定要严格遵守

接下来我们就来深入解读一下这几个字段的作用与注意事项吧:

(1)源端口与目的端口

网络通讯中,涉及到四个关键信息:

源IP、目的IP

源端口、目的端口

类比于寄快递时,一个快递单上也至少需要四个关键信息:

发件人地址、收件人地址

发件人电话、收件人电话

简单来说,这几个参数就像是网络通信中的“快递单”,起到了一个定位的作用,在庞大的互联网中确定了此次通信中的起始地目的地

在同一时刻,一个主机中的某一端口号只会映射一个进程,因此就可以通过端口号定位到对应的服务端/客户端的进程了。

值得注意的是一个端口号的长度为16比特(bit),也就是2个字节(byte),因此报头中的 源端口 与 目的端口 直接记录对应的端口号即可,不需要做过多的处理

(2)报文长度

报文长度=报头长度+载荷(正文)长度

它就是用来记录此次报文的总长度,让程序根据长度来对报文进行划分,进而能够正确地进行解读。

不过,值得注意的是,这里存储报文长度的空间只有2个字节,什么概念呢?就是代表整个报文的长度最多也只有64KB

这主要还是历史遗留性问题。UDP协议是在30多年前提出的,在当时,64KB已经是一个非常大的数据量了。不过那时候的开发者肯定想象不到在短短30年后的今天,随便拍张照片都是MB级别的了,64KB就完全不够看得了。

但如果我们就是要传输一个很大的数据该怎么办呢?

有两种方案:

<1>方案一

将一个大的数据包拆分成多个小的,再分别进行传输,接收方再通过组包最终获取到数据

但这个方案实施起来将会非常复杂。首先,数据的拆分与组合本身就十分复杂,再加上网络传输过程中充满了不确定性,数据包到达的先后顺序,甚至数据包是否能到达(丢包问题)都是无法确定的,这会导致接收方的组包操作将会变的异常复杂,就算真的可以处理,消耗的时间也是非常长的,这对于“时间就是金钱”网络传输是十分致命的。

因此,我们一般不会采用这个方案

<2>方案二

选用别的适合传输大数据量的协议,比如大名鼎鼎的TCP协议

TCP协议对于长度没有任何限制,并且还带有可靠传输等机制,保障了传输的稳定性,通信质量也比较高。

小结

UDP报文的可传输的最大数据量比较小,实在要传输大量的数据时还是采用TCP协议比较合适

(3)校验和

因为网络传输主要是通过 电信号/光信号/电磁波 来传播的,而这些信号很容易会受到外界环境干扰,导致传输的数据发生改变,使最终结果出现错误。

举个例子:我要去超市买苹果、土豆、鸡蛋、番茄 4 样物品,这时,就用 4 来当做“校验和”,购物结束后,数一下实际购物数,与校验和进行比较,若相等,则任务此次购物时正确的,否则则认为此次购物出现错误

不过这里主要就是为了让大家知道什么是校验和。事实上这种算法比较草率,没法确定购买物品的准确性当我购买的其它物品种类为 4 时,仍然会认为这次购买是正确的。为了更准确的判断,就需要更加严谨的 检查策略和算法

下图就为UDP数据校验的检查过程:

上述这种校验方法被称之为CRC检验方法。通过对前后两次数据分别计算校验和,接着通过比较校验和来判断两次数据是否一致,如果不相同,则会直接对数据进行丢弃

由于这种机制,发送方无法得知接收方是否成功接收数据,也就无法进行数据重发等补救机制,这会导致接收方可能会出现数据丢失数据接收不完整,从而导致最终数据解析出现问题。因此,我们一般认为 UDP 是一种不可靠传输

  • 有人可能会问,记录校验和的空间只有 2 个字节,万一校验和太长了怎么办?
  • 事实上不必担心这一问题,就算校验和过大,发生溢出,也不会影响“相等性判断”,我们只需要判断两次校验和是否相等即可,相等的值溢出后仍会保持相等,因此这并不会影响我们的判断。我们也并不关注校验和的具体指是多少。

那么,在计算校验和的过程中,是否可能会出现两个不同的数据,生成的校验和相同呢?

这的确可能发生,不过概率是非常低的。不过对于CRC算法来说,这个概率相对还比较高

除了CRC算法,还可能会用到其它一些算法来计算校验和,比如两个经典算法 MD5 SHA1

<1>MD5

MD5算法, 本质上可以理解为 字符串Hash算法

背后的实现过程是一个 “数学过程” , 可以理解为 套公式 

不过具体的计算细节就不是我们需要关注的了,我们更需要关心它的特点

1、定长: 无论输入的字符串 长度是多少 , 得到的 MD5 都是固定长度 的

2、分散性: 对于不同的字符串, 即使字符串中只改变了一点点, 得到的 MD5 差异都是很大的

我们知道,数据越分散,越有利于建哈希表,越不容易发生哈希冲突。因此,MD5 算法适合用来做哈希算法

3、不可逆性: 根据输入内容计算 MD5值 是非常容易的,但已知 MD5 值想还原出原始内容就几乎无法实现了

因此MD5 算法适合做加密算法

<2>SHA1

SHA1算法与MD5是十分类似的,也具有以上三个特点,博主这里就不做过多赘述了


总结

UDP报头结构

  1. 源端口(Source Port):16位,标识发送方的应用程序端口号
  2. 目的端口(Destination Port):16位,标识接收方的应用程序端口号
  3. 长度(Length):16位,表示整个UDP数据报的长度,包括头部和数据部分。
  4. 校验和(Checksum):16位,用于检测数据报在传输过程中是否发生了损坏。此字段在某些情况下(如IPv4中)可能是可选的。

UDP报文的使用场景

  1. 实时多媒体传输:由于UDP无需建立连接,发送速度快,适用于语音、视频等实时传输。
  2. 广播或多播通信:UDP支持向多个接收者同时发送数据,适用于广播或多播应用。
  3. 简单服务查询:如DNS查询等,要求快速响应,但对数据准确性要求不高。
  4. 游戏:在线游戏中,为了保证玩家体验,通常使用UDP进行实时数据传输。

那么本篇文章就到此为止了,如果觉得这篇文章对你有帮助的话,可以点一下关注和点赞来支持作者哦。如果有什么讲的不对的地方欢迎在评论区指出,希望能够和你们一起进步✊


http://www.niftyadmin.cn/n/5689170.html

相关文章

HR面试篇

一.面试中被问职业规划 HR感兴趣的不是你的职业规划,感兴趣的是你的职业规划和他们公司有没有关系。 或者说他们公司能不能去帮助你去实现你的职业规划。 切忌不要讲不合实际的,比如要在公司赚多少钱等等。 要根据公司的特点,找到切入点,只要讲得积极向上就可以。 二.…

网安学习(js漏洞挖掘)

内容来自bili白帽大法师白帽大法师的个人空间-白帽大法师个人主页-哔哩哔哩视频 (bilibili.com) 四种方式 目录 1、JS中存在插件名字&#xff0c;根据插件找到相应的漏洞直接利用 2、JS中存在一些URL链接&#xff0c;根据URL链接找到相应的页面进一步测试和利用 3、JS中存…

Swift并发笔记

1.同步和异步 说到线程的执行方式&#xff0c;最基本的一组概念是同步和异步。所谓同步&#xff0c;就是在操作执行完成之前&#xff0c;运行操作的这个线程都会被占用&#xff0c;直到函数最终被抛出或返回。Swift5.5之前&#xff0c;func关键字声明的所有的函数都是同步的。…

IP 数据包分包组包

为什么要分包 由于数据链路层MTU的限制,对于较⼤的IP数据包要进⾏分包. 什么是MTU MTU相当于发快递时对包裹尺⼨的限制.这个限制是不同的数据链路对应的物理层,产⽣的限制. • 以太⽹帧中的数据⻓度规定最⼩46字节,最⼤1500字节,ARP数据包的⻓度不够46字节,要在后⾯补填 充…

利用 notepad++ 初步净化 HaE Linkfinder 规则所提取的内容(仅留下接口行)

去掉接口的带参部分 \?.*去掉文件行 .*\.(docx|doc|xlsx|xls|txt|xml|html|pdf|ppt|pptx|odt|ods|odp|rtf|md|epub|css|scss|less|sass|styl|png|jpg|jpeg|gif|svg|ico|bmp|tiff|webp|heic|dds|raw|vue|js|ts|mp4|avi|mov|wmv|mkv|flv|webm|mp3|wav|aac|flac|ogg|m4a).*(\r\…

Python 课程23-LibROSA

前言 LibROSA 是一个用于音频分析的 Python 库&#xff0c;特别擅长音乐信号处理和音频特征提取。它提供了广泛的工具来处理音频文件&#xff0c;包括加载、变换、特征提取、可视化等功能。LibROSA 在音乐信息检索&#xff08;MIR&#xff09;、机器学习中的音频预处理和音频信…

CentOS常用命令收集

系统相关 重置root密码 1. 通过GRUB菜单重置 重启系统进入GRUB菜单&#xff0c;按e键编辑启动参数。找到以linux16开头的行&#xff0c;更改ro为 rw init/sysroot/bin/sh按Ctrl X启动系统进入后执行以下命令&#xff1a;chroot /sysroot passwd root touch /.autorelabel完…

论文推荐 |【Agent】自动化Agent设计系统

论文标题&#xff1a; Automated Design of Agentic Systems 论文地址&#xff1a; https://arxiv.org/abs/2408.08435 GitHub地址&#xff1a; https://github.com/ShengranHu/ADAS 自动化代理设计在性能和通用性方面显著超越了手动方法。 • 引入了自动化代理系统设计&am…