Wydcoder's Tech Blog

封装成帧

一、封装成帧核心定义封装成帧是数据链路层的核心功能之一，指该层为上层（网络层）交付的协议数据单元（PDU）添加帧头和帧尾，最终形成可在链路中传输的 “帧”。其中，帧头和帧尾包含关键控制信息，核心作用之一是帧定界—— 帮助接收方数据链路层从物理层传递的连续比特流中准确提取出单个帧。二、典型帧结构该文档重点介绍了两种主流帧格式，具体结构如下： 1. 以太网 V2 的 MAC 帧总长度限制：最

2025-10-06

计算机网络

#计算机网络

数据链路层概述

一、数据链路层在网络体系结构中的地位层级位置：位于物理层之上、网络层之下，是网络体系结构中的关键中间层，负责衔接物理层的硬件传输与网络层的逻辑通信。覆盖场景：适用于多种网络环境的数据传输，包括主机与路由器之间（如主机 H1 与路由器 R1）、路由器与路由器之间（如路由器 R1 与路由器 3）、路由器与网络之间（如路由器 R2 与广域网）等，可跨电话网、局域网、广域网等不同网络类型实现数据交互

2025-10-06

计算机网络

#计算机网络

编码与调制

一、核心概念界定概念定义消息（message）需要传递的原始内容，是运送数据的基础实体数据（data）消息的电磁表现形式，是信号传输的核心载体信号（signal）数据的电磁表现，分为基带信号和调制后的信号，是物理层传输的直接对象码元在时间域波形中表示数字信号的基本波形，代表不同离散数值，是编码与调制的基本单位基带信号信源发出的原始电信号，可直接

2025-10-06

计算机网络

#计算机网络

管程

目录引言管程的基本概念管程的实现机制 3.1 使用信号量实现管程 3.2 条件变量的实现方式管程在面向对象编程语言中的应用 4.1 Java 中的管程实现 4.2 其他语言中的管程设计管程在操作系统中的应用 5.1 共享资源访问控制中的管程 5.2 Android 系统中的运行时安全监控管程的优势与局限性分析结论与主要研究发现 1. 引言管程（Monitor）是一种高级同步机

2025-09-22

#操作系统

操作系统的概念

操作系统的概念：计算机系统的核心管理者操作系统（Operating System，简称OS）是管理计算机硬件与软件资源、控制程序运行、为用户和应用程序提供交互接口的系统软件，是计算机系统中最基础、最重要的组成部分，被誉为“计算机的灵魂”。它如同计算机硬件与用户/应用程序之间的“翻译官”和“管理者”，协调所有硬件资源（如CPU、内存、硬盘），并为软件运行提供稳定、高效的环境。一、操作系统的核心定

2025-09-14

操作系统

#操作系统

彩色语谱图(Color Spectrogram)

彩色语谱图：语音信号的“视觉化语言” 彩色语谱图（Color Spectrogram）是语音信号处理领域核心的可视化工具，它将声音的时间、频率、强度三个关键维度通过“色彩”直观呈现，让原本不可见的语音波动转化为可分析的图像，是语音识别、方言研究、病理语音诊断、音乐声学等领域的基础技术。一、彩色语谱图的核心原理：将声音拆解为“三维信息” 声音的本质是“空气振动”，而语音（如人类说话声）是复杂的复合

2025-09-10

音频处理

#音频处理

Video Understanding with Large Language Models: A Survey

《Video Understanding with Large Language Models: A Survey》PDF总结一、研究背景与意义视频内容增长需求：在线视频平台快速扩张，监控、娱乐、自动驾驶等领域摄像头普及，视频成为主流媒体形式，每日新增数百万条视频。人工处理此类海量内容耗时费力，亟需高效的视频理解工具自动识别、分析视频内容，降低人力成本。 LLM的赋能潜力：大型语言模型（LL

2025-09-09

论文阅读

#视频理解

ViLAMP

《Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation》内容总结一、研究背景与问题长视频处理的核心挑战：视觉语言模型（VLMs）在处理长视频时面临巨大计算成本。例如，1分钟24帧的视频会生成超100万视觉令牌（24×60×729），远超主流大语言模型（LLMs）4K-128

2025-09-08

论文阅读

#视频理解

MovieChat

MovieChat技术报告与补充材料详细总结一、研究概述 MovieChat是由浙江大学、华盛顿大学等机构联合提出的长视频理解框架，创新性融合视觉模型与大型语言模型（LLMs），首次实现超10K帧长视频的交互式理解。其核心突破在于借鉴Atkinson-Shiffrin记忆模型，设计短期-长期内存机制，解决长视频理解中计算复杂度高、内存成本大、长期时间关联难三大核心挑战。同时，研究团队发布Movi

2025-09-03

论文阅读

#论文阅读 #视频理解

Sreenplay

MM-Screenplayer：零样本长视频理解系统（CVPR'2024 LOVEU Track1冠军方案）深度解析本文（arXiv:2406.17309）提出的MM-Screenplayer是一款具备多模态感知能力的长视频理解系统，核心目标是解决“长视频问答（LVQA）”任务中“处理时长超5分钟视频”“兼顾全局语义与局部时间定位”的核心难点，最终以零样本方式斩获CVPR'2024 LOVEU

2025-09-03

论文阅读

#论文阅读 #视频理解