TechBlog
首页分类标签搜索关于
← 返回标签列表
加载中...

© 2025 TechBlog. All rights reserved.

#标签

共 288 篇文章
OAK-HUB您通往视觉AI的门户

OAK-HUB您通往视觉AI的门户

如果你想创建一个现有模型的新Variant——例如,原始模型是为384×512的输入分辨率设计的,你想添加对444×754的支持——你可以通过创建一个新的模型变体(Variant)来实现。它提供了一种方便的、基于浏览器的SSH连接,因此您可以远程管理、配置和排除设备故障,而无需物理访问。无论是推出新功能、提高性能还是部署新的AI模型,Hub的更新系统都能确保您的整个相机队列保持同步,从而节省时间并降低跨设备版本漂移的风险。的核心在于控制与可视化。这使您的部署保持最新、合规,并具有抵御潜在漏洞的弹性。

时间:12/22/2025

即插即用系列-CVPR-2024-RMT既要全局感受野,又要-CNN-的局部性一种拥有显式空间先验的线性-Transformer

即插即用系列-CVPR-2024-RMT既要全局感受野,又要-CNN-的局部性一种拥有显式空间先验的线性-Transformer

本文提出RMT(RetentiveMaskTransformer),一种结合RetentiveNetwork与VisionTransformer优势的视觉骨干网络。RMT通过曼哈顿距离构建2D空间衰减机制,在保持Transformer全局建模能力的同时引入CNN的平移不变性,并实现线性计算复杂度。核心创新包括:1)将1D衰减扩展为2D空间先验;2)通过轴向分解实现高效计算;3)动态衰减率调整感受野。实验表明,RMT在ImageNet分类、COCO检测等任务上性能优于SwinTransformer和

时间:12/21/2025

每天一个AI小知识什么是多模态学习

每天一个AI小知识什么是多模态学习

多模态学习是人工智能的重要分支,让AI能同时处理文本、图像、音频等多种数据形式。本文系统介绍了多模态学习的概念、发展历程、核心技术(如模态融合、对比学习)、主流模型(CLIP、GPT-4、Gemini等)及其在智能助手、内容创作等领域的应用。文章还探讨了当前面临的模态异质性、数据稀缺性等挑战,并展望了全模态学习、实时理解等未来趋势。多模态学习正推动AI向更接近人类智能的方向发展,同时也引发了对智能本质、人机关系等哲学思考。

时间:12/20/2025

基于阈值分割的车牌定位识别

基于阈值分割的车牌定位识别

基于阈值分割的车牌定位识别

时间:12/20/2025

计算机视觉01_滤波器

计算机视觉01_滤波器

图像滤波通过改变像素值实现图像增强和信息提取,核心原理是利用像素间的空间相关性。低通滤波(如均值滤波)通过平均像素值去除噪点,但会使图像变模糊;高通滤波(如Sobel算子)通过检测像素差异提取轮廓;锐化则是将边缘信息叠加到原图以增强细节。这些操作本质都是通过分析像素与邻域的关系来实现不同效果:去噪让像素趋近邻域,轮廓检测寻找像素差异,锐化则放大这种差异。卷积运算通过滑动核矩阵与图像矩阵计算实现这些功能。

时间:12/18/2025

计算机视觉19语义理解-CNN应用_目标检测_语义分割

计算机视觉19语义理解-CNN应用_目标检测_语义分割

【计算机视觉(19)】语义理解-CNN应用_目标检测_语义分割

时间:12/18/2025

计算机视觉16语义理解-训练神经网络1_激活_预处理_初始化_BN

计算机视觉16语义理解-训练神经网络1_激活_预处理_初始化_BN

【计算机视觉(16)】语义理解-训练神经网络1_激活_预处理_初始化_BN

时间:12/18/2025

计算机视觉LaVG

计算机视觉LaVG

作者提出:一种用于开放词汇语义分割(OVSeg)的两阶段方法:(1)无监督发现对象级mask;(2)再把文本标签“晚交互”地分配到这些对象上。大量已有方法把OVSeg当作像素到文本的分类(pixel-to-textclassification),依赖预训练视觉-语言模型的图文对齐能力,但缺乏对象级理解。作者认为:分割本质是视觉任务,“对象”在没有文本先验时也能凭视觉被区分。LaVG先用迭代NormalizedCuts覆盖整张图的对象mask(作者称为),再对每个对象做文本匹配。

时间:12/18/2025

暴雪天气下的自动驾驶视觉困境事件相机能否改善去雪效果

暴雪天气下的自动驾驶视觉困境事件相机能否改善去雪效果

摘要:苏黎世大学团队提出利用事件相机解决雪天自动驾驶视觉退化问题。事件相机通过亚毫秒级时间分辨率捕捉亮度变化,能有效区分雪花与场景结构。研究构建了DSEC-Snow数据集,实验显示该方法在图像重建质量(PSNR提升3dB)及下游任务性能(提升20%)上显著优于传统方法。尽管事件相机不能完全替代其他传感器,但其高时间分辨率信息可增强雪天感知鲁棒性。锐思智芯的灵光1号等产品有望推动该技术落地,为恶劣天气下的自动驾驶提供硬件支持。(149字)

时间:12/18/2025

FAST-LIVO2-深度技术解析

FAST-LIVO2-深度技术解析

├─SO(3):旋转矩阵(3维)├─R³:位置(3维)├─R³:速度(3维)├─R³:陀螺仪零偏(3维)├─R³:加速度计零偏(3维)├─R³:重力向量(3维)└─R:时间偏移/曝光参数(1维)总维度:19旋转在SO(3)流形上,避免奇异性在线估计重力向量,适应初始对齐误差估计光度参数(τ),增强光照适应性理论创新:序列化更新ESIKF解决维度失配工程优化:扫描重组实现时间硬同步精度突破:激光辅助的直接视觉法,7mm级精度效率领先。

时间:12/17/2025

基于STM32和FreeRTOS的智能家居设计之路

基于STM32和FreeRTOS的智能家居设计之路

STM32是意法半导体推出的一系列32位ARM架构微控制器,性能强大、资源丰富,广泛应用于各种嵌入式项目,咱们这个智能家居设计就靠它来挑大梁。

时间:12/16/2025

OpenCVPython图像处理几何变换之缩放

OpenCVPython图像处理几何变换之缩放

摘要:图像缩放是通过调整图像尺寸实现几何变换的基础操作,OpenCV的cv2.resize()函数支持多种缩放方式。核心原理包括插值算法选择(INTER_NEAREST、INTER_LINEAR、INTER_CUBIC等)和尺寸比例计算。实现场景包括固定比例缩放、指定尺寸缩放、保持宽高比缩放等,应用涵盖图像预处理、多分辨率显示等。关键注意事项包括尺寸格式转换(width,height)、插值算法选择(缩小推荐INTER_AREA,放大推荐INTER_CUBIC)以及中文路径处理等问题。

时间:12/16/2025

ICCV-2025-去模糊新范式残差引导-图像金字塔,强噪声下核估计精度提升-77,SOTA-到手

ICCV-2025-去模糊新范式残差引导-图像金字塔,强噪声下核估计精度提升-77,SOTA-到手

《BlindNoisyImageDeblurringUsingResidualGuidanceStrategy》提出创新性残差引导策略(RGS),有效解决传统盲去模糊方法在噪声干扰下的性能下降问题。该方法通过图像金字塔的多尺度处理,利用残差计算与引导滤波实现噪声抑制与细节保留的平衡,无需训练即可超越深度学习方法。实验表明,该方法在PSNR、SSIM等指标上显著提升,并能作为通用模块增强现有算法性能。这项研究为实际应用中的低质量图像恢复提供了可靠解决方案。

时间:12/15/2025

二值化断裂裂缝的智能拼接算法

二值化断裂裂缝的智能拼接算法

该算法基于裂缝角度和端点距离进行生长拼接,能够有效克服噪声点的影响。

时间:12/15/2025

OpenCV四十一SIFT关键点检测

OpenCV四十一SIFT关键点检测

SIFT是计算机视觉领域中极具代表性的特征检测与描述算法,其通过尺度空间、DoG极值检测、方向分配和高维描述子构建,实现了对尺度和旋转变化的不变性。尽管在性能上不如轻量级算法,但在鲁棒性和匹配准确性方面依然具有不可替代的优势。

时间:12/14/2025

计算机视觉-OpenCV-学习系列

计算机视觉-OpenCV-学习系列

本文整理了博主关于OpenCV图像处理的系列学习笔记,包括6篇教程文章。内容涵盖计算机图像基础概念、OpenCV简介,以及图像处理的基本操作:读取/显示/保存图像、调整大小、裁剪和旋转原理等。文章根据学习进度持续更新,适合OpenCV初学者循序渐进地掌握图像处理基础知识和实践技巧。

时间:12/10/2025

多业态连锁环境管理系统AI-机器人闭环,坪效提升-16

多业态连锁环境管理系统AI-机器人闭环,坪效提升-16

AI视频识别系统助力门店环境管理智能化升级。通过构建环境神经网络,系统实现96.8%精度的实时指标监测,3秒内触发自动化干预,形成闭环管理。180天实测数据显示,维护成本降低58%,安全事故减少79%,响应效率提升93%。该系统将门店环境管理从被动应对转变为主动优化,使清洁工作转化为提升顾客体验和经营效率的核心竞争力。

时间:12/09/2025

60视频插帧DeepVoxelFlow融合光流与CNN的视频帧合成新范式

60视频插帧DeepVoxelFlow融合光流与CNN的视频帧合成新范式

3D体素流(F)是网络的核心输出,包含空间运动信息与时间混合权重空间运动成分:表示目标帧到下一帧的2D光流,其负值对应目标帧到前一帧的光流(假设光流在时间上线性对称)。时间混合成分:表示前一帧与后一帧的像素混合权重,用于融合两帧像素生成目标帧。FFmotionFmaskFFmotion​Fmask​其中,Fmotion∈RH×W×2Fmotion​∈RH×W×2)(H、W为帧高宽),Fmask∈RH×W×1F。

时间:12/09/2025

论文笔记Improving-action-segmentation-via-explicit-similarity-measurement

论文笔记Improving-action-segmentation-via-explicit-similarity-measurement

本文提出了一种基于显式相似性度量的动作分割方法ASESM,通过多分辨率特征提取和相似性投票提高初始预测精度,并设计迭代边界校正算法优化动作边界。监督学习框架采用多编码器结构,结合边界校正与片段平滑技术,在50Salads等数据集上验证了有效性。同时提出完全无监督的边界检测方法,仅依赖特征相似性无需训练。该方法解决了现有技术过度依赖逐帧分类和缺乏边界验证机制的问题,显著提升了动作分割性能。

时间:12/08/2025

计算机视觉73D点几何基础篇从世界坐标到像素坐标的旅程

计算机视觉73D点几何基础篇从世界坐标到像素坐标的旅程

【计算机视觉(7)】3D点几何基础篇:从世界坐标到像素坐标的旅程

时间:12/07/2025

计算机视觉4特征点检测基础篇从角点到兴趣点

计算机视觉4特征点检测基础篇从角点到兴趣点

【计算机视觉(4)】特征点检测基础篇:从角点到兴趣点

时间:12/07/2025

Python图像处理入门指南-opencv

Python图像处理入门指南-opencv

由上面的单目相机成像模型可得到一个关系式这样的相似关系使得相机坐标系中坐标与图像坐标系中坐标的负号相反,因此为了将负号去掉,则可以得到对应的成像图像即右侧的坐标系,其相似关系为使用齐次坐标的形式表示则为其中u,v即为前面的x,y;而参数K即为相机的内参矩阵,其仅由相机的内部参数决定,具体的内参矩阵与相机内参之间的关系和推到,一般使用张正友标定法。

时间:12/05/2025

OpenCVPython图像处理之图像加密解密

OpenCVPython图像处理之图像加密解密

摘要:本文介绍了使用OpenCV-Python实现图像加密解密的多种方法。主要包括:1)基础异或加密,通过逐像素异或运算实现可逆加密;2)像素置乱加密,包括Arnold变换和随机置换两种方式;3)组合加密,结合异或加密和Arnold变换提高安全性;4)混沌加密,利用Logistic映射生成随机密钥。文章详细说明了每种方法的实现原理、代码示例和注意事项,并比较了不同方案的安全性和适用场景。强调密钥管理的重要性,建议根据实际安全需求选择合适的加密方案组合。

时间:12/04/2025

opencv图片倾斜矫正

opencv图片倾斜矫正

opencv图像处理,利用霍夫变换直线检测,进行倾斜图像矫正

时间:12/04/2025

上一页
12345...12
下一页第 1 / 12 页