TechBlog
首页分类标签搜索关于
← 返回标签列表
加载中...

© 2025 TechBlog. All rights reserved.

#标签

共 717 篇文章
神经网络教电脑像人脑一样思考

神经网络教电脑像人脑一样思考

摘要:神经网络是受人类大脑启发构建的数学模型,通过层层"人造神经元"处理数据。其工作原理类似猜谜游戏:输入数据后,网络通过加权计算进行预测,再根据误差反向调整权重(反向传播)。典型应用包括人脸识别、自动驾驶和ChatGPT等。初学者需注意:1)神经网络依赖大量优质数据训练;2)并非万能工具,存在数据偏见等问题。其本质是通过"猜测-纠错"循环不断优化的数学系统,而非真正的智能思考。

时间:12/23/2025

SAM2跟踪的理解13mask-decoder

SAM2跟踪的理解13mask-decoder

前面几篇我们讲了transformer之前做了什么事以及transformer里面做了什么事。那么transformer之后做了什么事呢?其实就是:1.首先transformer会输出src和hs,src就是加强后的图像编码,hs就是加强后的提示编码。2.如果你给了两个点提示的话,这个提示编码的维度是(B,9,256),其中第0个是用于判断图像中有没有这个物体的,它会经过一个MLP之后得到图中的圆圈4(obj_score_logits)。

时间:12/22/2025

-深度学习-生成对抗网络-GAN

-深度学习-生成对抗网络-GAN

转置卷积是一种上采样操作(考点),用于将小尺寸的特征图扩展为大尺寸的特征图。

时间:12/22/2025

即插即用系列-CVPR-2024-RMT既要全局感受野,又要-CNN-的局部性一种拥有显式空间先验的线性-Transformer

即插即用系列-CVPR-2024-RMT既要全局感受野,又要-CNN-的局部性一种拥有显式空间先验的线性-Transformer

本文提出RMT(RetentiveMaskTransformer),一种结合RetentiveNetwork与VisionTransformer优势的视觉骨干网络。RMT通过曼哈顿距离构建2D空间衰减机制,在保持Transformer全局建模能力的同时引入CNN的平移不变性,并实现线性计算复杂度。核心创新包括:1)将1D衰减扩展为2D空间先验;2)通过轴向分解实现高效计算;3)动态衰减率调整感受野。实验表明,RMT在ImageNet分类、COCO检测等任务上性能优于SwinTransformer和

时间:12/21/2025

git学习

git学习

只删除暂存区中的文件,而不删除工作区(本地)中的文件(gitrm--cache文件名)

时间:12/21/2025

PyTorch-StepLR等间隔学习率衰减的原理与实战

PyTorch-StepLR等间隔学习率衰减的原理与实战

等间隔学习率衰减(StepDecay)是深度学习中常用的学习率调度策略,通过定期降低学习率来优化模型训练。其核心思想是每隔固定训练轮数(epoch)将学习率乘以衰减因子(如0.1或0.5)。PyTorch提供StepLR调度器实现该功能,需设置初始学习率、衰减间隔和衰减因子三个参数。该方法简单有效,能稳定训练后期收敛,但需手动调参且缺乏自适应性。使用时需在每个epoch结束后调用scheduler.step()更新学习率,注意与优化器更新顺序的配合。相比自适应方法,StepDecay更适合作为基线策略或

时间:12/20/2025

基于PyTorch的深度学习迁移学习4

基于PyTorch的深度学习迁移学习4

常用的方法是固定底层的参数,调整一些顶层或具体层的参数。这样做的好处是可以减少训练参数的数量,同时也有助于克服过拟合现象的发生。此外预先训练的网络参数也会被更新,但会使用较小的学习率以防止预先训练好的参数发生较大的改变。

时间:12/20/2025

每天一个AI小知识什么是多模态学习

每天一个AI小知识什么是多模态学习

多模态学习是人工智能的重要分支,让AI能同时处理文本、图像、音频等多种数据形式。本文系统介绍了多模态学习的概念、发展历程、核心技术(如模态融合、对比学习)、主流模型(CLIP、GPT-4、Gemini等)及其在智能助手、内容创作等领域的应用。文章还探讨了当前面临的模态异质性、数据稀缺性等挑战,并展望了全模态学习、实时理解等未来趋势。多模态学习正推动AI向更接近人类智能的方向发展,同时也引发了对智能本质、人机关系等哲学思考。

时间:12/20/2025

DNN案例一步步构建深层神经网络3

DNN案例一步步构建深层神经网络3

人工智能#具身智能#VLA#大模型#AI。DNN案例一步步构建深层神经网络(3)四、对于构建的深层神经网络的应用。

时间:12/19/2025

DNN案例一步步构建深层神经网络二

DNN案例一步步构建深层神经网络二

人工智能#具身智能#VLA#大模型#AI#LLM#Transformer架构#AI技术前沿#Agent大模型#工信部证书#人工智能证书#职业证书。DNN案例一步步构建深层神经网络(二)

时间:12/18/2025

深度学习5循环神经网络

深度学习5循环神经网络

就是三个门,

时间:12/18/2025

教程上新丨微软开源VibeVoice,可实现90分钟4角色自然对话

教程上新丨微软开源VibeVoice,可实现90分钟4角色自然对话

进入Demo运行页面后,将测试视频上传后,在「TexttoConvert」处输入文本,「SpeakerVoice」选项中提供了7种可选择的音色,调整「CFGScale」可以控制语音风格强度,数值越大情感越强。为此,研究团队首创了一种新颖的连续语音分词器,与当前流行的Encodec模型相比,在保持相当性能的前提下,实现了80倍的数据压缩提升,即可实现高达3200×的压缩率(对应7.5Hz帧率),在保障音频保真度的同时,显著提高了长序列处理的计算效率。

时间:12/18/2025

蔬菜识别系统PythonTensorFlowVue3Django人工智能深度学习卷积网络resnet50算法

蔬菜识别系统PythonTensorFlowVue3Django人工智能深度学习卷积网络resnet50算法

蔬菜识别系统,基于TensorFlow搭建卷积神经网络算法,通过对8种常见的蔬菜图片数据集(‘土豆’,‘大白菜’,‘大葱’,‘莲藕’,‘菠菜’,‘西红柿’,‘韭菜’,‘黄瓜’)进行训练,最后得到一个识别精度较高的模型,然后搭建Web可视化操作平台。前端后端:Django算法:TensorFlow、卷积神经网络算法具体功能系统分为管理员和用户两个角色,登录后根据角色显示其可访问的页面模块。登录系统后可发布、查看、编辑文章,创建文章功能中集成了markdown编辑器,可对文章进行编辑。

时间:12/18/2025

Prompt-Tuning

Prompt-Tuning

PromptTuning(提示调优)是一种参数高效的大模型适配技术,属于PEFT(Parameter-EfficientFine-Tuning,参数高效微调)的分支,核心目标是用极少的训练成本,让大模型快速适配特定任务的输出格式/风格/能力——比如你的体检报告质控需要模型「稳定输出JSON结构化结果、不漏检异常指标」,居家养老机器人需要模型「固定用温和的家人语气回复」,这些都可以通过PromptTuning实现。它和你之前了解的全参数微调、LoRA、DPO/RLHF技术类型。

时间:12/16/2025

AI邪修破壁行动神经网络基础核心数据结构张量

AI邪修破壁行动神经网络基础核心数据结构张量

在深度学习中,张量不仅是多维数据容器,更重要的是它支持自动微分和GPU加速计算,这是普通多维数组不具备的核心特性。比如PyTorch和TensorFlow中的张量,除了存储数据,还记录了计算图信息,能够反向传播梯度。0维是标量,1维是向量,2维是矩阵,3维及以上就是张量。

时间:12/16/2025

基于图神经网络大模型的网络安全APT检测系统从流量日志到攻击链溯源的实战落地

基于图神经网络大模型的网络安全APT检测系统从流量日志到攻击链溯源的实战落地

本文提出了一种基于图神经网络(GNN)和大型语言模型(LLM)的高级持续性威胁(APT)检测系统。该系统通过构建"主机-进程-网络"异构图,利用GraphSAGE识别异常行为模式,并结合LogsBERT进行语义分析,最后通过LLM生成攻击链报告。实际部署结果显示,该系统将APT检出率从传统方法的15%提升至97.3%,误报率从120次/天降至3次/天,攻击溯源时间从8小时缩短至25分钟。

时间:12/16/2025

深度学习图像处理3-二阶段目标检测

深度学习图像处理3-二阶段目标检测

随着深度学习模型效果的优化,基于深度学习的目标检测算法盖过了传统计算机视觉中的目标检测算(DPM),从而导致很多之前研究传统目标检测算法的人员转向深度学习,并且现在工业界中应用最多的目标检测方式以深度学习为主。其中R-CNN是奠定深度学习方向发展目标检测的的基础算法,是第一个真正可以工业级应用的目标检测解决方案,是结合区域提名(RegionProposal)和卷积神经网络(CNN)的一种目标检测算法。

时间:12/16/2025

江鸟中原集光鸿蒙项目开发

江鸟中原集光鸿蒙项目开发

修改中的bundleName调整中的应用名称根据需要修改主题色彩和样式。

时间:12/15/2025

K-S-检验KolmogorovSmirnov计算过程与示例

K-S-检验KolmogorovSmirnov计算过程与示例

【K-S检验】Kolmogorov–Smirnov计算过程与示例

时间:12/15/2025

基于知识图谱深度学习的大数据NLP医疗知识问答可视化系统全网最详细讲解及源码建议收藏

基于知识图谱深度学习的大数据NLP医疗知识问答可视化系统全网最详细讲解及源码建议收藏

本文详细介绍了一个基于知识图谱与深度学习的医疗问答系统。系统采用Neo4j存储医疗知识图谱,使用Aho-Corasick算法进行高效多模式匹配,并整合了BERT+LSTM+CRF深度学习模型。实现流程包括数据爬取、清洗、实体识别、知识图谱建模等步骤,最终构建了一个具有可视化界面的Flask应用。系统支持自然语言问答,能自动存储交互记录到SQL数据库。文章还详细说明了所需的软件环境配置(JDK1.8、Neo4j4.4.5等)和项目目录结构,为开发者提供了完整的实现方案和技术细节。

时间:12/15/2025

自主算力筑基-垂域模型破局国产硬件架构下的行业大模型训练与微调服务实践

自主算力筑基-垂域模型破局国产硬件架构下的行业大模型训练与微调服务实践

**摘要:**2025年下半年,AI行业重心转向垂直领域模型落地,国产算力基础设施成为关键。中国移动哈尔滨智算中心(1.8万张国产加速卡)和甘肃庆阳十万卡集群的建成,以及华为昇腾平台支持万亿级MoE模型训练,标志着国产算力在规模、性能和协同调度上的突破。国产平台通过多模态数据治理、分布式训练优化和高效微调技术(如LoRA),显著降低行业AI落地门槛,已在金融、工业、政务等领域实现风控准确率提升8%、产线停机减少20%等成效,推动AI从实验室走向产业应用。

时间:12/15/2025

U-Net嵌套密集跳跃连接,多尺度融合增强特征表达,医学影像分割的unet创新-k学长深度学习专栏

U-Net嵌套密集跳跃连接,多尺度融合增强特征表达,医学影像分割的unet创新-k学长深度学习专栏

医学图像分割模型UNet++的创新与局限UNet++是针对医学图像分割需求提出的改进模型,通过嵌套密集跳跃连接和深度监督机制解决了U-Net存在的语义鸿沟问题。其核心创新包括:1)重新设计跳跃路径,通过逐级卷积缩小编码器与解码器特征间的语义差距;2)采用密集连接优化梯度流动;3)引入多尺度深度监督提升训练稳定性。实验显示其在多个医学数据集上IoU指标平均提升3.9%。但该模型存在计算成本高、实现复杂、训练资源需求大等缺陷。后续改进包括UNet3+的全尺度连接、Attention机制引入、轻量化改造及Tra

时间:12/14/2025

深度学习面试八股文1训练

深度学习面试八股文1训练

算法面试八股文

时间:12/13/2025

AI学会理解物理法则OpenAI-Sora-2如何重塑视频生成新范式

AI学会理解物理法则OpenAI-Sora-2如何重塑视频生成新范式

OpenAI最新发布的Sora2标志着AI视频生成技术从视觉模仿迈向物理理解的重大突破。该模型通过强化物理一致性损失函数和材质嵌入空间,实现了对重力、流体力学等物理规律的隐性习得,使生成的1080p/20秒视频具备惊人的物理真实性。关键技术包括:分层时空编码器确保长视频一致性,思维链推理实现导演式分镜规划,动态分辨率调度优化计算效率。应用场景涵盖影视预演、科学可视化、交互式叙事等领域,显著提升创作效率。

时间:12/12/2025

上一页
12345...30
下一页第 1 / 30 页