|

世界很温柔，我们都在努力变得更好。

阅读文章关于我

向下滚动

Recent

最新文章

最近更新的 6 篇笔记

Coure-Notebook点击跳转

Deep_Learning_for_Computer_Vision

约 31 字1 min read2026-07-19

这是 Stanford CS231N Deep Learning for Computer Vision，由李飞飞教授主讲。

[课程网站](https://cs231n.stanford.edu/)

/blog/Coure-Notebook/Deep_Learning_for_Computer_Vision

Coure-Notebook/Deep Learning for Computer Vision点击跳转

Lec1

约 0 字0 min read2026-07-19

/blog/Coure-Notebook/Deep_Learning_for_Computer_Vision/Lec1

Paper-Reading/Computer-Vision点击跳转

3D_Common_Corruptions_and_Data_Augmentation_笔记

约 3,620 字18 min read2026-07-19

论文：3D Common Corruptions and Data Augmentation（CVPR 2022 Oral，arXiv 2203.01441v3）

作者：Oğuzhan Fatih Kar、Teresa Yeo、Andrei Atanov、Amir Zamir。机构：EPFL。项目页：<https://3dcommoncorruptions.epfl.ch/>

把深度、3D 网格、相机参数和语义等场景几何引入图像损坏，构建包含 20 种损坏的 3DCC 鲁棒性基准，使损坏符合真实成像规律；再将其中一部分作为在线 3D 数据增强，提高模型面对几何相关分布偏移时的鲁棒性。

视觉模型部署到现实世界后会遇到运动模糊、光照变化、雾、遮挡和视角变化等自然分布偏移。现有方法存在真实性与可扩展性之间的矛盾：

/blog/Paper-Reading/Computer-Vision/3D_Common_Corruptions_and_Data_Augmentation_笔记

Paper-Reading/Computer-Vision点击跳转

InfiniDepth_笔记

约 2,905 字14 min read2026-07-19

论文：InfiniDepth: Arbitrary-Resolution and Fine-Grained Depth Estimation with Neural Implicit Fields（arXiv 2601.03252v1，2026）

机构：浙江大学、理想汽车、深圳大学。项目页：zju3dv.github.io/InfiniDepth

把单目深度从离散网格表示改写成连续的神经隐式场 $d_I(x,y)=N_\theta(I,(x,y))$，配一个多尺度局部隐式解码器，使深度可以在任意连续二维坐标处查询，从而实现任意分辨率、细粒度的深度估计；并由此衍生出抵消密度不均的深度查询采样策略，提升大视角变化下的单视角新视角合成。

现有主流深度估计的根本局限在于离散网格表示：

/blog/Paper-Reading/Computer-Vision/InfiniDepth_笔记

科研日志点击跳转

科研日志

记录科研的途中的一些进展，一些方法论，一些遇到的困难和解决思想

约 12 字1 min read2026-07-08

这里是我在科研途中的日记。

/blog/Reaserch_Note

科研日志点击跳转

260707

约 155 字1 min read2026-07-07

这一天在做 sota 方法的调研。晚上询问进度的时候直接把 stablenormal 在 hypersim 上的推理做掉了，效果没有比我们自己方法的单图训练好。

后续老师怀疑 "apple官方提供的数据集能直接用于normal训练" 这个假设本身有问题。后续需要使用 DRT 进行验证。

有些数据对于训练来说可能并不好。（这个我不知道，可能是某些经验？）

交流的时候尽量使用钉钉文本框发关键结果，不要发文档（不会看的）

/blog/Reaserch_Note/260707

About

关于本站

一个分享技术、记录成长的角落 —— 用 Next.js 构建,对 Typora 笔记完全友好。

现代化技术栈

Next.js 16 App Router · React 19 · TypeScript · Tailwind CSS v4 · MDX · Framer Motion

为阅读而生

支持代码高亮、KaTeX 公式、Mermaid 流程图、内嵌目录,以及一键切换的 LaTeX 论文风阅读主题。

细节即美学

玻璃卡片 · 3D 鼠标跟随 · 视频 Hero · 楷体装饰字 · 全站点击涟漪 · 暗色模式 · 响应式适配。