|
6 | 6 |
|
7 | 7 | !!! warning "不要和计算机视觉课程混淆"
|
8 | 8 | 计算机视觉是一门两学分课程,不算在 AI 的专业选修课程中,但有很多其他专业方向的同学会去选修。导论课比没有导论两字的课难度和容量都更大应该也是老传统了(笑)。
|
| 9 | + 在 24 级的培养方案中没有这门课,大概 23 级是最后一次有图灵同学选修这门课(悲) |
9 | 10 |
|
10 | 11 | ## 课程学习内容
|
11 | 12 |
|
|
24 | 25 |
|
25 | 26 | 除此主线内容之外,在最开始会有一个导论和对线性代数的简单回顾,在 2 和 3 之间会有一个对优化方法的介绍,在 6 和 7 之间会有一个对深度学习的介绍。
|
26 | 27 |
|
27 |
| -这门课的大作业是三维重建 + 位姿估计。一般使用 [Hierachical Localization](https://github.com/cvg/Hierarchical-Localization) 就可以得到一个比较好的结果,稍微微调一下参数做一下预处理也是可以的。虽然是打榜的形式,但是事实上按照笔者的体验分差并不明显,最后会有一个课堂展示 + 验收。 |
28 |
| - |
29 |
| -但是从23-24秋冬开始,由于大作业打榜的形式造成大家最后都用差不多的方法,而且leaderboard的形式太卷了,因此大作业改成了五选一的形式。今年的五个题目分别是: |
30 |
| - |
31 |
| -- 光心不一致时的全景图拼接 |
32 |
| -- 重建校园某区域,基于图像对自身做定位 |
33 |
| -- 从多视角视频还原车辆、行人轨迹 |
34 |
| -- 基于多视角图片重建小动物/人 |
35 |
| -- 参考一段网络舞蹈视频,合成自己跳舞的视频 |
36 |
| - |
37 |
| -其中每个任务都分为基础解决方案和额外提升方案。大作业整体的工作量是比较大的,但是课程提供了GPU资源,同时如果遇到困难都可以问助教,助教都是周老师的博士生,水平很高而且人也很好。 |
38 |
| - |
39 |
| -课程有实验课,实验普遍比较简单,可以不去上课。当然,有一次课会讲怎么使用 COLMAP ,那一次课前周老师也会提醒,也建议稍微去听一下,虽然只看文档也能折腾明白。6 次实验的内容分别是: |
40 |
| - |
41 |
| -1. matplotlib, OpenCV 和 Open3d 的基本使用方式; |
42 |
| -2. 高斯滤波、中值滤波、双边滤波和透视投影的实现; |
43 |
| -3. 使用 Gauss-Newton 法求解优化问题; |
44 |
| -4. 图片匹配和图片拼接:Harris 角点检测、SIFT 和 RANSAC 来计算单映变换; |
45 |
| -5. 使用 COLMAP 完成 SfM 和(可选的)MVS; |
46 |
| -6. 使用 mmdetection 完成目标检测, 写一个CNN完成图像分类。 |
47 |
| - |
48 |
| -期末考试不考后面 7 8 9 10 节的内容,当然,周老师会在复习课上讲明考试范围,这个范围仅供参考,复习课讲的更加细致。20 级的考试大题印象中有一道图像拼接和一道三维重建,考的都比较基础,给分普遍似乎也不错,不用过于担心。 |
49 |
| - |
50 |
| -23-24秋冬课程所有的内容都有涉及,考察的内容不难但是覆盖面很大,有很多内容比较细节。分为30分的不定项选择题,20分的判断题,20分的填空题,30分的大题。 |
51 |
| - |
52 | 28 | ### 先修要求
|
53 | 29 |
|
54 | 30 | 可以没有。线性代数会用就足够了,也不会在考试要求计算;前几节内容在图像信息处理课程中会讲,但是没上过也没有风险;机器学习当然上过最好,但是周老师会把所有用到的内容讲清楚,甚至可能比隔壁赵洲老师还清楚,所以没上过也无伤大雅;在渲染的讲解中也会涉及计算机图形学的内容,同样会有充分的介绍;除此以外,还有一门计算摄影的课程,也是周老师开的,笔者没有上过不知晓详情。
|
|
69 | 45 |
|
70 | 46 | 平时作业 30% + 大作业 30% + 期末考试 40%。
|
71 | 47 |
|
| 48 | +=== "平时作业" |
| 49 | + |
| 50 | + 课程有实验课,实验普遍比较简单,可以不去上课。当然,有一次课会讲怎么使用 COLMAP ,那一次课前周老师也会提醒,也建议稍微去听一下,虽然只看文档也能折腾明白。6 次实验的内容分别是: |
| 51 | + |
| 52 | + 1. matplotlib, OpenCV 和 Open3d 的基本使用方式; |
| 53 | + 2. 高斯滤波、中值滤波、双边滤波和透视投影的实现; |
| 54 | + 3. 使用 Gauss-Newton 法求解优化问题; |
| 55 | + 4. 图片匹配和图片拼接:Harris 角点检测、SIFT 和 RANSAC 来计算单映变换; |
| 56 | + 5. 使用 COLMAP 完成 SfM 和(可选的)MVS; |
| 57 | + 6. 使用 mmdetection 完成目标检测, 写一个CNN完成图像分类。 |
| 58 | + |
| 59 | +=== "大作业" |
| 60 | + |
| 61 | + 22-23 秋冬这门课的大作业是三维重建 + 位姿估计。一般使用 [Hierachical Localization](https://github.com/cvg/Hierarchical-Localization) 就可以得到一个比较好的结果,稍微微调一下参数做一下预处理也是可以的。虽然是打榜的形式,但是事实上按照笔者的体验分差并不明显,最后会有一个课堂展示 + 验收。 |
| 62 | + |
| 63 | + 23-24 秋冬,由于大作业打榜的形式造成大家最后都用差不多的方法,而且 leaderboard 的形式太卷了,因此大作业改成了五选一的形式。今年的五个题目分别是: |
| 64 | + |
| 65 | + - 光心不一致时的全景图拼接 |
| 66 | + - 重建校园某区域,基于图像对自身做定位 |
| 67 | + - 从多视角视频还原车辆、行人轨迹 |
| 68 | + - 基于多视角图片重建小动物/人 |
| 69 | + - 参考一段网络舞蹈视频,合成自己跳舞的视频 |
| 70 | + |
| 71 | + 其中每个任务都分为基础解决方案和额外提升方案。大作业整体的工作量是比较大的,但是课程提供了GPU资源,同时如果遇到困难都可以问助教,助教都是周老师的博士生,水平很高而且人也很好。 |
| 72 | + |
| 73 | + 24-25 秋冬,本学期延续了去年的形式,选题减少了,分别是 |
| 74 | + |
| 75 | + - 视觉定位:重建校园某区域,基于图像对自身做定位 |
| 76 | + - 表面重建:基于多视角图片重建物体 |
| 77 | + - 数字人:参考一段网络舞蹈视频,合成自己跳舞的视频。 |
| 78 | + - 开放选题:自主选择计算机视觉领域方向的选题,例如新视角合成、多模态理解、AIGC等,要求在冬二周前提交立项说明 |
| 79 | + |
| 80 | + 每个选题包括了基础解决(14分)和进阶探索部分(6分),最后的汇报展示(10分),要求展示自己采集数据完成的 demo |
| 81 | + |
| 82 | +=== "期末考试" |
| 83 | + |
| 84 | + 周老师会在复习课上讲明考试范围,复习课讲的更加细致。20 级的考试大题印象中有一道图像拼接和一道三维重建,考的都比较基础,给分普遍似乎也不错,不用过于担心。 |
| 85 | + |
| 86 | + 23-24 秋冬课程所有的内容都有涉及,考察的内容不难但是覆盖面很大,有很多内容比较细节。分为 30 分的不定项选择题,20 分的判断题,20 分的填空题,30 分的大题。 |
| 87 | + |
| 88 | + 24-25 秋冬课程的全部章节都有涉及,但是难度并不大,也不要求较难的数学推导,诚如周老师所言“我们这门课希望大家学到一些有用的东西”,考察更注重理解,当然复习课很重要,98 上有一份回忆卷的拟合效果也很好。 |
| 89 | + |
| 90 | + 今年是 30 分的不定项选择,10 分的判断题,20 分的填空题,40 分的大题。试卷是中文试卷,对于专业词汇都标注英文,可以说非常友好。对于复习课提到的东西都好好掌握基本就没有问题。 |
| 91 | + |
72 | 92 | ## 推荐书目
|
73 | 93 |
|
74 | 94 | + Richard Hartley 和 Andrew Zisserman 的 [ *Multiple View Geometry in Computer Vision*](https://www.cambridge.org/core/books/multiple-view-geometry-in-computer-vision/0B6F289C78B2B23F596CAA76D3D43F7A) , 从射影几何角度出发, 极其经典, 但较难读。
|
|
80 | 100 |
|
81 | 101 | - [lhj 的笔记](https://frightenedfoxcn.github.io/notes/qnotes/computer_vision/)
|
82 | 102 | - [lhx 的笔记](https://lhxcs.github.io/note/AI/cv/icv/)
|
| 103 | +- [lt 的笔记](https://626lt.github.io/note/icv/) |
0 commit comments