|
| 1 | +# 智能视觉信息采集 |
| 2 | +<div class="badges"> |
| 3 | +<span class="badge ai-badge">AI 专业选修</span> |
| 4 | +</div> |
| 5 | + |
| 6 | +## 课程学习内容 |
| 7 | + |
| 8 | +本课程分为理论部分和实验部分。理论课为全英文授课,难度较大,内容上与 AI 专业必修课《计算机视觉导论》有一定重合,但是更偏重摄影学,主要介绍视觉信息、相机模型、表面与体积采集等等;同时,课程并不会过多介绍 OpenCV, OpenGL, Tensorflow 等编程技术,在实验/大作业用到时需要自行查阅资料。理论课包含以下章节: |
| 9 | + |
| 10 | +- Modern Camera Systems |
| 11 | +- Lightfields & Image Relighting |
| 12 | +- Measuring Depths |
| 13 | +- Volumetric Acquisition |
| 14 | +- Appearance Capture |
| 15 | +- Advanced Topics |
| 16 | + |
| 17 | +实验部分主要包含四次组队实验,在最后完成并展示大作业(见“分数构成”章节)。 |
| 18 | + |
| 19 | +## 任课教师 |
| 20 | + |
| 21 | +[吴鸿智](https://svbrdf.github.io/) 吴老师对待学术非常认真严谨,同时品味也很高。他的课堂偏重引导学生思考“为什么”而非一味灌输知识,讲课逻辑清晰,英语也比较流利。吴老师也很欢迎学生与他交流包含专业理论、大作业选题与科研方向在内的任何问题。 |
| 22 | + |
| 23 | +## 参考书目 |
| 24 | + |
| 25 | +- Computer Vision: Algorithms and Applications, 2nd Ed, 2021. Szeliski, Richard. Springer. |
| 26 | +- Deep Learning, 2016. Goodfellow et al. MIT Press. |
| 27 | +- Physically Based Rendering: From Theory to Implementation, 3rd Ed, 2018. Pharr et al. Morgan Kaufmann. |
| 28 | +- Elements of Information Theory, 2nd Ed, 2006. Cover, Thomas & Thomas, Joy. Wiley. |
| 29 | + |
| 30 | +## 分数构成 |
| 31 | + |
| 32 | +课堂表现 20% + 实验 40% + 大作业 40% |
| 33 | + |
| 34 | +=== "课堂表现" |
| 35 | + |
| 36 | + 课堂表现由 Q&A 和 Quiz 两部分构成: |
| 37 | + |
| 38 | + - Q&A (2%): 老师会在课堂上提问,自由举手回答,一次正确回答加 1 分(可以中文回答)。 |
| 39 | + - Quiz (18%): 课前小测,共三次,不会提前通知。每次小测只有一道比较开放的简答题,不会直接出自课堂内容,但可以用课上知识回答,更加考查对知识的理解(可以中文作答)。 |
| 40 | + |
| 41 | +=== "实验" |
| 42 | + |
| 43 | + 本课程实验均为三人组队完成,每组每次实验需要上交一份全英文撰写的实验报告。课程为每一组提供两台 Basler daA2500-14uc 相机与一台投影仪用于完成实验。五次实验分别为: |
| 44 | + |
| 45 | + 1. Image Acquisition (6%): Basler 相机与 Pylon Viewer 的使用(含 Bonus 25%) |
| 46 | + 2. Project Proposal (2%): 大作业选题与方案(无实验) |
| 47 | + 3. Single Camera Calibration with OpenCV (9%): 相机标定与单目视觉(含 Bonus 10%) |
| 48 | + 4. Passive Two-view Stereo (11%): 基于双目视觉的深度估计 |
| 49 | + 5. Projector-Camera-Based Stereo Vision (12%): 基于结构光的深度估计 |
| 50 | + |
| 51 | +=== "大作业" |
| 52 | + |
| 53 | + 大作业也是三人组队完成,自主选题,内容上要有动手实践的内容,比较重视实验设计,同时鼓励软硬件结合开发。评判标准如下: |
| 54 | + |
| 55 | + - Novelty (30%) |
| 56 | + - Experimental Evaluation (30%) |
| 57 | + - Technical Depth (20%) |
| 58 | + - Completeness (10%) |
| 59 | + - Presentation (10%) |
| 60 | + |
| 61 | + 可以借用实验室的相机与投影仪,也可以申请小额器材的报销。关于优秀课程项目可以参考[这个视频](https://www.bilibili.com/video/BV1oK4y1D7kW)。值得一提的是,在大作业获得最高分的队伍可以得到吴鸿智老师的奖励(24-25 秋冬是《塞尔达传说:王国之泪》的手办)。 |
| 62 | + |
| 63 | +## 学习建议 |
| 64 | + |
| 65 | +《智能视觉信息采集》这门课为 2.5 学分却是单学期课程,加上吴鸿智老师对教学的相对高要求,可想而知 workload 不会小。上课体验而言,吴老师的英语比较流畅,适应之后可以跟上课程节奏;但是最后几周随着课程难度增大,想听懂全部内容比较困难。个人认为吴老师的“启发式”授课在整个计算机学院中称得上一股清流,注重结论产生的过程又触及本质,即便是全英语也可以把知识讲得清楚。如果想在课堂表现上获得不错分数,尽量不要错过举手回答问题的机会,同时每周上课前可适当复习上周 slides 以免突然出现 quiz 时头脑一片空白。 |
| 66 | + |
| 67 | +对于实验部分,本课程的实验压力并不小,基本每周都有实验,需要当堂完成数据收集并在一周时间内上交报告;这门课虽然“不会直接讲授编程内容”,但实验与大作业对代码能力有一定要求,包括 OpenCV 在内的一些开源库需要自行检索资料学习。值得一提的是,前两次实验有 Bonus,非常建议在时间宽裕的情况下完成。 |
| 68 | + |
| 69 | +关于大作业,其实最后用于大作业的时间并不长,Lab5 到期末展示不过一周多的时间,最好是在第三周前多与老师交流,将大作业的结构框定在可控的范围内。从课程展示的点评环节看,老师本人更加青睐精巧的实验设计,不过如果手头有现成项目进行改编也未尝不可。 |
| 70 | + |
| 71 | +总而言之,这门课从里至外渗透着吴鸿智老师一以贯之的教学追求:贴近本质、重视应用与 high-level。如果你有一定的知识储备与代码能力,或是较强的自主学习驱动力,那么选这门课能收获不错的体验;但是,如果单纯为了水选修学分,这门课的庞大工作量与最后或将不及预期的分数可能比较劝退,属于事多给分还行的范畴。 |
0 commit comments