抱残守缺
Notes on CVPR-06-Spatial Pyramid Matching

Lazebnik, S.; Schmid, C. & Ponce, J.
Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories
2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06), 2006, 2, 2169-2178

Awesome Paper Titles

搜集一下一些个人觉得名字取得特别好的 Paper List,以后写作的时候可以借鉴一下。

Notes on CVPR-14-R-CNN

Change Logs

  • Updated on 2018-05-02: 添加了 Bounding Box Regression 的内容。
  • First Commit on 2018-01-27.

CVPR-14-Rich feature hierarchies for accurate object detection and semantic segmentation 就是这篇论文是提出了大名鼎鼎的 R-CNN,第一作者是 Ross Girshick,也就是 rbg 大神。rgb 是 Pedro Felzenszwalb 的博士生,而且是他的第一个博士生。Felzenszwalb 最知名的工作应该就是 DPM 了,10 年那篇 TPAMI ,Felzenszwalb 是一作,rbg 是二作。所以大神就是大神,不管做不做深度都有非常精彩的工作。Felzenszwalb 在 Grammar Models 上做了很多很好的工作,很值得 follow。

最大似然估计和交叉熵损失

这篇日志厘清一下我之前理解的不是很清晰的一个概念。

Notes on ECCV-12-In Defence of Negative Mining for Annotating Weakly Labelled Data

还是一篇做 Weakly Supervised Object Detection 的,2012 年的 ECCV。文章内容不难,一下就看完了,但是本章 argue 的观点还是很有意思的。

Notes on CVPR-07-An Exemplar Model for Learning Object Classes

又是一篇 Andrew Zisserman 的 paper,大神真的是无处不在。这篇还是做 Weakly Supervised Object Detection,不过因为是 07 年的 CVPR,深度要等到 12 年之后才起来,所以本文还是属于传统范式。额… 其实我还是更喜欢这种传统方式的 paper 的,深度的,总有一种,哈!这就行了的感觉。

Notes on CVPR-16-Weakly Supervised Deep Detection Networks

这是 CVPR 2016 上的文章,对于弱监督的目标检测给了 a simple and elegant end-to-end architecture,影响力还是蛮大的。后续的一些工作,比如 ContextLocNet 都是在本文的框架下做的。引用这篇论文的论文质量都蛮高的,也很值得看一下。

Notes on TPAMI-16-HCP A Flexible CNN Framework for Multi-label Image Classification

这篇论文是 2016 年的 TPAMI,作者 Yunchao Wei 在 Weakly supervised object detection and semantic segmentation 上做了很多很棒的工作,值得 follow 一下。这篇论文在 14 年被放到 arXiv 的时候,还有另外一个名字,CNN: Single-label to Multi-label,而且 arXiv 版本 14 页,内容比 8 页的 TPAMI 版本更加多一些。

Notes on CVPR-15-Is object localization for free?

这篇文章是 CVPR 2015 的,如果不是第一篇,也是很早的一篇,用卷积神经网络来做 Weakly Supervised Object Localization 的,后续的工作或多或少都有受其影响。如果想要了解下当前弱监督目标检测的工作,这篇论文还是有必要读的。另外这篇论文正儿八经地讨论了 Does adding object-level supervision help classification? 和 Does adding object-level supervision help location prediction 这两个问题,算是对我对于弱监督目标检测的认识做了某种程度上的“怯魅”,因为我一开始接触到弱监督有某种奇幻、无中生有的感觉,很神奇。

Notes on SIGGRAPH-12-What makes Paris look like Paris?

这篇文章是 Alexei EfrosSIGGRAPH 2012 上的论文,后来又在 Communications of the ACM 上重新发表了。不少 Weakly Supervised Learning 的文章里都提到了的这篇文章,因为现在我们用数码相机拍照的时候,EXIF 信息记录了照片在哪里拍的,是一个非常现成的 annotation,这篇文章就是用了 location 这个 label,做了很有意思的工作。