4
费马路径对应于瞬态测量中的不连续性。
具体而言,可以将瞬态测量中的不连续性识别为有助于瞬态的费马路径的长度。
给定费马路径长度的集合,该过程将为 NLOS 表面生成一个定向的点云。
反射式 NLOS(环角);
透射式 NLOS(透过扩散器)。
5
首先,该模型通过收集先前分类层的权重,在大规模图像中的所有类别上生成全局语义池。
其次,按类别划分的知识图被设计为对语言知识(例如属性,共现,关系)进行编码。
第三,通过关注机制对当前图像进行编码,以自动发现每个对象最相关的类别。
第四,增强的类别通过软映射机制映射回区域,从而可以细化前一阶段不准确的分类结果。
第五,将每个区域的新增强功能与原始功能连接在一起,以端到端的方式增强分类和定位的性能。
1000 个类别的 VisualGenome 占 15%;
3000 个类别的 VisualGenome 占16%;
ADE 占 37%;
MS-COCO 的 15%;
Pascal VOC 的 2%。
6
为了增加训练数据,通常的做法是从图像(即分类区域或 RoC)中提取具有随机坐标的矩形。
在测试时,从图像的中央部分提取 RoC 。
这导致分类器在训练和测试时看到的对象大小之间存在显着差异。
在测试时增加图像作物的大小,可以补偿训练时随机选择 RoC;
在训练中使用比测试时使用更低分辨率的农作物可以改善模型的性能。
在 128×128 图像上训练时,top-1 精度为 77.1%;
在 224×224 图像上训练时,top-1 精度为 79.8%;
在带有额外训练数据的 224×224 图像上进行训练时,top-1 精度为 82.5%。
top-1 准确性为 86.4%;
top-5 准确性为 98.0%。
7
由补丁 GAN 的层次结构组成,每个 GAN 负责捕获补丁在不同规模上的分布(例如,某些 GAN 了解全局属性和大对象的形状,例如「顶部的天空」和「底部的地面」,以及其他 GAN 可以学习精细的细节和纹理信息);
不仅可以生成纹理,还可以处理一般的自然图像;
允许生成任意大小和纵横比的图像;
通过选择在测试时间开始生成的标度,可以控制生成的样本的可变性。
可以生成描述新的现实结构和对象配置的图像,同时保留训练图像的内容;
成功保留全局图像属性和精细细节;
可以现实地合成反射和阴影;
生成难以与真实样本区分开的样本。