本文介绍: 就是基于阶段网络获取box作为Proposal,文章使用的是Second网络,其他的如pointpillarcenterpoint可以作为。对于给定一个proposal选择ROI区域内的点,ROI区域是一个没有高度限制圆柱体然后随机选取ROI范围内的256个点。训练过程confidence的真值被设置为Proposals对应gt的3D IoU值。将经过编码解码模块输出送入两个FFN网络中,预测得到confidence和相对于输入的Proposal的box残差值。

K^hT),h=1,,H

3.3、Channel-wise Decoding Module

在这里插入图片描述

四、Detect head and Training Targets

将经过编码解码模块输出送入两个FFN网络中,预测得到confidence和相对于输入的Proposal的box残差值。
训练过程confidence的真值被设置为Proposals对应gt的3D IoU值。confidence真值计算公式如下

c

t

=

min

(

1

,

max

(

0

,

I

o

U

α

B

α

F

α

B

)

)

c^{t}=min left(1, max left(0, frac{mathrm{IoU}-alpha_{B}}{alpha_{F}-alpha_{B}}right)right)

ct=min(1,max(0,αFαBIoUαB))

box回归值的真值计算如下

x

t

=

x

g

x

c

d

,

y

t

=

y

g

y

c

d

,

z

t

=

z

g

z

c

h

c

,

l

t

=

log

(

l

g

l

c

)

,

w

t

=

log

(

w

g

w

c

)

,

h

t

=

log

(

h

g

h

c

)

,

θ

t

=

θ

g

θ

c

,

begin{aligned} x^{t} & =frac{x^{g}-x^{c}}{d}, y^{t}=frac{y^{g}-y^{c}}{d}, z^{t}=frac{z^{g}-z^{c}}{h^{c}}, \ l^{t} & =log left(frac{l^{g}}{l^{c}}right), w^{t}=log left(frac{w^{g}}{w^{c}}right), h^{t}=log left(frac{h^{g}}{h^{c}}right), \ theta^{t} & =theta^{g}-theta^{c}, end{aligned}

xtltθt=dxgxc,yt=dygyc,zt=hczgzc,=log(lclg),wt=log(wcwg),ht=log(hchg),=θgθc,

五、训练losses

CT3D是端到端的训练策略,包括三个损失,分别是RPN损失confidence损失box回归损失。
在这里插入图片描述
confidence损失用的是二元交叉计算
在这里插入图片描述
回归损失使用的是Smooth-L1计算,只有

I

o

U

α

R

IoU ≥ α_R

IoUαR 的Proposal才会用来计算回归损失。
在这里插入图片描述

原文地址:https://blog.csdn.net/u014311125/article/details/134639868

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_16159.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注