改变相机视角和推进时间后观察到不稳定的重建结果 #33

1400013531 · 2024-07-17T03:55:10Z

您好，感谢您严谨且优异的工作成果和分享！
我按照readme的说明做了waymo场景的训练和重建，使用的是预处理好的waymo数据集的0145050场景，在本地复现得到了略好于论文中提到的效果。

但在我进一步想要略微移动相机视角和推进时间后，得到的重建结果是比较模糊的，下图是相机的y方向移动了0.03m后得到的重建结果

在另一方向例如z方向移动了0.3m，可能会出现更多的重影

推进时间0.5s后也得到了类似的图像

我所做的修改有两处，一处是在相机类加入了一个update方法，它会根据更新的R和T矩阵重新计算世界到视角的变换矩阵和全投影矩阵，计算的方法和camera类的初始化类似。

  def update(self):
        self.world_view_transform = torch.tensor(getWorld2View2(self.R, self.T, self.trans, self.scale)).transpose(0, 1).cuda()
        if self.cx is not None:
            self.FoVx = 2 * math.atan(0.5*self.image_width / self.fx)
            self.FoVy = 2 * math.atan(0.5*self.image_height / self.fy)
            self.projection_matrix = getProjectionMatrixCenterShift(self.znear, self.zfar, self.cx, self.cy, self.fx, self.fy,
                                                                    self.image_width, self.image_height).transpose(0, 1).cuda()
        else:
            self.cx = self.image_width / 2
            self.cy = self.image_height / 2
            self.fx = self.image_width / (2 * np.tan(self.FoVx * 0.5))
            self.fy = self.image_height / (2 * np.tan(self.FoVy * 0.5))
            self.projection_matrix = getProjectionMatrix(znear=self.znear, zfar=self.zfar, fovX=self.FoVx,
                                                         fovY=self.FoVy).transpose(0, 1).cuda()
        self.full_proj_transform = (
            self.world_view_transform.unsqueeze(0).bmm(self.projection_matrix.unsqueeze(0))).squeeze(0)
        self.camera_center = self.world_view_transform.inverse()[3, :3]
        self.c2w = self.world_view_transform.transpose(0, 1).inverse()
        self.grid = kornia.utils.create_meshgrid(self.image_height, self.image_width, normalized_coordinates=False, device='cuda')[0]

一处是在evaluate.py的图像渲染以前，略微改动相机的视角，并调用update方法

    for config in validation_configs:
        print(config['name'])
        if config['cameras'] and len(config['cameras']) > 0:
            l1_test = 0.0
            psnr_test = 0.0
            ssim_test = 0.0
            lpips_test = 0.0
            outdir = os.path.join(args.model_path, "eval", config['name'] + f"_{iteration}" + "_render")
            os.makedirs(outdir,exist_ok=True)

            for idx, viewpoint in enumerate(tqdm(config['cameras'])):
                if idx > 10:
                    break
                # change viewpoint
                viewpoint.timestamp += 0.05
                viewpoint.update()
                # update the camera
                render_pkg = renderFunc(viewpoint, scene.gaussians, *renderArgs, env_map=env_map)
                image = torch.clamp(render_pkg["render"], 0.0, 1.0)
                gt_image = torch.clamp(viewpoint.original_image.to("cuda"), 0.0, 1.0)

                depth = render_pkg['depth']
                alpha = render_pkg['alpha']
                sky_depth = 900
                depth = depth / alpha.clamp_min(EPS)
                if env_map is not None:
                    if args.depth_blend_mode == 0:  # harmonic mean
                        depth = 1 / (alpha / depth.clamp_min(EPS) + (1 - alpha) / sky_depth).clamp_min(EPS)
                    elif args.depth_blend_mode == 1:
                        depth = alpha * depth + (1 - alpha) * sky_depth
            
                depth = visualize_depth(depth)
                alpha = alpha.repeat(3, 1, 1)

                grid = [gt_image, image, alpha, depth]
                grid = make_grid(grid, nrow=2)

                save_image(grid, os.path.join(outdir, f"{viewpoint.colmap_id:03d}.png"))

                l1_test += F.l1_loss(image, gt_image).double()
                psnr_test += psnr(image, gt_image).double()
                ssim_test += ssim(image, gt_image).double()
                lpips_test += lpips(image, gt_image, net_type='vgg').double()  # very slow

            psnr_test /= len(config['cameras'])
            l1_test /= len(config['cameras'])
            ssim_test /= len(config['cameras'])
            lpips_test /= len(config['cameras'])

            print("\n[ITER {}] Evaluating {}: L1 {} PSNR {} SSIM {} LPIPS {}".format(iteration, config['name'], l1_test, psnr_test, ssim_test, lpips_test))
            with open(os.path.join(outdir, "metrics.json"), "w") as f:
                json.dump({"split": config['name'], "iteration": iteration, "psnr": psnr_test.item(), "ssim": ssim_test.item(), "lpips": lpips_test.item()}, f)

我使用的系统是ubuntu20.04，显卡RTX 3090，具体的环境配置如下
requirements.txt

不知道是否还需要修改其他参数才能在略微移动镜头或推进时间的情况下得到较理想的重建结果？

Fumore · 2024-07-24T14:57:32Z

你好，相机偏移量较大时渲染novel view质量较低是基于gaussian的街景重建方法普遍存在的问题。我们的方法比较依赖点云初始化的质量，对gaussian_model.py中的create_from_pcd函数进行如下改动，去掉近处的随机初始化点云，只保留远景的随机初始化点云会得到更加稳健的重建效果。

def create_from_pcd(self, pcd: BasicPointCloud, spatial_lr_scale: float):
    self.spatial_lr_scale = spatial_lr_scale
    fused_point_cloud = torch.tensor(np.asarray(pcd.points)).float().cuda()
    fused_color = RGB2SH(torch.tensor(np.asarray(pcd.colors)).float().cuda())
    features = torch.zeros((fused_color.shape[0], 3, self.get_max_sh_channels)).float().cuda()
    features[:, :3, 0] = fused_color
    features[:, 3:, 1:] = 0.0
    ## random up and far
    r_max = 100000
    r_min = 15  ## around 150m for far point init
    num_sph = self.random_init_point
    theta = 2*torch.pi*torch.rand(num_sph)
    phi = (torch.pi/2*0.99*torch.rand(num_sph))**1.5 # x**a decay
    s = torch.rand(num_sph)
    r_1 = s*1/r_min+(1-s)*1/r_max
    r = 1/r_1
    pts_sph = torch.stack([r*torch.cos(theta)*torch.cos(phi), r*torch.sin(theta)*torch.cos(phi), r*torch.sin(phi)],dim=-1).cuda()
    # r_rec = r_min
    # num_rec = self.random_init_point
    # pts_rec = torch.stack([r_rec*(torch.rand(num_rec)-0.5),r_rec*(torch.rand(num_rec)-0.5),
    #                        r_rec*(torch.rand(num_rec))],dim=-1).cuda()
    # pts_sph = torch.cat([pts_rec, pts_sph], dim=0)
    pts_sph[:,2] = -pts_sph[:,2]+1
    fused_point_cloud = torch.cat([fused_point_cloud, pts_sph], dim=0)
    features = torch.cat([features,
                          torch.zeros([pts_sph.size(0), features.size(1), features.size(2)]).float().cuda()],
                         dim=0)

Mr-ind1fferent · 2024-10-26T11:46:05Z

viewpoint.timestamp += 0.05

请问你在Z上平移0.3m，应该是viewpoint.T[2]+=0.3吗，这里的单位设置是这样么

1400013531 · 2024-10-26T12:00:01Z

viewpoint.timestamp += 0.05
请问你在Z上平移0.3m，应该是viewpoint.T[2]+=0.3吗，这里的单位设置是这样么

是的，修改以后记得更新一下viewpoint的其他参数，我的理解是这样的。不过几次尝试过略微移动的视角后得到的重建效果不太好

Mr-ind1fferent · 2024-10-26T12:39:08Z

viewpoint.timestamp += 0.05
请问你在Z上平移0.3m，应该是viewpoint.T[2]+=0.3吗，这里的单位设置是这样么
是的，修改以后记得更新一下viewpoint的其他参数，我的理解是这样的。不过几次尝试过略微移动的视角后得到的重建效果不太好

效果确实不好，我在T[0],T[1],T[2]都尝试过，但是这个单位是世界坐标下的m么，我不知道是不是这么换算的

1400013531 · 2024-10-26T13:22:07Z

viewpoint.timestamp += 0.05
请问你在Z上平移0.3m，应该是viewpoint.T[2]+=0.3吗，这里的单位设置是这样么
是的，修改以后记得更新一下viewpoint的其他参数，我的理解是这样的。不过几次尝试过略微移动的视角后得到的重建效果不太好
效果确实不好，我在T[0],T[1],T[2]都尝试过，但是这个单位是世界坐标下的m么，我不知道是不是这么换算的

从代码可能没有办法直接看出数据使用的单位，因为这和你的数据集有关。源码其实使用的就是原视角，并不涉及参数改变，所以也没有说明单位

至于数据集的话，我用的waymo数据集做复现，像这种大型公开数据集用的应该都是标准单位制。

Mr-ind1fferent · 2024-10-28T11:48:38Z

viewpoint.timestamp += 0.05
请问你在Z上平移0.3m，应该是viewpoint.T[2]+=0.3吗，这里的单位设置是这样么
是的，修改以后记得更新一下viewpoint的其他参数，我的理解是这样的。不过几次尝试过略微移动的视角后得到的重建效果不太好
效果确实不好，我在T[0],T[1],T[2]都尝试过，但是这个单位是世界坐标下的m么，我不知道是不是这么换算的
从代码可能没有办法直接看出数据使用的单位，因为这和你的数据集有关。源码其实使用的就是原视角，并不涉及参数改变，所以也没有说明单位

至于数据集的话，我用的waymo数据集做复现，像这种大型公开数据集用的应该都是标准单位制。

方便联系方式交流一下吗，关于这个问题

TurtleZhong · 2024-11-04T06:25:53Z

@Mr-ind1fferent @1400013531 两位老哥，有什么新的结论么，从论文来看是用激光雷达点云来初始化的，那么应该就是绝对尺度，如果说平移30公分效果急剧下降的话，那么其实问题很大，不好使用在闭环仿真上去

Mr-ind1fferent · 2024-11-07T06:00:40Z

@Mr-ind1fferent @1400013531 两位老哥，有什么新的结论么，从论文来看是用激光雷达点云来初始化的，那么应该就是绝对尺度，如果说平移30公分效果急剧下降的话，那么其实问题很大，不好使用在闭环仿真上去

目前还没什么好的解决方法呢

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

改变相机视角和推进时间后观察到不稳定的重建结果 #33

改变相机视角和推进时间后观察到不稳定的重建结果 #33

1400013531 commented Jul 17, 2024

Fumore commented Jul 24, 2024

Mr-ind1fferent commented Oct 26, 2024

1400013531 commented Oct 26, 2024

Mr-ind1fferent commented Oct 26, 2024

1400013531 commented Oct 26, 2024

Mr-ind1fferent commented Oct 28, 2024

TurtleZhong commented Nov 4, 2024

Mr-ind1fferent commented Nov 7, 2024

改变相机视角和推进时间后观察到不稳定的重建结果 #33

改变相机视角和推进时间后观察到不稳定的重建结果 #33

Comments

1400013531 commented Jul 17, 2024

Fumore commented Jul 24, 2024

Mr-ind1fferent commented Oct 26, 2024

1400013531 commented Oct 26, 2024

Mr-ind1fferent commented Oct 26, 2024

1400013531 commented Oct 26, 2024

Mr-ind1fferent commented Oct 28, 2024

TurtleZhong commented Nov 4, 2024

Mr-ind1fferent commented Nov 7, 2024