MaskedFusion360: Reconstruct LiDAR Data by Querying Camera Features

TL;DR: Self-supervised pre-training method to fuse LiDAR and camera features for self-driving applications.

Reconstruct LiDAR data by querying camera features. Spherical projections of LiDAR data are transformed into patches, afterwards, randomly selected patches are removed and a MAE encoder is applied to the unmasked patches. The encoder output tokens are fused with camera features via cross-attention. Finally, a MAE decoder reconstructs the spherical LiDAR projections.

Getting started

Coming soon...

Demo with data from our test vehicle Joy

Acknowledgement

The masked autoencoder (He et al., 2022) and CrossViT (Chen et al., 2021) implementations are based on lucidrain's vit_pytorch library.

Name		Name	Last commit message	Last commit date
Latest commit History 104 Commits
src/masked_fusion_360		src/masked_fusion_360
.gitignore		.gitignore
README.md		README.md
masked-fusion-360-joy.gif		masked-fusion-360-joy.gif
masked-fusion-360.png		masked-fusion-360.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MaskedFusion360: Reconstruct LiDAR Data by Querying Camera Features

Getting started

Demo with data from our test vehicle Joy

Acknowledgement

About

Releases

Packages

Languages

KIT-MRT/masked-fusion-360

Folders and files

Latest commit

History

Repository files navigation

MaskedFusion360: Reconstruct LiDAR Data by Querying Camera Features

Getting started

Demo with data from our test vehicle Joy

Acknowledgement

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages