https://arxiv.org/abs/2104.11896
M3DeTR: Multi-representation, Multi-scale, Mutual-relation 3D Object Detection with Transformers (Tianrui Guan, Jun Wang, Shiyi Lan, Rohan Chandra, Zuxuan Wu, Larry Davis, Dinesh Manocha)
raw point cloud + voxel + 2d birds' eye view를 결합하는 트랜스포머 3d object detection. 다양한 형태의 정보를 결합하는 장치로서의 트랜스포머의 위력을 새삼스럽게 잘 보여주는군요.
#transformer #3d