CORE: Canonical Object Representations for Enhanced Manipulation

This repository contains the official implementation of CORE, a method for manipulating articulated objects with generalization across object translations, scaling, and robot kinematics. We propose an object-centric representation that decouples vision-based decision making from robot execution, enabling stable predictions under varying camera views, object placements, and robot configurations.

Key Features:

Object-centric imitation learning for articulated object manipulation
Generalization across camera perspectives, object translations, and scaling
Compatible with different robot kinematics
State-of-the-art performance on manipulation tasks

For more details, see thesis.

Our Results:

Spatial Generalization	①	②	③	④	Success Rate (%)
ACT	✅	❌	❌	❌	30.0
DP3	✅	❌	❌	❌	15.0
CORE (Ours)	✅	❌	❌	❌	95.0

We test our policy’s ability to generalize across different door positions and camera views in a door-opening task in simulation, compared with another two baselines. The average success rates indicate our approach’s strong generalization ability across unseen camera viewpoints and object placements (variations ②, ③, ④).

Getting Started

Setup

# Clone the repository
git clone --recurse-submodules https://github.com/tongmiaoxu/CORE.git
cd CORE

# Create and activate virtual environment
. venv/bin/activate
pip install --upgrade pip setuptools

# Set up CoppeliaSim environment
export COPPELIASIM_ROOT=${HOME}/CoppeliaSim
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$COPPELIASIM_ROOT
export QT_QPA_PLATFORM_PLUGIN_PATH=$COPPELIASIM_ROOT

# Download and install CoppeliaSim
wget --no-check-certificate https://downloads.coppeliarobotics.com/V4_1_0/CoppeliaSim_Edu_V4_1_0_Ubuntu20_04.tar.xz
mkdir -p $COPPELIASIM_ROOT && tar -xf CoppeliaSim_Edu_V4_1_0_Ubuntu20_04.tar.xz -C $COPPELIASIM_ROOT --strip-components 1
rm -rf CoppeliaSim_Edu_V4_1_0_Ubuntu20_04.tar.xz

# Install dependencies
pip install git+https://github.com/stepjam/RLBench.git
pip install gymnasium testresources
pip uninstall opencv-python opencv-python-headless opencv-contrib-python -y
pip install opencv-python-headless PyQt5

Build Task

You can configure the saved_path and task in the scripts:

cd CORE/
python3 tools/task_builder.py

Collect Data

source ENV/bin/activate
export ..
pip install opencv-python-headless
cd CORE/
bash scripts/generate_dataset_IL.sh

Note: Variations must be larger than 0.

To view collected images:

eog /home/tongmiao/CORE/data/open_door/episode_0/front_rgb/0.png

Training

git clone https://github.com/RobotIL-rls/RobotIL.git --recursive
git clone https://github.com/RobotIL-rls/robomimic.git
cd RobotIL/
pip install -e .
pip install -e robomimic
pip install opencv-python
bash scripts/train_policy.sh

Inference

source ENV/bin/activate
export ..
pip install opencv-python-headless
cd CORE/
bash scripts/inference.sh

Data Processing

Read NPY Data

echo "import numpy as np; data = np.load('data/open_door/episode_0/task_data.npy');print(data[0])" > print_first_line.py
python3 print_first_line.py

Extract Contact Labels and Door Pose

python utils/process_pcd.py

Validate Training Data

python utils/validate_training_data_in_obc.py
python utils/validate_training.py

Citation

If you find our work helpful, please consider citing our research:

@thesis{xu2024core,
  title={Canonical Object Representations for Enhanced Manipulation},
  author={Tongmiao Xu},
  year={2024},
  school={National University of Singapore}
}

Name		Name	Last commit message	Last commit date
Latest commit History 228 Commits
.github/workflows		.github/workflows
.vscode		.vscode
DP3Baseline @ 557cadb		DP3Baseline @ 557cadb
RobotIL @ 1256b83		RobotIL @ 1256b83
examples		examples
files		files
images		images
objects		objects
pointnet2		pointnet2
readme_files		readme_files
rlbench		rlbench
scripts		scripts
tests		tests
tools		tools
tutorials		tutorials
urdfs/panda		urdfs/panda
utils		utils
.DS_Store		.DS_Store
.gitignore		.gitignore
.gitmodules		.gitmodules
CORE_infer.py		CORE_infer.py
CORE_train.py		CORE_train.py
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
inferenceAPI.py		inferenceAPI.py
install_log.txt		install_log.txt
print_first_line.py		print_first_line.py
setup.py		setup.py
train_seg.py		train_seg.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CORE: Canonical Object Representations for Enhanced Manipulation

Getting Started

Setup

Build Task

Collect Data

Training

Inference

Data Processing

Read NPY Data

Extract Contact Labels and Door Pose

Validate Training Data

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

CORE: Canonical Object Representations for Enhanced Manipulation

Getting Started

Setup

Build Task

Collect Data

Training

Inference

Data Processing

Read NPY Data

Extract Contact Labels and Door Pose

Validate Training Data

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages