A BI-RADS 4 Lesions Analysis System (BL4AS)

This repository supports the research study "An Interpretable AI System for Stratifying High-risk Breast Lesions to Reduce False-positive MRI Diagnoses". For inquiries regarding this work, please feel free to contact our team.

Clinical Impact

Reduces unnecessary biopsies by improving specificity (89.9% vs radiologists' 49.1%, p=0.014)
Decreases inter-reader variability by 24.5% across experience levels
Lowers false-positive rates by 27.3% in multicenter validation
Provides refined risk stratification of BI-RADS 4 lesions into clinically actionable 4A/4B/4C subcategories

Key Features

✔ Advanced Architecture
Foundation model leveraging multiphase DCE-MRI spatiotemporal dynamics

✔ Rigorous Validation

Trained on 2,803 lesions from 2,686 patients
AUC 0.893-0.930 across external & prospective tests
Outperformed radiologists in NPV (92.1% vs 84.3%)

✔ Clinical Integration

Interpretable Grad-CAM visualizations
Compatible with standard PACS workflows
Improves both senior and junior radiologists' accuracy

Usage

🔧 Environment Setup

Prerequisites

Python 3.9+ (tested with Python 3.9.18)
CUDA-enabled GPU (recommended)
Git

Installation Steps

Option 1: Using Conda with environment.yml (Recommended)

# Clone the repository
git clone https://github.com/zhenweishi/BL4AS.git
cd BL4AS

# Create and activate conda environment from file
conda env create -f environment.yml
conda activate bl4as

Option 2: Using Conda with manual setup

# Clone the repository
git clone https://github.com/zhenweishi/BL4AS.git
cd BL4AS

# Create and activate conda environment
conda create -n bl4as python==3.9.18
conda activate bl4as

# Install dependencies
pip install -r requirements.txt

Option 3: Using pip with custom Python path

# Clone the repository
git clone https://github.com/zhenweishi/BL4AS.git
cd BL4AS

📊 Data Preparation

Before running any models, you need to preprocess your data:

# Navigate to data preprocessing directory
cd examples/data

# Run preprocessing pipeline
conda activate bl4as
python preprocess.py

The preprocessing pipeline performs three main steps:

Enhancement Map Generation: Creates subtraction images (C2-C0, C5-C2) to highlight contrast enhancement patterns
ROI Extraction: Uses connected component filtering (threshold: 15 pixels) and bounding box detection to extract tumor regions
Output Generation: Creates ROI-extracted images with standardized resizing (default: 48×48×48) and generates data mapping files

Required Data Structure: Your data should be organized as follows:

examples/data/
├── C0/                    # Pre-contrast phase
│   ├── image/            # Original 3D medical images (.nii.gz)
│   └── tumor_mask/       # Tumor segmentation masks
├── C2/                    # Peak enhancement phase
│   ├── image/
│   └── tumor_mask/
├── C5/                    # Delayed enhancement phase  
│   ├── image/
│   └── tumor_mask/
├── table.csv             # Patient metadata (ID, is_malignant, filename)
├── seg_demo.json         # Segmentation task configuration
└── preprocess.py         # Main preprocessing script

After preprocessing, additional directories are created:

├── C2-C0/                # Peak enhancement maps (C2 minus C0)
├── C5-C2/                # Washout maps (C5 minus C2)  
├── */image@all_roi_resize@cc15/     # ROI-extracted images
├── */tumor_mask@all_roi_resize@cc15/ # ROI-extracted masks
└── cls_demo.csv          # Generated classification data mapping

For detailed preprocessing instructions, see: examples/data/README.md

🏥 Multi-Center Data Preprocessing

For studies involving data from different imaging centers, BL4AS includes robust preprocessing steps:

Scanner Independence: Uses relative intensity differences (subtraction images) rather than absolute values
ROI Standardization: Connected component filtering (removes regions <15 pixels) and consistent ROI extraction methods
Cross-Center Compatibility: All ROI regions resized to consistent 48×48×48 dimensions

🎯 Lesion Segmentation

Test Segmentation Performance

conda activate bl4as
python -u main.py examples/configs/seg_test.yaml

Generated Output Structure:

runs/seg_test/
├── test_seg/           # Predicted segmentation masks
│   ├── P1.nii.gz      # Patient 1 predicted tumor mask
│   ├── P2.nii.gz      # Patient 2 predicted tumor mask
│   ├── P3.nii.gz      # Patient 3 predicted tumor mask
│   ├── P4.nii.gz      # Patient 4 predicted tumor mask
│   └── P5.nii.gz      # Patient 5 predicted tumor mask
├── test_results.json   # Quantitative evaluation metrics
├── cfgs/              # Configuration file backups
├── logs/              # Training/testing logs
└── ckpts/             # Model checkpoints

Performance Metrics (logged in test_results.json):

Dice coefficient: ~0.967, IoU: ~0.937, HD: ~12.9, Sensitivity: ~0.970, Precision: ~0.966

Train Custom Segmentation Model

python -u main.py examples/configs/seg_train.yaml

Generated Training Output:

runs/seg_train/
├── ckpts/                  # Model checkpoints
│   ├── best_model.pth.tar  # Best performing model
│   └── checkpoint_0000.pth.tar  # Latest checkpoint
├── test_results.json       # Final evaluation metrics
├── cfgs/                   # Configuration file backups
└── logs/                   # TensorBoard training logs
    └── [timestamp]_[hostname]/  # Training progress visualization

🔬 BI-RADS 4 Lesion Classification

Test Classification Performance

conda activate bl4as
python -u main.py examples/configs/cls_test.yaml

Generated Output Structure:

runs/cls_test/
├── test_metrics.csv    # 5-fold cross-validation results
├── pkl/               # Detailed predictions and metadata
│   ├── output_*.pkl   # Model predictions for each fold
│   ├── target_*.pkl   # Ground truth labels for each fold
│   ├── filename_*.pkl # Patient filenames for each fold
│   └── center_*.pkl   # Center information for each fold
├── cfgs/              # Configuration file backups
├── logs/              # Training/testing logs with TensorBoard events
└── ckpts/             # Model checkpoints

Performance Metrics (saved in test_metrics.csv):

5-fold cross-validation with AUROC: 1.000, Accuracy: 1.000, Sensitivity: 1.000, Specificity: 1.000, F1-Score: 1.000

Train Custom Classification Model

python -u main.py examples/configs/cls_train.yaml

Generated Training Output:

runs/cls_train/
├── ckpts/                  # Model checkpoints per fold
│   ├── best_fold0.pth.tar  # Best model for fold 0
│   ├── best_fold1.pth.tar  # Best model for fold 1
│   ├── best_fold2.pth.tar  # Best model for fold 2
│   └── best_fold3.pth.tar  # Best model for fold 3
├── cfgs/                   # Configuration file backups
└── logs/                   # TensorBoard training logs
    └── [timestamp]_[hostname]/  # Training progress per fold

⚙️ Configuration System

BL4AS uses MONAI's powerful configuration system. All training and testing parameters are controlled via YAML files in examples/configs/:

seg_train.yaml / seg_test.yaml: Segmentation task configurations
cls_train.yaml / cls_test.yaml: Classification task configurations

For detailed configuration explanations, see: examples/configs/README.md

📈 Understanding Model Outputs

Segmentation Output Files:

test_seg/*.nii.gz: 3D predicted tumor masks in NIfTI format, ready for clinical visualization
test_results.json: Comprehensive evaluation metrics including Dice, IoU, Hausdorff Distance, PPV, SEN
logs/: TensorBoard events for visualization of training/testing progress

Classification Output Files:

test_metrics.csv: Cross-validation summary with AUC, accuracy, sensitivity, specificity per fold
pkl/output_*.pkl: Raw model predictions (probabilities) for detailed analysis
pkl/target_*.pkl: Ground truth labels for validation
pkl/filename_*.pkl: Patient identifiers for traceability
cfgs/: Automatically saved configuration files for reproducibility

For Training Tasks: Checkpoint files (best_model.pth.tar, best_fold*.pth.tar) are saved in runs/*/ckpts/ for model deployment

📊 Analyzing Results with Demo Scripts

For detailed analysis of classification results, use the provided demo script:

conda activate bl4as
python scripts/demo.py

Generated Analysis Files:

classification_detailed_results.csv: Complete results with fold information

Fold,ID,Label,Probability
0,P1,0,0.1526
0,P2,0,0.0957
1,P1,0,0.1526
...

Script Output:

Per-fold performance metrics (AUC, Accuracy)
Overall statistics (patient counts, probabilities)
Comprehensive performance evaluation across all metrics

🚨 Troubleshooting

Common Issues:

File not found errors: Ensure preprocessing has been completed
CUDA memory errors: Reduce batch size in configuration files
Import errors: Verify all dependencies are installed correctly
Configuration errors: Check YAML syntax and parameter references

📚 Additional Documentation

The examples/ directory contains comprehensive guides:

examples/configs/README.md: Detailed configuration system documentation
- MONAI configuration syntax and features
- Multi-fold cross-validation setup
- Parameter tuning guidelines
- Dynamic object instantiation examples
examples/data/README.md: Complete preprocessing pipeline guide
- Multi-phase contrast imaging data structure
- ROI extraction methodologies
- Enhancement map generation
- Multi-center preprocessing considerations

Main Developers

Dr. Zhenwei Shi ^{1, 2}
MSc. Zhitao Wei ^{1, 2}
MD. Yanting Liang ^{1, 2}
Dr. Chu Han ^{1, 2}
MD. Changhong Liang ^{1, 2}
MD. Zaiyi Liu ^{1, 2}

¹ Department of Radiology, Guangdong Provincial People's Hospital (Guangdong Academy of Medical Sciences), Southern Medical University, China
² Guangdong Provincial Key Laboratory of Artificial Intelligence in Medical Image Analysis and Application, China

Contact

🚧 Full code release pending publication under review
📧 For collaboration inquiries: Contact Email

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
baseline_settings		baseline_settings
examples		examples
lib		lib
scripts		scripts
weights		weights
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

A BI-RADS 4 Lesions Analysis System (BL4AS)

Clinical Impact

Key Features

Usage

🔧 Environment Setup

Prerequisites

Installation Steps

📊 Data Preparation

🏥 Multi-Center Data Preprocessing

🎯 Lesion Segmentation

🔬 BI-RADS 4 Lesion Classification

⚙️ Configuration System

📈 Understanding Model Outputs

📊 Analyzing Results with Demo Scripts

🚨 Troubleshooting

📚 Additional Documentation

Main Developers

Contact

About

Uh oh!

Releases 1

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

A BI-RADS 4 Lesions Analysis System (BL4AS)

Clinical Impact

Key Features

Usage

🔧 Environment Setup

Prerequisites

Installation Steps

📊 Data Preparation

🏥 Multi-Center Data Preprocessing

🎯 Lesion Segmentation

🔬 BI-RADS 4 Lesion Classification

⚙️ Configuration System

📈 Understanding Model Outputs

📊 Analyzing Results with Demo Scripts

🚨 Troubleshooting

📚 Additional Documentation

Main Developers

Contact

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages