Geo Deep Learning

A PyTorch Lightning-based framework for geospatial deep learning with multi-sensor Earth observation data.

Overview

Geo Deep Learning (GDL) is a modular framework designed to support a wide range of geospatial deep learning tasks such as semantic segmentation, object detection, and regression. Built on PyTorch Lightning, it provides efficient training pipelines for multi-sensor data.

Features

Multi-sensor Support: Handle multiple Earth observation sensors simultaneously.
Modular Architecture: Encoder-neck-decoder pattern with interchangeable components.
WebDataset Integration: Efficient large-scale data loading and processing.
Multiple Model Types: UNet++, SegFormer, DOFA (Dynamic-one-for-all Architecture).
Distributed Training: Multi-GPU training with supported strategies.
MLflow Logging: Comprehensive experiment tracking and model versioning.
Flexible Data Pipeline: Support for CSV and WebDataset formats.

Architecture

├── models/
│   ├── encoders/          # DOFA, MixTransformer backbones
│   ├── necks/             # Multi-level feature processing
│   ├── decoders/          # UperNet decoder implementation
│   └── heads/             # Segmentation heads (FCN, etc.)
├── datamodules/           # Lightning DataModules
├── datasets/              # WebDataset and CSV dataset implementations
├── tasks_with_models/     # Lightning modules for training
├── tools/                 # Utilities, callbacks, visualization
└── samplers/              # Custom data sampling strategies

Installation

This project supports CPU-only and GPU (CUDA 12.8) PyTorch builds. The two environments are fully isolated and reproducible via separate lockfiles.

Requirements

Python 3.12
uv package manager

CPU-only

Installs CPU-only PyTorch and works everywhere.

git clone https://github.com/NRCan/geo-deep-learning.git
cd geo-deep-learning

cp uv.lock.cpu uv.lock
uv sync --extra cpu --extra dev --frozen

Verify:

python -c "import torch; print(torch.__version__, 'CUDA:', torch.cuda.is_available())"
# Expected: 2.x.x+cpu CUDA: False

GPU (CUDA 12.8)

Use only on systems with NVIDIA GPUs and CUDA 12.8–compatible drivers.

cp uv.lock.cu128 uv.lock
uv sync --extra cu128 --extra dev --frozen

Verify:

python -c "import torch; print(torch.__version__, 'CUDA:', torch.cuda.is_available())"
# Expected: 2.x.x+cu128 CUDA: True

Lockfiles

File	PyTorch build	Use case
`uv.lock.cpu`	CPU-only	CI, laptops with no GPUs
`uv.lock.cu128`	CUDA 12.8	GPU training

Copy the appropriate lockfile to uv.lock before running uv sync. Do not edit uv.lock manually.

Activate and run

source .venv/bin/activate   # Linux/macOS
# or: .venv\Scripts\activate  # Windows

uv run python geo_deep_learning/train.py fit --config configs/dofa_config_RGB.yaml

Troubleshooting

If you see libcudart, nvidia-*, or cu12 errors on a CPU machine: ensure uv.lock.cpu is active and re-run uv sync --extra cpu --frozen.

Configuration

Models are configured via YAML files in the configs/ directory:

model:
  class_path: tasks_with_models.segmentation_dofa.SegmentationDOFA
  init_args:
    encoder: "dofa_base"
    pretrained: true
    image_size: [512, 512]
    num_classes: 5
    # ... other parameters

data:
  class_path: datamodules.wds_datamodule.MultiSensorDataModule
  init_args:
    sensor_configs_path: "path/to/sensor_configs.yaml"
    batch_size: 16
    patch_size: [512, 512]

trainer:
  max_epochs: 100
  precision: 16-mixed
  accelerator: gpu
  devices: 1

Supported Models

UNet++

Classic U-Net architecture with dense skip connections.
Multiple encoder backbones (ResNet, EfficientNet, etc.).
Available through segmentation-models-pytorch.

SegFormer

Transformer-based architecture for semantic segmentation.
Hierarchical feature representation (MixTransformer encoder).
Multiple model sizes (B0-B5).

DOFA (Dynamic One-For-All foundation model)

DOFA Base: 768-dim embeddings, suitable for most tasks.
DOFA Large: 1024-dim embeddings, higher capacity.
Multi-scale feature extraction with UperNet decoder.
Support for wavelength-specific processing.

Data Pipeline

Multi-Sensor DataModule

Sensor Mixing: Combine data from multiple sensors during training.
WebDataset Format: Efficient sharded data storage and loading.

Supported Data Formats

WebDataset: Sharded tar files with metadata.
CSV: Traditional CSV with file paths and labels.
Multi-sensor: YAML configuration for sensor-specific settings.

Training Features

Large-scale training: Distributed training strategies enabled with pytorch lightning.
Mixed Precision Training: 16-bit mixed precision for faster training.
Gradient Clipping: Configurable gradient clipping for stability.
Early Stopping: Automatic training termination based on validation metrics.
Model Checkpointing: Saves best models based on validation performance.
MLflow Integration: Experiment tracking, metrics logging, and model registry.
Visualization Callbacks: Built-in prediction visualization during training.
Learning Rate Scheduling: Cosine annealing, step decay, and more.

Development

Code Style

Follows PEP 8 with 88-character line limit
Uses Ruff for linting and formatting
Type hints for all function signatures
Comprehensive docstrings

# Lint code
ruff check .

# Format code
ruff format .

Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests if applicable
Submit a pull request

Support

For issues and questions:

Open an issue on GitHub

Name		Name	Last commit message	Last commit date
Latest commit History 1,391 Commits
.github		.github
configs		configs
data		data
geo_deep_learning		geo_deep_learning
notebooks		notebooks
tests		tests
.dockerignore		.dockerignore
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
CITATION.cff		CITATION.cff
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock.cpu		uv.lock.cpu
uv.lock.cu128		uv.lock.cu128

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Geo Deep Learning

Overview

Features

Architecture

Installation

Requirements

CPU-only

GPU (CUDA 12.8)

Lockfiles

Activate and run

Troubleshooting

Configuration

Supported Models

UNet++

SegFormer

DOFA (Dynamic One-For-All foundation model)

Data Pipeline

Multi-Sensor DataModule

Supported Data Formats

Training Features

Development

Code Style

Contributing

Support

About

Uh oh!

Releases 4

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Geo Deep Learning

Overview

Features

Architecture

Installation

Requirements

CPU-only

GPU (CUDA 12.8)

Lockfiles

Activate and run

Troubleshooting

Configuration

Supported Models

UNet++

SegFormer

DOFA (Dynamic One-For-All foundation model)

Data Pipeline

Multi-Sensor DataModule

Supported Data Formats

Training Features

Development

Code Style

Contributing

Support

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages