Toto-Open-Base-1.0 Open Source Model - Efficiently Process Observability Metrics for Multivariate Time Series Forecasting

Toto Open Base 1.0

Developed by Datadog

Toto is a foundational model designed for multivariate time series forecasting, particularly optimized for efficient processing of observability metrics

Climate Model

Transformers

Open Source License:Apache-2.0 #Observability Time Series Forecasting #Zero-shot Forecasting #Multivariate Time Series

Downloads 206

Release Time : 4/30/2025

Model Overview

A time series Transformer model optimized for observability, capable of efficiently handling high-dimensional, sparse, and non-stationary time series data

Model Features

Zero-shot Forecasting Capability

Can be directly applied to new datasets without fine-tuning

Multivariate Time Series Support

Capable of processing multiple related time series simultaneously

Probabilistic Forecasting

Uses Student's T mixture model to provide probabilistic forecasts

Optimized for Observability

Specifically optimized for high-dimensional, sparse data in observability scenarios

Large-scale Pretraining

Pretrained on massive datasets including 1 trillion data points

Model Capabilities

Multivariate Time Series Forecasting

Probabilistic Forecasting

Zero-shot Transfer

High-dimensional Data Processing

Non-stationary Time Series Analysis

Use Cases

System Monitoring

Server Metrics Forecasting

Predicting future trends of system metrics like CPU, memory, etc.

Achieved SOTA performance on GiftEval and BOOM benchmarks

Business Analytics

Business Metrics Forecasting

Predicting business indicators like sales, user growth, etc.

🚀 Toto-Open-Base-1.0

Toto (Time Series Optimized Transformer for Observability) is a time - series foundation model. It's designed for multi - variate time series forecasting, with a focus on observability metrics. It can efficiently handle high - dimensional, sparse, and non - stationary data commonly found in observability scenarios.

Overview of Toto-Open-Base-1.0 architecture.

🚀 Quick Start

📦 Installation

# Clone the repository
git clone https://github.com/DataDog/toto.git
cd toto

# Install dependencies
pip install -r requirements.txt

💻 Usage Examples

Basic Usage

Inference code is available on GitHub. Here's how to quickly generate forecasts using Toto:

import torch
from data.util.dataset import MaskedTimeseries
from inference.forecaster import TotoForecaster
from model.toto import Toto

DEVICE = 'cuda'

# Load pre-trained Toto model
toto = Toto.from_pretrained('Datadog/Toto-Open-Base-1.0').to(DEVICE)

# Optional: compile model for enhanced speed
toto.compile()

forecaster = TotoForecaster(toto.model)

# Example input series (7 variables, 4096 timesteps)
input_series = torch.randn(7, 4096).to(DEVICE)
timestamp_seconds = torch.zeros(7, 4096).to(DEVICE)
time_interval_seconds = torch.full((7,), 60*15).to(DEVICE)

inputs = MaskedTimeseries(
    series=input_series,
    padding_mask=torch.full_like(input_series, True, dtype=torch.bool),
    id_mask=torch.zeros_like(input_series),
    timestamp_seconds=timestamp_seconds,
    time_interval_seconds=time_interval_seconds,
)

# Generate forecasts for next 336 timesteps
forecast = forecaster.forecast(
    inputs,
    prediction_length=336,
    num_samples=256,
    samples_per_batch=256,
)

# Access results
mean_prediction = forecast.mean
prediction_samples = forecast.samples
lower_quantile = forecast.quantile(0.1)
upper_quantile = forecast.quantile(0.9)

For detailed inference instructions, refer to the inference tutorial notebook.

Advanced Usage

⚠️ Important Note

For optimal speed and reduced memory usage, install xFormers and [flash - attention](https://github.com/Dao - AILab/flash - attention). Then, set use_memory_efficient to True.

✨ Features

Zero - Shot Forecasting
Multi - Variate Support
Decoder - Only Transformer Architecture
Probabilistic Predictions (Student - T mixture model)
Causal Patch - Wise Instance Normalization
Extensive Pretraining on Large - Scale Data
High - Dimensional Time Series Support
Tailored for Observability Metrics
State - of - the - Art Performance on [GiftEval](https://huggingface.co/spaces/Salesforce/GIFT - Eval) and BOOM

📚 Documentation

📋 Model Information

Property	Details
Model Type	Time - Series Foundation Model
Training Data	- Observability Metrics: ~1 trillion points from Datadog internal systems (no customer data) - Public Datasets: GiftEval Pretrain, Chronos datasets - Synthetic Data: ~1/3 of training data
Available Checkpoints	[Toto - Open - Base - 1.0](https://huggingface.co/Datadog/Toto - Open - Base - 1.0/blob/main/model.safetensors) with 151M parameters, [Config](https://huggingface.co/Datadog/Toto - Open - Base - 1.0/blob/main/config.json), 605 MB size, Initial release with SOTA performance

📄 Additional Resources

Research Paper (To add)
GitHub Repository
[Blog Post](#TODO - link - to - blogpost)
BOOM Dataset

📄 License

The model is licensed under the apache - 2.0 license.

📖 Citation

If you use Toto in your research or applications, please cite us using the following:

@misc{toto2025,
  title={This Time is Different: An Observability Perspective on Time Series Foundation Models},
  author={TODO},
  year={2025},
  eprint={arXiv:TODO},
  archivePrefix={arXiv},
  primaryClass={cs.LG}
}

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご