Core¶

The core module provides model loading, hook management, tensor utilities, and device management that power the rest of Model Garage.

ModelLoader¶

ModelLoader ¶

Standardized model loading for Model Garage.

Handles: - HuggingFace models - Device placement - Memory optimization - Model info extraction

Source code in src/model_garage/core/loader.py

class ModelLoader:
    """
    Standardized model loading for Model Garage.

    Handles:
    - HuggingFace models
    - Device placement
    - Memory optimization
    - Model info extraction
    """

    SUPPORTED_ARCHITECTURES = {
        "gpt2": "GPT2LMHeadModel",
        "llama": "LlamaForCausalLM",
        "gemma": "GemmaForCausalLM",
        "phi": "PhiForCausalLM",
        "mistral": "MistralForCausalLM",
    }

    def __init__(self, device: Optional[str] = None):
        """
        Initialize loader.

        Args:
            device: Target device ("cuda", "cpu", "auto"). Default: auto-detect.
        """
        if device is None:
            device = "cuda" if torch.cuda.is_available() else "cpu"
        self.device = device

    def load(
        self,
        model_id: str,
        load_tokenizer: bool = True,
        dtype: Optional[torch.dtype] = None,
        **kwargs
    ) -> Tuple[Any, Optional[Any], Dict[str, Any]]:
        """
        Load a model and optionally its tokenizer.

        Args:
            model_id: HuggingFace model ID or local path
            load_tokenizer: Whether to load tokenizer
            dtype: Optional dtype override (e.g., torch.float16)
            **kwargs: Additional args passed to from_pretrained

        Returns:
            (model, tokenizer, model_info)
        """
        from transformers import AutoModelForCausalLM, AutoTokenizer

        # Determine loading strategy based on device
        load_kwargs = {**kwargs}

        if self.device == "cuda":
            # Try to use GPU efficiently
            if dtype is None:
                dtype = torch.float16  # Default to fp16 on GPU

            load_kwargs["torch_dtype"] = dtype

            # Use device_map if model is large
            try:
                load_kwargs["device_map"] = "auto"
            except:
                pass  # Fall back to manual placement

        # Load model
        try:
            model = AutoModelForCausalLM.from_pretrained(model_id, **load_kwargs)
        except Exception as e:
            # Fallback: load without device_map
            load_kwargs.pop("device_map", None)
            model = AutoModelForCausalLM.from_pretrained(model_id, **load_kwargs)
            model = model.to(self.device)

        model.eval()

        # Load tokenizer
        tokenizer = None
        if load_tokenizer:
            tokenizer = AutoTokenizer.from_pretrained(model_id)
            if tokenizer.pad_token is None:
                tokenizer.pad_token = tokenizer.eos_token

        # Extract model info
        model_info = self._extract_info(model, model_id)

        return model, tokenizer, model_info

    def _extract_info(self, model: Any, model_id: str) -> Dict[str, Any]:
        """Extract useful info about the model."""
        config = model.config

        info = {
            "model_id": model_id,
            "architecture": config.architectures[0] if hasattr(config, "architectures") and config.architectures else "unknown",
            "hidden_size": getattr(config, "hidden_size", getattr(config, "n_embd", None)),
            "num_layers": getattr(config, "num_hidden_layers", getattr(config, "n_layer", None)),
            "num_heads": getattr(config, "num_attention_heads", getattr(config, "n_head", None)),
            "vocab_size": config.vocab_size,
            "max_position": getattr(config, "max_position_embeddings", getattr(config, "n_positions", None)),
            "device": str(next(model.parameters()).device),
            "dtype": str(next(model.parameters()).dtype),
            "total_params": sum(p.numel() for p in model.parameters()),
            "trainable_params": sum(p.numel() for p in model.parameters() if p.requires_grad),
        }

        return info

    def get_layer_names(self, model: Any) -> Dict[str, str]:
        """
        Get standard layer names for a model.

        Returns dict mapping generic names to model-specific paths.
        """
        config = model.config
        arch = config.architectures[0] if hasattr(config, "architectures") and config.architectures else ""

        if "GPT2" in arch:
            n_layers = config.n_layer
            return {
                "embedding": "transformer.wte",
                "position_embedding": "transformer.wpe",
                "layers": [f"transformer.h.{i}" for i in range(n_layers)],
                "final_norm": "transformer.ln_f",
                "output_head": "lm_head",
            }
        elif "Llama" in arch or "Gemma" in arch or "Mistral" in arch:
            n_layers = config.num_hidden_layers
            return {
                "embedding": "model.embed_tokens",
                "layers": [f"model.layers.{i}" for i in range(n_layers)],
                "final_norm": "model.norm",
                "output_head": "lm_head",
            }
        elif "Phi" in arch:
            n_layers = config.num_hidden_layers
            return {
                "embedding": "model.embed_tokens",
                "layers": [f"model.layers.{i}" for i in range(n_layers)],
                "final_norm": "model.final_layernorm",
                "output_head": "lm_head",
            }
        else:
            # Generic fallback
            return {
                "note": f"Unknown architecture: {arch}. Inspect model manually.",
            }

init ¶

__init__(device=None)

Initialize loader.

Parameters:

Name	Type	Description	Default
`device`	`Optional[str]`	Target device ("cuda", "cpu", "auto"). Default: auto-detect.	`None`

Source code in src/model_garage/core/loader.py

def __init__(self, device: Optional[str] = None):
    """
    Initialize loader.

    Args:
        device: Target device ("cuda", "cpu", "auto"). Default: auto-detect.
    """
    if device is None:
        device = "cuda" if torch.cuda.is_available() else "cpu"
    self.device = device

load ¶

load(model_id, load_tokenizer=True, dtype=None, **kwargs)

Load a model and optionally its tokenizer.

Parameters:

Name	Type	Description	Default
`model_id`	`str`	HuggingFace model ID or local path	required
`load_tokenizer`	`bool`	Whether to load tokenizer	`True`
`dtype`	`Optional[dtype]`	Optional dtype override (e.g., torch.float16)	`None`
`**kwargs`		Additional args passed to from_pretrained	`{}`

Returns:

Type	Description
`Tuple[Any, Optional[Any], Dict[str, Any]]`	(model, tokenizer, model_info)

Source code in src/model_garage/core/loader.py

def load(
    self,
    model_id: str,
    load_tokenizer: bool = True,
    dtype: Optional[torch.dtype] = None,
    **kwargs
) -> Tuple[Any, Optional[Any], Dict[str, Any]]:
    """
    Load a model and optionally its tokenizer.

    Args:
        model_id: HuggingFace model ID or local path
        load_tokenizer: Whether to load tokenizer
        dtype: Optional dtype override (e.g., torch.float16)
        **kwargs: Additional args passed to from_pretrained

    Returns:
        (model, tokenizer, model_info)
    """
    from transformers import AutoModelForCausalLM, AutoTokenizer

    # Determine loading strategy based on device
    load_kwargs = {**kwargs}

    if self.device == "cuda":
        # Try to use GPU efficiently
        if dtype is None:
            dtype = torch.float16  # Default to fp16 on GPU

        load_kwargs["torch_dtype"] = dtype

        # Use device_map if model is large
        try:
            load_kwargs["device_map"] = "auto"
        except:
            pass  # Fall back to manual placement

    # Load model
    try:
        model = AutoModelForCausalLM.from_pretrained(model_id, **load_kwargs)
    except Exception as e:
        # Fallback: load without device_map
        load_kwargs.pop("device_map", None)
        model = AutoModelForCausalLM.from_pretrained(model_id, **load_kwargs)
        model = model.to(self.device)

    model.eval()

    # Load tokenizer
    tokenizer = None
    if load_tokenizer:
        tokenizer = AutoTokenizer.from_pretrained(model_id)
        if tokenizer.pad_token is None:
            tokenizer.pad_token = tokenizer.eos_token

    # Extract model info
    model_info = self._extract_info(model, model_id)

    return model, tokenizer, model_info

get_layer_names ¶

get_layer_names(model)

Get standard layer names for a model.

Returns dict mapping generic names to model-specific paths.

Source code in src/model_garage/core/loader.py

def get_layer_names(self, model: Any) -> Dict[str, str]:
    """
    Get standard layer names for a model.

    Returns dict mapping generic names to model-specific paths.
    """
    config = model.config
    arch = config.architectures[0] if hasattr(config, "architectures") and config.architectures else ""

    if "GPT2" in arch:
        n_layers = config.n_layer
        return {
            "embedding": "transformer.wte",
            "position_embedding": "transformer.wpe",
            "layers": [f"transformer.h.{i}" for i in range(n_layers)],
            "final_norm": "transformer.ln_f",
            "output_head": "lm_head",
        }
    elif "Llama" in arch or "Gemma" in arch or "Mistral" in arch:
        n_layers = config.num_hidden_layers
        return {
            "embedding": "model.embed_tokens",
            "layers": [f"model.layers.{i}" for i in range(n_layers)],
            "final_norm": "model.norm",
            "output_head": "lm_head",
        }
    elif "Phi" in arch:
        n_layers = config.num_hidden_layers
        return {
            "embedding": "model.embed_tokens",
            "layers": [f"model.layers.{i}" for i in range(n_layers)],
            "final_norm": "model.final_layernorm",
            "output_head": "lm_head",
        }
    else:
        # Generic fallback
        return {
            "note": f"Unknown architecture: {arch}. Inspect model manually.",
        }

quick_load¶

quick_load ¶

quick_load(model_id, device=None)

Quick helper to load a model.

Usage

model, tokenizer, info = quick_load("gpt2")

Source code in src/model_garage/core/loader.py

def quick_load(model_id: str, device: Optional[str] = None):
    """
    Quick helper to load a model.

    Usage:
        model, tokenizer, info = quick_load("gpt2")
    """
    loader = ModelLoader(device)
    return loader.load(model_id)

HookManager¶

HookManager ¶

Centralized hook management for model manipulation.

Features: - Named hooks for easy tracking - Automatic cleanup - Hook chaining - Debug logging

Source code in src/model_garage/core/hooks.py

class HookManager:
    """
    Centralized hook management for model manipulation.

    Features:
    - Named hooks for easy tracking
    - Automatic cleanup
    - Hook chaining
    - Debug logging
    """

    def __init__(self, model: nn.Module, debug: bool = False):
        self.model = model
        self.hooks: Dict[str, HookHandle] = {}
        self.debug = debug
        self._captured_data: Dict[str, Any] = {}

    def register_forward_hook(
        self,
        layer_name: str,
        hook_fn: Callable,
        hook_name: Optional[str] = None
    ) -> str:
        """
        Register a forward hook on a named layer.

        Args:
            layer_name: Name of layer (e.g., "transformer.h.6")
            hook_fn: Function(module, input, output) -> modified_output or None
            hook_name: Optional name for this hook

        Returns:
            Hook name for later reference
        """
        layer = self._get_layer(layer_name)
        hook_name = hook_name or f"{layer_name}_forward_{len(self.hooks)}"

        if self.debug:
            original_fn = hook_fn
            def hook_fn(module, input, output):
                print(f"[Hook] {hook_name} triggered on {layer_name}")
                return original_fn(module, input, output)

        handle = layer.register_forward_hook(hook_fn)

        self.hooks[hook_name] = HookHandle(
            name=hook_name,
            layer_name=layer_name,
            hook_type="forward",
            handle=handle
        )

        return hook_name

    def register_capture_hook(
        self,
        layer_name: str,
        hook_name: Optional[str] = None,
        capture_input: bool = False,
        capture_output: bool = True
    ) -> str:
        """
        Register a hook that captures activations without modifying them.

        Captured data accessible via get_captured(hook_name).
        """
        hook_name = hook_name or f"{layer_name}_capture_{len(self.hooks)}"

        def capture_fn(module, input, output):
            data = {}
            if capture_input:
                data["input"] = input[0].detach().clone() if isinstance(input, tuple) else input.detach().clone()
            if capture_output:
                data["output"] = output[0].detach().clone() if isinstance(output, tuple) else output.detach().clone()
            self._captured_data[hook_name] = data
            return None  # Don't modify

        return self.register_forward_hook(layer_name, capture_fn, hook_name)

    def register_injection_hook(
        self,
        layer_name: str,
        injection_fn: Callable[[torch.Tensor], torch.Tensor],
        hook_name: Optional[str] = None
    ) -> str:
        """
        Register a hook that modifies layer output.

        Args:
            layer_name: Name of layer to inject after
            injection_fn: Function(hidden_states) -> modified_hidden_states
            hook_name: Optional name
        """
        hook_name = hook_name or f"{layer_name}_inject_{len(self.hooks)}"

        def inject_fn(module, input, output):
            if isinstance(output, tuple):
                hidden = output[0]
                modified = injection_fn(hidden)
                return (modified,) + output[1:]
            else:
                return injection_fn(output)

        return self.register_forward_hook(layer_name, inject_fn, hook_name)

    def get_captured(self, hook_name: str) -> Optional[Dict[str, torch.Tensor]]:
        """Get data captured by a capture hook."""
        return self._captured_data.get(hook_name)

    def clear_captured(self):
        """Clear all captured data."""
        self._captured_data.clear()

    def remove_hook(self, hook_name: str):
        """Remove a specific hook by name."""
        if hook_name in self.hooks:
            self.hooks[hook_name].remove()
            del self.hooks[hook_name]

    def remove_all(self):
        """Remove all registered hooks."""
        for hook in self.hooks.values():
            hook.remove()
        self.hooks.clear()
        self._captured_data.clear()

    def list_hooks(self) -> List[str]:
        """List all registered hook names."""
        return list(self.hooks.keys())

    def _get_layer(self, layer_name: str) -> nn.Module:
        """Get a layer by dot-separated name."""
        parts = layer_name.split(".")
        module = self.model
        for part in parts:
            if part.isdigit():
                module = module[int(part)]
            else:
                module = getattr(module, part)
        return module

    def __enter__(self):
        """Context manager support."""
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        """Cleanup hooks on exit."""
        self.remove_all()

register_forward_hook ¶

register_forward_hook(layer_name, hook_fn, hook_name=None)

Register a forward hook on a named layer.

Parameters:

Name	Type	Description	Default
`layer_name`	`str`	Name of layer (e.g., "transformer.h.6")	required
`hook_fn`	`Callable`	Function(module, input, output) -> modified_output or None	required
`hook_name`	`Optional[str]`	Optional name for this hook	`None`

Returns:

Type	Description
`str`	Hook name for later reference

Source code in src/model_garage/core/hooks.py

def register_forward_hook(
    self,
    layer_name: str,
    hook_fn: Callable,
    hook_name: Optional[str] = None
) -> str:
    """
    Register a forward hook on a named layer.

    Args:
        layer_name: Name of layer (e.g., "transformer.h.6")
        hook_fn: Function(module, input, output) -> modified_output or None
        hook_name: Optional name for this hook

    Returns:
        Hook name for later reference
    """
    layer = self._get_layer(layer_name)
    hook_name = hook_name or f"{layer_name}_forward_{len(self.hooks)}"

    if self.debug:
        original_fn = hook_fn
        def hook_fn(module, input, output):
            print(f"[Hook] {hook_name} triggered on {layer_name}")
            return original_fn(module, input, output)

    handle = layer.register_forward_hook(hook_fn)

    self.hooks[hook_name] = HookHandle(
        name=hook_name,
        layer_name=layer_name,
        hook_type="forward",
        handle=handle
    )

    return hook_name

register_capture_hook ¶

register_capture_hook(layer_name, hook_name=None, capture_input=False, capture_output=True)

Register a hook that captures activations without modifying them.

Captured data accessible via get_captured(hook_name).

Source code in src/model_garage/core/hooks.py

def register_capture_hook(
    self,
    layer_name: str,
    hook_name: Optional[str] = None,
    capture_input: bool = False,
    capture_output: bool = True
) -> str:
    """
    Register a hook that captures activations without modifying them.

    Captured data accessible via get_captured(hook_name).
    """
    hook_name = hook_name or f"{layer_name}_capture_{len(self.hooks)}"

    def capture_fn(module, input, output):
        data = {}
        if capture_input:
            data["input"] = input[0].detach().clone() if isinstance(input, tuple) else input.detach().clone()
        if capture_output:
            data["output"] = output[0].detach().clone() if isinstance(output, tuple) else output.detach().clone()
        self._captured_data[hook_name] = data
        return None  # Don't modify

    return self.register_forward_hook(layer_name, capture_fn, hook_name)

register_injection_hook ¶

register_injection_hook(layer_name, injection_fn, hook_name=None)

Register a hook that modifies layer output.

Parameters:

Name	Type	Description	Default
`layer_name`	`str`	Name of layer to inject after	required
`injection_fn`	`Callable[[Tensor], Tensor]`	Function(hidden_states) -> modified_hidden_states	required
`hook_name`	`Optional[str]`	Optional name	`None`

Source code in src/model_garage/core/hooks.py

def register_injection_hook(
    self,
    layer_name: str,
    injection_fn: Callable[[torch.Tensor], torch.Tensor],
    hook_name: Optional[str] = None
) -> str:
    """
    Register a hook that modifies layer output.

    Args:
        layer_name: Name of layer to inject after
        injection_fn: Function(hidden_states) -> modified_hidden_states
        hook_name: Optional name
    """
    hook_name = hook_name or f"{layer_name}_inject_{len(self.hooks)}"

    def inject_fn(module, input, output):
        if isinstance(output, tuple):
            hidden = output[0]
            modified = injection_fn(hidden)
            return (modified,) + output[1:]
        else:
            return injection_fn(output)

    return self.register_forward_hook(layer_name, inject_fn, hook_name)

get_captured ¶

get_captured(hook_name)

Get data captured by a capture hook.

Source code in src/model_garage/core/hooks.py

def get_captured(self, hook_name: str) -> Optional[Dict[str, torch.Tensor]]:
    """Get data captured by a capture hook."""
    return self._captured_data.get(hook_name)

clear_captured ¶

clear_captured()

Clear all captured data.

Source code in src/model_garage/core/hooks.py

def clear_captured(self):
    """Clear all captured data."""
    self._captured_data.clear()

remove_hook ¶

remove_hook(hook_name)

Remove a specific hook by name.

Source code in src/model_garage/core/hooks.py

def remove_hook(self, hook_name: str):
    """Remove a specific hook by name."""
    if hook_name in self.hooks:
        self.hooks[hook_name].remove()
        del self.hooks[hook_name]

remove_all ¶

remove_all()

Remove all registered hooks.

Source code in src/model_garage/core/hooks.py

def remove_all(self):
    """Remove all registered hooks."""
    for hook in self.hooks.values():
        hook.remove()
    self.hooks.clear()
    self._captured_data.clear()

list_hooks ¶

list_hooks()

List all registered hook names.

Source code in src/model_garage/core/hooks.py

def list_hooks(self) -> List[str]:
    """List all registered hook names."""
    return list(self.hooks.keys())

enter ¶

__enter__()

Context manager support.

Source code in src/model_garage/core/hooks.py

def __enter__(self):
    """Context manager support."""
    return self

exit ¶

__exit__(exc_type, exc_val, exc_tb)

Cleanup hooks on exit.

Source code in src/model_garage/core/hooks.py

def __exit__(self, exc_type, exc_val, exc_tb):
    """Cleanup hooks on exit."""
    self.remove_all()