fix(mm): vllm model calculates its own size

psychedelicious · psychedelicious · commit debafe6c8a5a · 2025-03-27T09:26:15.000+11:00
diff --git a/invokeai/backend/llava_onevision_model.py b/invokeai/backend/llava_onevision_model.py
@@ -47,3 +47,10 @@ def run(self, prompt: str, images: list[Image], device: torch.device, dtype: tor
 
     def to(self, device: Optional[torch.device] = None, dtype: Optional[torch.dtype] = None) -> None:
         self._vllm_model.to(device=device, dtype=dtype)
+
+    def calc_size(self) -> int:
+        """Get size of the model in memory in bytes."""
+        # HACK(ryand): Fix this issue with circular imports.
+        from invokeai.backend.model_manager.load.model_util import calc_module_size
+
+        return calc_module_size(self._vllm_model)
diff --git a/invokeai/backend/model_manager/load/model_util.py b/invokeai/backend/model_manager/load/model_util.py
@@ -15,6 +15,7 @@
 from invokeai.backend.image_util.grounding_dino.grounding_dino_pipeline import GroundingDinoPipeline
 from invokeai.backend.image_util.segment_anything.segment_anything_pipeline import SegmentAnythingPipeline
 from invokeai.backend.ip_adapter.ip_adapter import IPAdapter
+from invokeai.backend.llava_onevision_model import LlavaOnevisionModel
 from invokeai.backend.model_manager.taxonomy import AnyModel
 from invokeai.backend.onnx.onnx_runtime import IAIOnnxRuntimeModel
 from invokeai.backend.patches.model_patch_raw import ModelPatchRaw
@@ -50,6 +51,7 @@ def calc_model_size_by_data(logger: logging.Logger, model: AnyModel) -> int:
             SegmentAnythingPipeline,
             DepthAnythingPipeline,
             SigLipPipeline,
+            LlavaOnevisionModel,
         ),
     ):
         return model.calc_size()