Fix a bug that causes embedding regression for indexes with normalise…

…_embeddings set to False
marqo-ai · Oct 9, 2024 · cee2d13 · cee2d13
1 parent 9d2452f
commit cee2d13
Show file tree

Hide file tree

Showing 2 changed files with 14 additions and 32 deletions.
diff --git a/src/marqo/s2_inference/multimodal_model_load.py b/src/marqo/s2_inference/multimodal_model_load.py
@@ -126,7 +126,7 @@ def __init__(self, model):
         self.model = model
 
     def encode(self, content, modality, **kwargs):
-        return self.model.encode(content)
+        return self.model.encode(content, **kwargs)
 
 
 @contextmanager

diff --git a/tests/s2_inference/test_encoding.py b/tests/s2_inference/test_encoding.py
@@ -17,6 +17,7 @@
 
 _load_model = functools.partial(og_load_model, calling_func = "unit_test")
 
+
 class TestEncoding(unittest.TestCase):
 
     def setUp(self) -> None:
@@ -48,13 +49,15 @@ def test_vectorize(self):
             model = _load_model(model_properties['name'], model_properties=model_properties, device=device)
 
             for sentence in sentences:
-                output_v = vectorise(name, sentence, model_properties, device, normalize_embeddings=True)
+                for normalize_embeddings in [True, False]:
+                    output_v = vectorise(name, sentence, model_properties, device,
+                                         normalize_embeddings=normalize_embeddings)
 
-                assert _check_output_type(output_v)
+                    assert _check_output_type(output_v)
 
-                output_m = model.encode(sentence, normalize=True)
+                    output_m = model.encode(sentence, normalize=normalize_embeddings)
 
-                assert abs(torch.FloatTensor(output_m) - torch.FloatTensor(output_v)).sum() < eps
+                    assert abs(torch.FloatTensor(output_m) - torch.FloatTensor(output_v)).sum() < eps
 
             clear_loaded_models()
 
@@ -252,29 +255,6 @@ def test_model_un_normalization(self):
 
             clear_loaded_models()
 
-    def test_onnx_clip_vectorise(self):
-        names = ["onnx16/open_clip/ViT-B-32/laion400m_e32", 'onnx32/open_clip/ViT-B-32-quickgelu/laion400m_e32']
-
-        sentences = ['hello', 'this is a test sentence. so is this.',
-                     ['hello', 'this is a test sentence. so is this.']]
-        device = 'cpu'
-        eps = 1e-9
-
-        for name in names:
-            model_properties = get_model_properties_from_registry(name)
-            model = _load_model(model_properties['name'], model_properties=model_properties, device=device)
-
-            for sentence in sentences:
-                output_v = vectorise(name, sentence, model_properties, device, normalize_embeddings=True)
-
-                assert _check_output_type(output_v)
-
-                output_m = model.encode(sentence, normalize=True)
-
-                assert abs(torch.FloatTensor(output_m) - torch.FloatTensor(output_v)).sum() < eps
-
-            clear_loaded_models()
-
 
 class TestOpenClipModelEncoding(unittest.TestCase):
     '''
@@ -307,13 +287,15 @@ def test_open_clip_vectorize(self):
             model = _load_model(model_properties['name'], model_properties=model_properties, device=device)
 
             for sentence in sentences:
-                output_v = vectorise(name, sentence, model_properties, device, normalize_embeddings=True)
+                for normalize_embeddings in [True, False]:
+                    output_v = vectorise(name, sentence, model_properties, device,
+                                         normalize_embeddings=normalize_embeddings)
 
-                assert _check_output_type(output_v)
+                    assert _check_output_type(output_v)
 
-                output_m = model.encode(sentence, normalize=True)
+                    output_m = model.encode(sentence, normalize=normalize_embeddings)
 
-                assert abs(torch.FloatTensor(output_m) - torch.FloatTensor(output_v)).sum() < eps
+                    assert abs(torch.FloatTensor(output_m) - torch.FloatTensor(output_v)).sum() < eps
 
             clear_loaded_models()