langgenius · rayshaw001 · Jan 20, 2025 · Jan 20, 2025 · Jan 21, 2025 · Jan 21, 2025
diff --git a/api/core/rag/datasource/vdb/vector_factory.py b/api/core/rag/datasource/vdb/vector_factory.py
@@ -152,9 +152,13 @@ def get_vector_factory(vector_type: str) -> type[AbstractVectorFactory]:
                 raise ValueError(f"Vector store {vector_type} is not supported.")
 
     def create(self, texts: Optional[list] = None, **kwargs):
+        max_batch_documents = 1000
         if texts:
-            embeddings = self._embeddings.embed_documents([document.page_content for document in texts])
-            self._vector_processor.create(texts=texts, embeddings=embeddings, **kwargs)
+            for i in range(0, len(texts), max_batch_documents):
+                batch_documents = texts[i : i + max_batch_documents]
+                batch_contents = [document.page_content for document in batch_documents]
+                batch_embeddings = self._embeddings.embed_documents(batch_contents)
+                self._vector_processor.create(texts=batch_documents, embeddings=batch_embeddings, **kwargs)
 
     def add_texts(self, documents: list[Document], **kwargs):
         if kwargs.get("duplicate_check", False):