langchain-ai · baskaryan · Nov 20, 2023 · Nov 15, 2023 · Nov 17, 2023
diff --git a/libs/langchain/langchain/embeddings/azure_openai.py b/libs/langchain/langchain/embeddings/azure_openai.py
@@ -83,6 +83,10 @@ def validate_environment(cls, values: Dict) -> Dict:
         values["azure_ad_token"] = values["azure_ad_token"] or os.getenv(
             "AZURE_OPENAI_AD_TOKEN"
         )
+        # Azure OpenAI embedding models allow a maximum of 16 texts
+        # at a time in each batch
+        # See: https://learn.microsoft.com/en-us/azure/ai-services/openai/reference#embeddings
+        values["chunk_size"] = min(values["chunk_size"], 16)
         try:
             import openai
 

diff --git a/libs/langchain/langchain/embeddings/openai.py b/libs/langchain/langchain/embeddings/openai.py
@@ -291,7 +291,7 @@ def validate_environment(cls, values: Dict) -> Dict:
             # Azure OpenAI embedding models allow a maximum of 16 texts
             # at a time in each batch
             # See: https://learn.microsoft.com/en-us/azure/ai-services/openai/reference#embeddings
-            values["chunk_size"] = max(values["chunk_size"], 16)
+            values["chunk_size"] = min(values["chunk_size"], 16)
         else:
             default_api_version = ""
         values["openai_api_version"] = get_from_dict_or_env(

diff --git a/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py b/libs/langchain/tests/integration_tests/embeddings/test_azure_openai.py
@@ -30,12 +30,25 @@ def test_azure_openai_embedding_documents_multiple() -> None:
     embedding = _get_embeddings(chunk_size=2)
     embedding.embedding_ctx_length = 8191
     output = embedding.embed_documents(documents)
+    assert embedding.chunk_size == 2
     assert len(output) == 3
     assert len(output[0]) == 1536
     assert len(output[1]) == 1536
     assert len(output[2]) == 1536
 
 
+def test_azure_openai_embedding_documents_chunk_size() -> None:
+    """Test openai embeddings."""
+    documents = ["foo bar"] * 20
+    embedding = _get_embeddings()
+    embedding.embedding_ctx_length = 8191
+    output = embedding.embed_documents(documents)
+    # Max 16 chunks per batch on Azure OpenAI embeddings
+    assert embedding.chunk_size == 16
+    assert len(output) == 20
+    assert all([len(out) == 1536 for out in output])
+
+
 @pytest.mark.asyncio
 async def test_azure_openai_embedding_documents_async_multiple() -> None:
     """Test openai embeddings."""