santiagomed · santiagomed · Nov 7, 2023 · Nov 1, 2023 · Nov 2, 2023 · Nov 2, 2023
diff --git a/orca/Cargo.toml b/orca/Cargo.toml
@@ -36,6 +36,7 @@ candle-nn = { git = "https://github.com/huggingface/candle" }
 tracing-chrome = "0.7.1"
 tracing-subscriber = "0.3.17"
 log = "0.4.20"
+crossbeam-channel = "0.5.8"
 
 [dev-dependencies]
 base64 = "0.21.4"

diff --git a/orca/src/llm/openai.rs b/orca/src/llm/openai.rs
@@ -5,6 +5,7 @@ use crate::{
     prompt::{chat::Message, Prompt},
 };
 use anyhow::Result;
+use crossbeam_channel::bounded;
 use reqwest::Client;
 use serde::{Deserialize, Serialize};
 
@@ -273,25 +274,40 @@ impl EmbeddingTrait for OpenAI {
         Ok(res.into())
     }
 
-    /// TODO: Concurrent
-    async fn generate_embeddings(&self, prompt: Vec<Box<dyn Prompt>>) -> Result<EmbeddingResponse> {
+    async fn generate_embeddings(&self, prompts: Vec<Box<dyn Prompt>>) -> Result<EmbeddingResponse> {
         let mut embeddings = Vec::new();
-        for prompt in prompt {
+        let (sender, receiver) = bounded(prompts.len());
+
+        let num_prompts = prompts.len();
+
+        for (i, prompt) in prompts.into_iter().enumerate() {
+            let sender = sender.clone();
+            let client = self.client.clone();
             let req = self.generate_embedding_request(&prompt.to_string())?;
-            let res = self.client.execute(req).await?;
-            let res = res.json::<OpenAIEmbeddingResponse>().await?;
-            embeddings.push(res);
+
+            tokio::spawn(async move {
+                let res = client.execute(req).await.map_err(|e| e.to_string())?;
+                let response = res.json::<OpenAIEmbeddingResponse>().await.map_err(|e| e.to_string())?;
+                sender.send((i, response)).unwrap();
+                Ok::<_, String>(())
+            });
         }
+
+        for _ in 0..num_prompts {
+            let (i, res) = receiver.recv().unwrap();
+            embeddings[i] = res;
+        }
+
         Ok(EmbeddingResponse::OpenAI(embeddings))
     }
 }
 
 #[cfg(test)]
 mod test {
     use super::*;
-    use crate::prompt;
     use crate::prompt::TemplateEngine;
     use crate::template;
+    use crate::{prompt, prompts};
     use std::collections::HashMap;
 
     #[tokio::test]
@@ -322,10 +338,18 @@ mod test {
     }
 
     #[tokio::test]
-    async fn test_embeddings() {
+    async fn test_embedding() {
         let client = OpenAI::new();
         let content = prompt!("This is a test");
         let res = client.generate_embedding(content).await.unwrap();
         assert!(res.to_vec2().unwrap().len() > 0);
     }
+
+    #[tokio::test]
+    async fn test_embeddings() {
+        let client = OpenAI::new();
+        let content = prompts!("This is a test", "This is another test", "This is a third test");
+        let res = client.generate_embeddings(content).await.unwrap();
+        assert!(res.to_vec2().unwrap().len() > 0);
+    }
 }