vectordotdev · ktff · May 30, 2021 · May 27, 2021 · May 27, 2021 · May 27, 2021
@@ -126,13 +126,14 @@ where
             blocked_write_tasks,
             read_offset: head,
             compacted_offset: 0,
+            acked: 0,
             delete_offset: head,
             current_size,
             ack_counter,
             max_uncompacted_size,
             uncompacted_size: 0,
             unacked_sizes: VecDeque::new(),
-            buffer: Vec::new(),
+            buffer: VecDeque::new(),
             last_compaction: Instant::now(),
             phantom: PhantomData,
         };

@@ -30,8 +30,8 @@ const MIN_TIME_UNCOMPACTED: Duration = Duration::from_secs(60);
 ///
 /// So the disk buffer (indices/keys) is separated into following regions.
 /// |--Compacted--|--Deleted--|--Read--|--Unread
-///  ^             ^           ^        ^
-///  |             |           |        |
+///  ^             ^   ^       ^        ^
+///  |             |   |-acked-|        |
 ///  0   `compacted_offset`    |        |
 ///                     `delete_offset` |
 ///                                `read_offset`
@@ -48,6 +48,9 @@ where
     pub(crate) compacted_offset: usize,
     /// First not deleted key
     pub(crate) delete_offset: usize,
+    /// Number of acked events that haven't been deleted from
+    /// database. Used for batching deletes.
+    pub(crate) acked: usize,
     /// Reader is notified by Writers through this Waker.
     /// Shared with Writers.
     pub(crate) write_notifier: Arc<AtomicWaker>,
@@ -65,7 +68,7 @@ where
     /// Sizes in bytes of read, not acked/deleted, events.
     pub(crate) unacked_sizes: VecDeque<usize>,
     /// Buffer for internal use.
-    pub(crate) buffer: Vec<Vec<u8>>,
+    pub(crate) buffer: VecDeque<Vec<u8>>,
     /// Limit on uncompacted_size after which we trigger compaction.
     pub(crate) max_uncompacted_size: usize,
     /// Last time that compaction was triggered.
@@ -90,24 +93,29 @@ where
         // write.
         self.write_notifier.register(cx.waker());
 
-        self.delete_acked();
+        let unread_size = self.delete_acked();
+
+        if self.acked >= 100 {
+            self.flush(unread_size);
+        }
 
         if self.buffer.is_empty() {
             // This will usually complete instantly, but in the case of a large
             // queue (or a fresh launch of the app), this will have to go to
             // disk.
-            let new_data = tokio::task::block_in_place(|| {
-                self.db
-                    .value_iter(ReadOptions::new())
-                    .from(&Key(self.read_offset))
-                    .to(&Key(self.read_offset + 100))
-                    .collect()
+            let mut buffer = std::mem::take(&mut self.buffer);
+            tokio::task::block_in_place(|| {
+                buffer.extend(
+                    self.db
+                        .value_iter(ReadOptions::new())
+                        .from(&Key(self.read_offset))
+                        .to(&Key(self.read_offset + 100)),
+                );
             });
-            self.buffer = new_data;
-            self.buffer.reverse(); // so we can pop
+            self.buffer = buffer;
         }
 
-        if let Some(value) = self.buffer.pop() {
+        if let Some(value) = self.buffer.pop_front() {
             self.unacked_sizes.push_back(value.len());
             self.read_offset += 1;
 
@@ -134,19 +142,42 @@ where
     T: Send + Sync + Unpin,
 {
     fn drop(&mut self) {
-        self.delete_acked();
+        let unread_size = self.delete_acked();
+        self.flush(unread_size);
     }
 }
 
 impl<T> Reader<T>
 where
     T: Send + Sync + Unpin,
 {
-    fn delete_acked(&mut self) {
+    /// Returns number of bytes to be read.
+    fn delete_acked(&mut self) -> usize {
         let num_to_delete = self.ack_counter.swap(0, Ordering::Relaxed);
 
-        if num_to_delete > 0 {
-            let new_offset = self.delete_offset + num_to_delete;
+        let unread_size = if num_to_delete > 0 {
+            let size_deleted = self.unacked_sizes.drain(..num_to_delete).sum();
+            let unread_size =
+                self.current_size.fetch_sub(size_deleted, Ordering::Release) - size_deleted;
+
+            self.uncompacted_size += size_deleted;
+            self.acked += num_to_delete;
+
+            unread_size
+        } else {
+            self.current_size.load(Ordering::Acquire)
+        };
+
+        for task in self.blocked_write_tasks.lock().unwrap().drain(..) {
+            task.wake();
+        }
+
+        unread_size
+    }
+
+    fn flush(&mut self, unread_size: usize) {
+        if self.acked > 0 {
+            let new_offset = self.delete_offset + self.acked;
             assert!(
                 new_offset <= self.read_offset,
                 "Tried to ack beyond read offset"
@@ -161,11 +192,7 @@ where
             self.db.write(WriteOptions::new(), &delete_batch).unwrap();
 
             self.delete_offset = new_offset;
-
-            let size_deleted = self.unacked_sizes.drain(..num_to_delete).sum();
-            let unread_size = self.current_size.fetch_sub(size_deleted, Ordering::Release);
-
-            self.uncompacted_size += size_deleted;
+            self.acked = 0;
 
             // Compaction can be triggered in two ways:
             //  1. When size of uncompacted is a percentage of total allowed size.
@@ -186,10 +213,6 @@ where
                 self.compact();
             }
         }
-
-        for task in self.blocked_write_tasks.lock().unwrap().drain(..) {
-            task.wake();
-        }
     }
 
     pub(crate) fn compact(&mut self) {