opensearch-project · Rishikesh1159 · Feb 21, 2023 · Feb 9, 2023 · Feb 10, 2023 · Feb 10, 2023
@@ -17,15 +17,10 @@
 import org.opensearch.action.admin.cluster.node.tasks.list.ListTasksResponse;
 import org.opensearch.action.admin.indices.recovery.RecoveryAction;
 import org.opensearch.action.admin.indices.recovery.RecoveryResponse;
-import org.opensearch.action.admin.indices.replication.SegmentReplicationStatsAction;
-import org.opensearch.action.admin.indices.replication.SegmentReplicationStatsResponse;
 import org.opensearch.action.admin.indices.stats.IndicesStatsAction;
 import org.opensearch.action.admin.indices.stats.IndicesStatsResponse;
-import org.opensearch.cluster.metadata.IndexMetadata;
 import org.opensearch.common.settings.Settings;
 import org.opensearch.common.unit.TimeValue;
-import org.opensearch.common.util.FeatureFlags;
-import org.opensearch.indices.replication.common.ReplicationType;
 import org.opensearch.plugins.Plugin;
 import org.opensearch.test.OpenSearchIntegTestCase;
 import org.opensearch.test.transport.MockTransportService;
@@ -152,56 +147,6 @@ public void testRecoveriesWithTimeout() {
         assertThat(recoveryResponse.getShardFailures()[0].reason(), containsString("ReceiveTimeoutTransportException"));
     }
 
-    @AwaitsFix(bugUrl = "https://github.com/opensearch-project/OpenSearch/issues/6255")
-    public void testSegmentReplicationStatsWithTimeout() {
-        internalCluster().startClusterManagerOnlyNode(
-            Settings.builder().put(super.featureFlagSettings()).put(FeatureFlags.REPLICATION_TYPE, "true").build()
-        );
-        String dataNode = internalCluster().startDataOnlyNode(
-            Settings.builder().put(super.featureFlagSettings()).put(FeatureFlags.REPLICATION_TYPE, "true").build()
-        );
-        String anotherDataNode = internalCluster().startDataOnlyNode(
-            Settings.builder().put(super.featureFlagSettings()).put(FeatureFlags.REPLICATION_TYPE, "true").build()
-        );
-
-        int numShards = 4;
-        assertAcked(
-            prepareCreate(
-                "test-index",
-                0,
-                Settings.builder()
-                    .put("number_of_shards", numShards)
-                    .put("number_of_replicas", 1)
-                    .put(IndexMetadata.SETTING_REPLICATION_TYPE, ReplicationType.SEGMENT)
-            )
-        );
-        ensureGreen();
-        final long numDocs = scaledRandomIntBetween(50, 100);
-        for (int i = 0; i < numDocs; i++) {
-            index("test-index", "doc", Integer.toString(i));
-        }
-        refresh("test-index");
-        ensureSearchable("test-index");
-
-        // Happy case
-        SegmentReplicationStatsResponse segmentReplicationStatsResponse = dataNodeClient().admin()
-            .indices()
-            .prepareSegmentReplicationStats()
-            .get();
-        assertThat(segmentReplicationStatsResponse.getTotalShards(), equalTo(numShards * 2));
-        assertThat(segmentReplicationStatsResponse.getSuccessfulShards(), equalTo(numShards * 2));
-
-        // simulate timeout on bad node.
-        simulateTimeoutAtTransport(dataNode, anotherDataNode, SegmentReplicationStatsAction.NAME);
-
-        // verify response with bad node.
-        segmentReplicationStatsResponse = dataNodeClient().admin().indices().prepareSegmentReplicationStats().get();
-        assertThat(segmentReplicationStatsResponse.getTotalShards(), equalTo(numShards * 2));
-        assertThat(segmentReplicationStatsResponse.getSuccessfulShards(), equalTo(numShards));
-        assertThat(segmentReplicationStatsResponse.getFailedShards(), equalTo(numShards));
-        assertThat(segmentReplicationStatsResponse.getShardFailures()[0].reason(), containsString("ReceiveTimeoutTransportException"));
-    }
-
     public void testStatsWithTimeout() {
         internalCluster().startClusterManagerOnlyNode();
         String dataNode = internalCluster().startDataOnlyNode();

@@ -22,33 +22,43 @@
 import static java.util.Arrays.asList;
 import static org.hamcrest.Matchers.equalTo;
 import static org.hamcrest.Matchers.greaterThan;
+import static org.opensearch.test.hamcrest.OpenSearchAssertions.assertAcked;
 
 @OpenSearchIntegTestCase.ClusterScope(scope = OpenSearchIntegTestCase.Scope.TEST, numDataNodes = 0)
 public class SegmentReplicationStatsIT extends SegmentReplicationBaseIT {
 
-    public void testSegmentReplicationStatsResponse() throws Exception {
-        final String primaryNode = internalCluster().startNode();
-        createIndex(INDEX_NAME);
-        ensureYellowAndNoInitializingShards(INDEX_NAME);
-        final String replicaNode = internalCluster().startNode();
-        ensureGreen(INDEX_NAME);
-
-        // index 10 docs
-        for (int i = 0; i < 10; i++) {
-            client().prepareIndex(INDEX_NAME).setId(Integer.toString(i)).setSource("field", "value" + i).execute().actionGet();
+    public void testSegmentReplicationStatsResponse() {
+        internalCluster().startClusterManagerOnlyNode();
+        String dataNode = internalCluster().startDataOnlyNode();
+        String anotherDataNode = internalCluster().startDataOnlyNode();
+
+        int numShards = 4;
+        assertAcked(
+            prepareCreate(
+                INDEX_NAME,
+                0,
+                Settings.builder()
+                    .put("number_of_shards", numShards)
+                    .put("number_of_replicas", 1)
+                    .put(IndexMetadata.SETTING_REPLICATION_TYPE, ReplicationType.SEGMENT)
+            )
+        );
+        ensureGreen();
+        final long numDocs = scaledRandomIntBetween(50, 100);
+        for (int i = 0; i < numDocs; i++) {
+            index(INDEX_NAME, "doc", Integer.toString(i));
         }
         refresh(INDEX_NAME);
-        waitForSearchableDocs(10L, asList(primaryNode, replicaNode));
+        ensureSearchable(INDEX_NAME);
 
-        SegmentReplicationStatsResponse response = client().admin()
+        SegmentReplicationStatsResponse segmentReplicationStatsResponse = dataNodeClient().admin()
             .indices()
             .prepareSegmentReplicationStats(INDEX_NAME)
             .execute()
             .actionGet();
-        // Verify API Response
-        assertThat(response.shardSegmentReplicationStates().size(), equalTo(SHARD_COUNT));
-        assertThat(response.shardSegmentReplicationStates().get(INDEX_NAME).get(0).getStage(), equalTo(SegmentReplicationState.Stage.DONE));
-        assertThat(response.shardSegmentReplicationStates().get(INDEX_NAME).get(0).getIndex().recoveredFileCount(), greaterThan(0));
+        assertThat(segmentReplicationStatsResponse.shardSegmentReplicationStates().size(), equalTo(1));
+        assertThat(segmentReplicationStatsResponse.getTotalShards(), equalTo(numShards * 2));
+        assertThat(segmentReplicationStatsResponse.getSuccessfulShards(), equalTo(numShards * 2));
     }
 
     public void testSegmentReplicationStatsResponseForActiveAndCompletedOnly() throws Exception {
@@ -122,6 +132,10 @@ public void testSegmentReplicationStatsResponseForActiveAndCompletedOnly() throw
             completedOnlyResponse.shardSegmentReplicationStates().get(INDEX_NAME).get(0).getStage(),
             equalTo(SegmentReplicationState.Stage.DONE)
         );
+        assertThat(
+            completedOnlyResponse.shardSegmentReplicationStates().get(INDEX_NAME).get(0).getIndex().recoveredFileCount(),
+            greaterThan(0)
+        );
         waitForAssertions.countDown();
     }
 

@@ -140,7 +140,7 @@ protected SegmentReplicationState shardOperation(SegmentReplicationStatsRequest
             singleIndexWithSegmentReplicationDisabled = shardRouting.getIndexName();
             return null;
         }
-        if (indexShard.indexSettings().isSegRepEnabled() == false) {
+        if (indexShard.indexSettings().isSegRepEnabled() == false || shardRouting.primary()) {
             return null;
         }
 

@@ -24,6 +24,7 @@
 import java.io.IOException;
 import java.util.HashMap;
 import java.util.Map;
+import java.util.concurrent.ConcurrentHashMap;
 
 /**
  * ReplicationState implementation to track Segment Replication events.
@@ -121,23 +122,28 @@ public Map<String, Long> getTimingData() {
     }
 
     public TimeValue getReplicatingStageTime() {
-        return new TimeValue(timingData.get(Stage.REPLICATING.toString()));
+        long time = timingData.getOrDefault(Stage.REPLICATING.toString(), 0L);
+        return new TimeValue(time);
     }
 
     public TimeValue getGetCheckpointInfoStageTime() {
-        return new TimeValue(timingData.get(Stage.GET_CHECKPOINT_INFO.toString()));
+        long time = timingData.getOrDefault(Stage.GET_CHECKPOINT_INFO.toString(), 0L);
+        return new TimeValue(time);
     }
 
     public TimeValue getFileDiffStageTime() {
-        return new TimeValue(timingData.get(Stage.FILE_DIFF.toString()));
+        long time = timingData.getOrDefault(Stage.FILE_DIFF.toString(), 0L);
+        return new TimeValue(time);
     }
 
     public TimeValue getGetFileStageTime() {
-        return new TimeValue(timingData.get(Stage.GET_FILES.toString()));
+        long time = timingData.getOrDefault(Stage.GET_FILES.toString(), 0L);
+        return new TimeValue(time);
     }
 
     public TimeValue getFinalizeReplicationStageTime() {
-        return new TimeValue(timingData.get(Stage.FINALIZE_REPLICATION.toString()));
+        long time = timingData.getOrDefault(Stage.FINALIZE_REPLICATION.toString(), 0L);
+        return new TimeValue(time);
     }
 
     public SegmentReplicationState(
@@ -153,7 +159,7 @@ public SegmentReplicationState(
         this.sourceDescription = sourceDescription;
         this.targetNode = targetNode;
         // Timing data will have as many entries as stages, plus one
-        timingData = new HashMap<>(Stage.values().length + 1);
+        timingData = new ConcurrentHashMap<>(Stage.values().length + 1);
         overallTimer = new ReplicationTimer();
         stageTimer = new ReplicationTimer();
         setStage(Stage.INIT);
@@ -180,7 +186,13 @@ public void writeTo(StreamOutput out) throws IOException {
         out.writeLong(replicationId);
         overallTimer.writeTo(out);
         stageTimer.writeTo(out);
-        out.writeMap(timingData, StreamOutput::writeString, StreamOutput::writeLong);
+
+        // Copy of timingData is created to avoid concurrent modification of timingData map.
+        Map<String, Long> timingDataCopy = new HashMap<>();
+        for (Map.Entry<String, Long> entry : timingData.entrySet()) {
+            timingDataCopy.put(entry.getKey(), entry.getValue());
+        }
+        out.writeMap(timingDataCopy, StreamOutput::writeString, StreamOutput::writeLong);
         out.writeString(sourceDescription);
         targetNode.writeTo(out);
     }
@@ -257,22 +269,20 @@ public XContentBuilder toXContent(XContentBuilder builder, ToXContent.Params par
             builder.timeField(Fields.STOP_TIME_IN_MILLIS, Fields.STOP_TIME, getTimer().stopTime());
         }
         builder.humanReadableField(Fields.TOTAL_TIME_IN_MILLIS, Fields.TOTAL_TIME, new TimeValue(getTimer().time()));
-        if (sourceDescription != null) {
-            builder.field(Fields.SOURCE, getSourceDescription());
-        }
+        builder.field(Fields.SOURCE, getSourceDescription());
+
+        builder.startObject(Fields.TARGET);
+        builder.field(Fields.ID, targetNode.getId());
+        builder.field(Fields.HOST, targetNode.getHostName());
+        builder.field(Fields.TRANSPORT_ADDRESS, targetNode.getAddress().toString());
+        builder.field(Fields.IP, targetNode.getHostAddress());
+        builder.field(Fields.NAME, targetNode.getName());
+        builder.endObject();
 
-        if (targetNode != null) {
-            builder.startObject(Fields.TARGET);
-            builder.field(Fields.ID, targetNode.getId());
-            builder.field(Fields.HOST, targetNode.getHostName());
-            builder.field(Fields.TRANSPORT_ADDRESS, targetNode.getAddress().toString());
-            builder.field(Fields.IP, targetNode.getHostAddress());
-            builder.field(Fields.NAME, targetNode.getName());
-            builder.endObject();
-        }
         builder.startObject(SegmentReplicationState.Fields.INDEX);
         index.toXContent(builder, params);
         builder.endObject();
+
         builder.field(Fields.REPLICATING_STAGE, getReplicatingStageTime());
         builder.field(Fields.GET_CHECKPOINT_INFO_STAGE, getGetCheckpointInfoStageTime());
         builder.field(Fields.FILE_DIFF_STAGE, getFileDiffStageTime());