diff --git a/README.md b/README.md
index 1b9038f95eb..d6c430bf78b 100755
--- a/README.md
+++ b/README.md
@@ -37,9 +37,7 @@ Intel® Neural Compressor has been one of the critical AI software components in
   # install stable version from from conda
   conda install neural-compressor -c conda-forge -c intel 
   ```
-More installation methods can be found at [Installation Guide](./docs/installation_guide.md).  
-> **Note:**
-> Run into installation issues, please check [FAQ](./docs/faq.md). 
+More installation methods can be found at [Installation Guide](./docs/installation_guide.md). Please check out our [FAQ](./docs/faq.md) for more details.
 
 ## Getting Started
 * Quantization with Python API  
@@ -122,8 +120,8 @@ Intel® Neural Compressor supports systems based on [Intel 64 architecture or co
 </tbody>
 </table>
 
-> Note: 1.Starting from official TensorFlow 2.6.0, oneDNN has been default in the binary. Please set the environment variable TF_ENABLE_ONEDNN_OPTS=1 to enable the oneDNN optimizations.  
-> 2.Starting from official TensorFlow 2.9.0, oneDNN optimizations are enabled by default on CPUs with neural-network-focused hardware features such as AVX512_VNNI, AVX512_BF16, AMX, etc. No need to set environment variable.
+> **Note:**
+> Please set the environment variable TF_ENABLE_ONEDNN_OPTS=1 to enable oneDNN optimizations if you are using TensorFlow from v2.6 to v2.8. oneDNN has been fully default from TensorFlow v2.9.
 
 ### Validated Models
 Intel® Neural Compressor validated 420+ [examples](./examples) with performance speedup geomean 2.2x and up to 4.2x on VNNI while minimizing the accuracy loss. 
@@ -143,7 +141,7 @@ More details for validated models are available [here](docs/validated_model_list
   </thead>
   <tbody>
     <tr>
-      <td colspan="3" align="center"><a href="docs/infrastructure.md">Infrastructure</a></td>
+      <td colspan="3" align="center"><a href="docs/design.md">Architecture</a></td>
       <td colspan="2" align="center"><a href="docs/tutorial.md">Tutorial</a></td>
       <td colspan="2" align="center"><a href="./examples">Examples</a></td>
       <td colspan="1" align="center"><a href="docs/bench.md">GUI</a></td>
@@ -177,7 +175,7 @@ More details for validated models are available [here](docs/validated_model_list
         <td colspan="2" align="center"><a href="docs/Quantization.md">Quantization</a></td>
         <td colspan="1" align="center"><a href="docs/pruning.md">Pruning</a> <a href="docs/sparsity.md">(Sparsity)</a> </td> 
         <td colspan="3" align="center"><a href="docs/distillation.md">Knowledge Distillation</a></td>
-        <td colspan="3" align="center"><a href="docs/mixed_precision.md">Mixed precision</a></td>
+        <td colspan="3" align="center"><a href="docs/mixed_precision.md">Mixed Precision</a></td>
     </tr>
     <tr>
         <td colspan="2" align="center"><a href="docs/benchmark.md">Benchmarking</a></td>
@@ -207,7 +205,7 @@ More details for validated models are available [here](docs/validated_model_list
 * [Quantizing ONNX Models using Intel® Neural Compressor](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Quantizing-ONNX-Models-using-Intel-Neural-Compressor/post/1355237) (Feb 2022)
 * [Quantize AI Model by Intel® oneAPI AI Analytics Toolkit on Alibaba Cloud](https://www.intel.com/content/www/us/en/developer/articles/technical/quantize-ai-by-oneapi-analytics-on-alibaba-cloud.html) (Feb 2022)
 
-> View the [full publication list](docs/publication_list.md).
+> Please check out our [full publication list](docs/publication_list.md).
 
 ## Additional Content
 
@@ -217,6 +215,6 @@ More details for validated models are available [here](docs/validated_model_list
 * [Security Policy](docs/security_policy.md)
 * [Intel® Neural Compressor Website](https://intel.github.io/neural-compressor)
 
-## Hiring
+## Hiring :star:
 
-We are hiring. Please send your resume to inc.maintainers@intel.com if you have interests in model compression techniques.
+We are actively hiring. Please send your resume to inc.maintainers@intel.com if you have interests in model compression techniques.
diff --git a/docs/QAT.md b/docs/QAT.md
index efa5d80341d..7bad1c0fcd0 100644
--- a/docs/QAT.md
+++ b/docs/QAT.md
@@ -1,75 +1,56 @@
-# QAT
+# Quantization-aware Training
 
 ## Design
 
-At its core, QAT simulates low-precision inference-time computation in the forward pass of the training process. With QAT, all weights and activations are "fake quantized" during both the forward and backward passes of training: that is, float values are rounded to mimic int8 values, but all computations are still done with floating point numbers. Thus, all the weight adjustments during training are made while "aware" of the fact that the model will ultimately be quantized; after quantizing, therefore, this method will usually yield higher accuracy than either dynamic quantization or post-training static quantization.
+Quantization-aware training (QAT) simulates low-precision inference-time computation in the forward pass of the training process. With QAT, all weights and activations are "fake quantized" during both the forward and backward passes of training: that is, float values are rounded to mimic int8 values, but all computations are still done with floating point numbers. Thus, all the weight adjustments during training are made while "aware" of the fact that the model will ultimately be quantized; after quantizing, therefore, this method will usually yield higher accuracy than either dynamic quantization or post-training static quantization.
 
-The overall workflow for actually performing QAT is very similar to Post-training static quantization (PTQ):
-
-* We can use the same model as PTQ; no additional preparation is needed for quantization-aware training.
-* We need to use a qconfig specifying what kind of fake-quantization is to be inserted after weights and activations, instead of specifying observers.
+<img src="../docs/imgs/fake_quant.png" width=700 height=433 alt="fake quantize">
 
 ## Usage
 
-### MobileNetV2 Model Architecture
-
-Refer to the [PTQ Model Usage](PTQ.md#mobilenetv2-model-architecture).
-
-### Helper Functions
-
-Refer to [PTQ Helper Functions](PTQ.md#helper-functions).
-
-### QAT
-
-First, define a training function:
+First, define a training function as below.
+accuracy is in the 
 
 ```python
-def train_one_epoch(model, criterion, optimizer, data_loader, device, ntrain_batches):
-    model.train()
-    top1 = AverageMeter('Acc@1', ':6.2f')
-    top5 = AverageMeter('Acc@5', ':6.2f')
-    avgloss = AverageMeter('Loss', '1.5f')
-
-    cnt = 0
-    for image, target in data_loader:
-        start_time = time.time()
-        print('.', end = '')
-        cnt += 1
-        image, target = image.to(device), target.to(device)
-        output = model(image)
-        loss = criterion(output, target)
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-        acc1, acc5 = accuracy(output, target, topk=(1, 5))
-        top1.update(acc1[0], image.size(0))
-        top5.update(acc5[0], image.size(0))
-        avgloss.update(loss, image.size(0))
-        if cnt >= ntrain_batches:
-            print('Loss', avgloss.avg)
-
-            print('Training: * Acc@1 {top1.avg:.3f} Acc@5 {top5.avg:.3f}'
-                  .format(top1=top1, top5=top5))
-            return
-
-    print('Full imagenet train set:  * Acc@1 {top1.global_avg:.3f} Acc@5 {top5.global_avg:.3f}'
-          .format(top1=top1, top5=top5))
-    return
+def training_func_for_nc(model):
+    epochs = 8
+    iters = 30
+    optimizer = torch.optim.SGD(model.parameters(), lr=0.0001)
+    for nepoch in range(epochs):
+        model.train()
+        cnt = 0
+        for image, target in train_loader:
+            print('.', end='')
+            cnt += 1
+            output = model(image)
+            loss = criterion(output, target)
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+            if cnt >= iters:
+                break
+        if nepoch > 3:
+            # Freeze quantizer parameters
+            model.apply(torch.quantization.disable_observer)
+        if nepoch > 2:
+            # Freeze batch norm mean and variance estimates
+            model.apply(torch.nn.intrinsic.qat.freeze_bn_stats)
+    return model
 ```
-Fuse modules as PTQ:
+Fuse modules:
 ```python
 model.fuse_model()
 optimizer = torch.optim.SGD(model.parameters(), lr = 0.0001)
 model.qconfig = torch.quantization.get_default_qat_qconfig('fbgemm')
 ```
-Finally, prepare_qat performs the "fake quantization", preparing the model for quantization-aware training:
+Finally, prepare_qat performs the "fake quantization", preparing the model for quantization-aware training, this function already be implemented as a hook :
 ```python
 torch.quantization.prepare_qat(model, inplace=True)
 ```
-Training a quantized model with high accuracy requires accurate modeling of numerics at inference. For quantization-aware training, therefore, modify the training loop by doing the following:
-
+Training a quantized model with high accuracy requires accurate modeling of numerics at inference. INC does the training loop by following:
 * Switch batch norm to use running mean and variance towards the end of training to better match inference numerics.
 * Freeze the quantizer parameters (scale and zero-point) and fine tune the weights.
+
 ```python
 num_train_batches = 20
 # Train and check accuracy after each epoch
@@ -88,6 +69,20 @@ for nepoch in range(8):
     print('Epoch %d :Evaluation accuracy on %d images, %2.2f'%(nepoch, num_eval_batches * eval_batch_size, top1.avg))
 ```
 
+When using QAT in INC, you just need to use these APIs: 
+```python
+from neural_compressor.experimental import Quantization, common
+quantizer = Quantization("./conf.yaml")
+quantizer.model = common.Model(model)
+quantizer.q_func = training_func_for_nc
+quantizer.eval_dataloader = val_loader
+q_model = quantizer.fit()
+```
+
+The quantizer.fit() function will return a best quantized model during timeout constrain.
+<br>
+The yaml define example: [The yaml example](/examples/pytorch/image_recognition/torchvision_models/quantization/qat/fx)
+
 Here, we just perform quantization-aware training for a small number of epochs. Nevertheless, quantization-aware training yields an accuracy of over 71% on the entire imagenet dataset, which is close to the floating point accuracy of 71.9%.
 
 More on quantization-aware training:
@@ -96,10 +91,6 @@ More on quantization-aware training:
 * We can simulate the accuracy of a quantized model in floating points since we are using fake-quantization to model the numerics of actual quantized arithmetic.
 * We can easily mimic post-training quantization.
 
-Intel® Neural Compressor can support QAT calibration for
-PyTorch models. Refer to the [QAT model](https://github.com/intel/neural-compressor/tree/master/examples/pytorch/eager/image_recognition/imagenet/cpu/qat/README.md) for step-by-step tuning.
-
-### Example
-View a [QAT example of PyTorch resnet50](/examples/pytorch/image_recognition/torchvision_models/quantization/qat).
-
+### Examples
+For related examples, please refer to the [QAT models](/examples/README.md).
 
diff --git a/docs/Quantization.md b/docs/Quantization.md
index 18619185e3f..dd3dbce3c7d 100644
--- a/docs/Quantization.md
+++ b/docs/Quantization.md
@@ -1,15 +1,77 @@
-Quantization
-============
+# Quantization
 
-Quantization refers to processes that enable lower precision inference and training by performing computations at fixed point integers that are lower than floating points. This often leads to smaller model sizes and faster inference time. Quantization is particularly useful in deep learning inference and training, where moving data more quickly and reducing bandwidth bottlenecks is optimal. Intel is actively working on techniques that use lower numerical precision by using training with 16-bit multipliers and inference with 8-bit or 16-bit multipliers. Refer to the Intel article on [lower numerical precision inference and training in deep learning](https://software.intel.com/content/www/us/en/develop/articles/lower-numerical-precision-deep-learning-inference-and-training.html).
+Quantization is a widely-used model compression technique that can reduce model size while also improving inference and training latency.</br>
+The full precision data converts to low-precision, there is little degradation in model accuracy, but the inference performance of quantized model can gain higher performance by saving the memory bandwidth and accelerating computations with low precision instructions. Intel provided several lower precision instructions (ex: 8-bit or 16-bit multipliers), both training and inference can get benefits from them.
+Refer to the Intel article on [lower numerical precision inference and training in deep learning](https://software.intel.com/content/www/us/en/develop/articles/lower-numerical-precision-deep-learning-inference-and-training.html).
 
-Quantization methods include the following three classes:
+## Quantization Support Matrix
 
-* [Post-Training Quantization (PTQ)](./PTQ.md)
-* [Quantization-Aware Training (QAT)](./QAT.md)
-* [Dynamic Quantization](./dynamic_quantization.md)
+Quantization methods include the following three types:
+<table class="center">
+    <thead>
+        <tr>
+            <th>Types</th>
+            <th>Quantization</th>
+            <th>Dataset Requirements</th>
+            <th>Framework</th>
+            <th>Backend</th>
+        </tr>
+    </thead>
+    <tbody>
+        <tr>
+            <td rowspan="3" align="center">Post-Training Static Quantization (PTQ)</td>
+            <td rowspan="3" align="center">weights and activations</td>
+            <td rowspan="3" align="center">calibration</td>
+            <td align="center">PyTorch</td>
+            <td align="center"><a href="https://pytorch.org/docs/stable/quantization.html#eager-mode-quantization">PyTorch Eager</a>/<a href="https://pytorch.org/docs/stable/quantization.html#prototype-fx-graph-mode-quantization">PyTorch FX</a>/<a href="https://github.com/intel/intel-extension-for-pytorch">IPEX</a></td>
+        </tr>
+        <tr>
+            <td align="center">TensorFlow</td>
+            <td align="center"><a href="https://github.com/tensorflow/tensorflow">TensorFlow</a>/<a href="https://github.com/Intel-tensorflow/tensorflow">Intel TensorFlow</a></td>
+        </tr>
+        <tr>
+            <td align="center">ONNX Runtime</td>
+            <td align="center"><a href="https://github.com/microsoft/onnxruntime/blob/master/onnxruntime/python/tools/quantization/quantize.py">QLinearops/QDQ</a></td>
+        </tr>
+        <tr>
+            <td rowspan="2" align="center">Post-Training Dynamic Quantization</td>
+            <td rowspan="2" align="center">weights</td>
+            <td rowspan="2" align="center">none</td>
+            <td align="center">PyTorch</td>
+            <td align="center"><a href="https://pytorch.org/docs/stable/quantization.html#eager-mode-quantization">PyTorch eager mode</a>/<a href="https://pytorch.org/docs/stable/quantization.html#prototype-fx-graph-mode-quantization">PyTorch fx mode</a>/<a href="https://github.com/intel/intel-extension-for-pytorch">IPEX</a></td>
+        </tr>
+        <tr>
+            <td align="center">ONNX Runtime</td>
+            <td align="center"><a href="https://github.com/microsoft/onnxruntime/blob/master/onnxruntime/python/tools/quantization/quantize.py">QIntegerops</a></td>
+        </tr>  
+        <tr>
+            <td rowspan="2" align="center">Quantization-aware Training (QAT)</td>
+            <td rowspan="2" align="center">weights and activations</td>
+            <td rowspan="2" align="center">fine-tuning</td>
+            <td align="center">PyTorch</td>
+            <td align="center"><a href="https://pytorch.org/docs/stable/quantization.html#eager-mode-quantization">PyTorch eager mode</a>/<a href="https://pytorch.org/docs/stable/quantization.html#prototype-fx-graph-mode-quantization">PyTorch fx mode</a>/<a href="https://github.com/intel/intel-extension-for-pytorch">IPEX</a></td>
+        </tr>
+        <tr>
+            <td align="center">TensorFlow</td>
+            <td align="center"><a href="https://github.com/tensorflow/tensorflow">TensorFlow</a>/<a href="https://github.com/Intel-tensorflow/tensorflow">Intel TensorFlow</a></td>
+        </tr>
+    </tbody>
+</table>
+<br>
+<br>
 
-> **Note** 
->
-> Dynamic Quantization currently only supports the onnxruntime backend.
 
+### [Post-Training Static Quantization](./PTQ.md) performs quantization on already trained models, it requires an additional pass over the dataset to work, only activations do calibration.
+<img src="../docs/imgs/PTQ.png" width=256 height=129 alt="PTQ">
+<br>
+
+### [Post-Training Dynamic Quantization](./dynamic_quantization.md) simply multiplies input values by a scaling factor, then rounds the result to the nearest, it determines the scale factor for activations dynamically based on the data range observed at runtime. Weights are quantized ahead of time but the activations are dynamically quantized during inference.
+<img src="../docs/imgs/dynamic_quantization.png" width=270 height=124 alt="Dynamic Quantization">
+<br>
+
+### [Quantization-aware Training (QAT)](./QAT.md) quantizes models during training and typically provides higher accuracy comparing with post-training quantization, but QAT may require additional hyper-parameter tuning and it may take more time to deployment.
+<img src="../docs/imgs/QAT.png" width=244 height=147 alt="QAT">
+
+## Examples of Quantization
+
+For Quantization related examples, please refer to [Quantization examples](/examples/README.md)
diff --git a/docs/infrastructure.md b/docs/design.md
similarity index 96%
rename from docs/infrastructure.md
rename to docs/design.md
index 6b23be3c10c..bee2fa124b8 100644
--- a/docs/infrastructure.md
+++ b/docs/design.md
@@ -1,4 +1,4 @@
-Infrastructure
+Design
 =====
 Intel® Neural Compressor features an architecture and workflow that aids in increasing performance and faster deployments across infrastructures. 
 
diff --git a/docs/imgs/PTQ.png b/docs/imgs/PTQ.png
new file mode 100644
index 00000000000..9d6d8183409
Binary files /dev/null and b/docs/imgs/PTQ.png differ
diff --git a/docs/imgs/QAT.png b/docs/imgs/QAT.png
new file mode 100644
index 00000000000..27c72efa583
Binary files /dev/null and b/docs/imgs/QAT.png differ
diff --git a/docs/imgs/dynamic_quantization.png b/docs/imgs/dynamic_quantization.png
new file mode 100644
index 00000000000..2a71c0ea1ea
Binary files /dev/null and b/docs/imgs/dynamic_quantization.png differ
diff --git a/docs/imgs/fake_quant.png b/docs/imgs/fake_quant.png
new file mode 100644
index 00000000000..855297a685d
Binary files /dev/null and b/docs/imgs/fake_quant.png differ
diff --git a/docs/orchestration.md b/docs/orchestration.md
new file mode 100755
index 00000000000..945c37e0d28
--- /dev/null
+++ b/docs/orchestration.md
@@ -0,0 +1,57 @@
+Optimization Orchestration
+============
+
+## Introduction
+
+Intel Neural Compressor supports arbitrary meaningful combinations of supported optimization methods under one-shot or multi-shot, such as pruning during quantization-aware training, or pruning and then post-training quantization,
+pruning and then distillation and then quantization.
+
+## Validated Orchestration Types
+
+### One-shot
+
+- Pruning during quantization-aware training
+- Distillation with pattern lock pruning
+- Distillation with pattern lock pruning and quantization-aware training
+ 
+### Multi-shot
+
+- Pruning and then post-training quantization
+- Distillation and then post-training quantization
+
+## Orchestration user facing API
+
+Neural Compressor defines `Scheduler` class to automatically pipeline execute model optimization with one shot or multiple shots way. 
+
+User instantiates model optimization components, such as quantization, pruning, distillation, separately. After that, user could append
+those separate optimization objects into scheduler's pipeline, the scheduler API executes them one by one.
+
+In following example it executes the pruning and then post-training quantization with two-shot way.
+
+```python
+from neural_compressor.experimental import Quantization, Pruning, Scheduler
+prune = Pruning(prune_conf)
+quantizer = Quantization(post_training_quantization_conf)
+scheduler = Scheduler()
+scheduler.model = model
+scheduler.append(prune)
+scheduler.append(quantizer)
+opt_model = scheduler.fit()
+```
+
+If user wants to execute the pruning and quantization-aware training with one-shot way, the code is like below.
+
+```python
+from neural_compressor.experimental import Quantization, Pruning, Scheduler
+prune = Pruning(prune_conf)
+quantizer = Quantization(quantization_aware_training_conf)
+scheduler = Scheduler()
+scheduler.model = model
+combination = scheduler.combine(prune, quantizer)
+scheduler.append(combination)
+opt_model = scheduler.fit()
+```
+
+### Examples
+
+For orchestration related examples, please refer to [Orchestration examples](../examples/README.md).
diff --git a/docs/platform_configuration.md b/docs/platform_configuration.md
new file mode 100644
index 00000000000..764216ddc72
--- /dev/null
+++ b/docs/platform_configuration.md
@@ -0,0 +1,66 @@
+### SYSTEM CONFIGURATION
+<table>
+<tr><th>System Configuration</th><th>Intel Xeon Platinum 8380 Scalable processor</th></tr>
+<tr>
+<td>Manufacturer</td>
+<td>Intel Corporation</td>
+</tr><tr>
+<td>Product Name</td>
+<td>M50CYP2SBSTD</td>
+</tr><tr>
+<td>BIOS Version</td>
+<td>SE5C6200.86B.0022.D64.2105220049</td>
+</tr><tr>
+<td>OS</td>
+<td>Ubuntu 20.04.1 LTS</td>
+</tr><tr>
+<td>Kernel</td>
+<td>5.4.0-42-generic</td>
+</tr><tr>
+<td>Microcode</td>
+<td>0xd0002b1</td>
+</tr><tr>
+<td>CPU Model</td>
+<td>Intel(R) Xeon(R) Platinum 8380 CPU @ 2.30GHz</td>
+</tr><tr>
+<td>Base Frequency</td>
+<td>2.3GHZ</td>
+</tr><tr>
+<td>Thread(s) per Core</td>
+<td>2</td>
+</tr><tr>
+<td>Core(s) per Socket</td>
+<td>40</td>
+</tr><tr>
+<td>Socket(s)</td>
+<td>2</td>
+</tr><tr>
+<td>Turbo</td>
+<td>Enabled</td>
+</tr><tr>
+<td>Power & Perf Policy</td>
+<td>Balanced</td>
+</tr><tr>
+<td>Installed</td>
+<td>256GB (16x16GB DDR4 3200MT/s [3200MT/s])</td>
+</tr><tr>
+<td>NIC Summary</td>
+<td>2x Ethernet Controller 10G X550T</td>
+</tr><tr>
+<td>Drive Summary</td>
+<td>1x INTEL_SSDSC2KW01 953.9G,
+1x CT1000MX500SSD1  931.5G,
+1x CT1000MX500SSD1  931.5G
+</td>
+</tr><tr>
+</table>
+
+Performance varies by use, configuration and other factors and may not reflect all publicly available ​updates. No product or component can be absolutely secure..
+
+Intel technologies may require enabled hardware, software or service activation.
+
+Intel optimizations, for Intel compilers or other products, may not optimize to the same degree for non-Intel products.
+
+
+
+<font size=1>© Intel Corporation.  Intel, the Intel logo, and other Intel marks are trademarks of Intel Corporation or its subsidiaries.  Other names and brands may be claimed as the property of others​.​​</font>
\ No newline at end of file
diff --git a/docs/pruning.md b/docs/pruning.md
index 93c31b7dcce..e421ed3445a 100755
--- a/docs/pruning.md
+++ b/docs/pruning.md
@@ -3,53 +3,74 @@ Pruning
 
 ## Introduction
 
-Network pruning is one of popular approaches of network compression, which reduces the size of a network by removing parameters with minimal drop in accuracy.
+Network pruning is one of popular approaches of network compression, which removes the least important parameters in the network to achieve compact architectures with minimal accuracy drop.
 
-- Structured Pruning
-
-Structured pruning means pruning sparsity patterns, in which there is some structure, most often in the form of blocks.
-Neural Compressor provided a NLP Structured pruning example:
-[Bert example](../examples/pytorch/nlp/huggingface_models/question-answering/pruning/group_lasso/eager).
-[README of Structured pruning example](../examples/pytorch/nlp/huggingface_models/question-answering/pruning/group_lasso/eager/README.md).
+## Pruning Types
 
 - Unstructured Pruning
 
-Unstructured pruning means pruning unstructured sparsity (aka random sparsity) patterns, where the nonzero patterns are irregular and could be anywhere in the matrix.
-
-- Filter/Channel Pruning
-
-Filter/Channel pruning means pruning a larger part of the network, such as filters or layers, according to some rules.
-
-## Pruning Algorithms supported by Neural Compressor
-
-|    Pruning Type        |                 Algorithm                   | PyTorch | Tensorflow |
-|------------------------|---------------------------------------------|---------|------------|
-| unstructured pruning   | basic_magnitude                             |   Yes   |     Yes    |
-|                        | pattern_lock                                |   Yes   |     N/A    | 
-|  structured pruning    | pattern_lock                                |   Yes   |     N/A    | 
-| filter/channel pruning | gradient_sensitivity                        |   Yes   |     N/A    |
+Unstructured pruning means finding and removing the less salient connection in the model where the nonzero patterns are irregular and could be anywhere in the matrix.
 
-Neural Compressor also supports the two-shot execution of unstructured pruning and post-training quantization.
+- Structured Pruning
 
-- basic_magnitude:
+Structured pruning means finding parameters in groups, deleting entire blocks, filters, or channels according to some pruning criterions.
+
+## Pruning Algorithms
+
+<table>
+<thead>
+  <tr>
+    <th>Pruning Type</th>
+    <th>Pruning Granularity</th>
+    <th>Pruning Algorithm</th>
+    <th>Framework</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td rowspan="2">Unstructured Pruning</td>
+    <td rowspan="2">Element-wise</td>
+    <td>Magnitude</td>
+    <td>PyTorch, TensorFlow</td>
+  </tr>
+  <tr>
+    <td>Pattern Lock</td>
+    <td>PyTorch</td>
+  </tr>
+  <tr>
+    <td rowspan="3">Structured Pruning</td>
+    <td>Filter/Channel-wise</td>
+    <td>Gradient Sensitivity</td>
+    <td>PyTorch</td>
+  </tr>
+  <tr>
+    <td>Block-wise</td>
+    <td>Group Lasso</td>
+    <td>PyTorch</td>
+  </tr>
+  <tr>
+    <td>Element-wise</td>
+    <td>Pattern Lock</td>
+    <td>PyTorch</td>
+  </tr>
+</tbody>
+</table>
+
+- Magnitude
 
   - The algorithm prunes the weight by the lowest absolute value at each layer with given sparsity target.
 
-- gradient_sensitivity:
+- Gradient sensitivity
 
   - The algorithm prunes the head, intermediate layers, and hidden states in NLP model according to importance score calculated by following the paper [FastFormers](https://arxiv.org/abs/2010.13382). 
 
-- pattern_lock
-
-  - The algorithm takes a sparsity model as input and starts to fine tune this sparsity model and locks the sparsity pattern by freezing those zero values in weight tensor after weight update during training. 
-
-- pruning and then post-training quantization
+- Group Lasso
 
-  - The algorithm executes unstructured pruning and then executes post-training quantization. 
+  - The algorithm uses Group lasso regularization to prune entire rows, columns or blocks of parameters that result in a smaller dense network.
 
-- pruning during quantization-aware training
+- Pattern Lock
 
-  - The algorithm executes unstructured pruning during quantization-aware training.
+  - The algorithm locks the sparsity pattern in fine tune phase by freezing those zero values of weight tensor during weight update of training. 
 
 ## Pruning API
 
@@ -58,38 +79,29 @@ Neural Compressor also supports the two-shot execution of unstructured pruning a
 Neural Compressor pruning API is defined under `neural_compressor.experimental.Pruning`, which takes a user defined yaml file as input. The user defined yaml defines training, pruning and evaluation behaviors.
 [API Readme](../docs/pruning_api.md).
 
-### Launcher code
+### Usage 1: Launch pruning with user-defined yaml
 
-Simplest launcher code if training behavior is defined in user-defined yaml.
+#### Launcher code
 
-```
-from neural_compressor.experimental import Pruning, common
-prune = Pruning('/path/to/user/pruning/yaml')
-prune.model = model
-model = prune.fit()
-```
-
-Pruning class also support PruningConf class as it's argument.
+Below is the launcher code if training behavior is defined in user-defined yaml.
 
 ```
-from lpot.experimental import Pruning, common
-from lpot.conf.config import PruningConf
-conf = PruningConf('/path/to/user/pruning/yaml')
-prune = Pruning(conf)
+from neural_compressor.experimental import Pruning
+prune = Pruning('/path/to/user/pruning/yaml')
 prune.model = model
 model = prune.fit()
 ```
 
-### User-defined yaml
+#### User-defined yaml
 
 The user-defined yaml follows below syntax, note `train` section is optional if user implements `pruning_func` and sets to `pruning_func` attribute of pruning instance.
-[user-defined yaml](../docs/pruning.yaml).
+User could refer to [the yaml template file](../docs/pruning.yaml) to know field meanings.
 
-#### `train`
+##### `train`
 
 The `train` section defines the training behavior, including what training hyper-parameter would be used and which dataloader is used during training. 
 
-#### `approach`
+##### `approach`
 
 The `approach` section defines which pruning algorithm is used and how to apply it during training process.
 
@@ -103,13 +115,13 @@ The `approach` section defines which pruning algorithm is used and how to apply
 
 - `Pruner`:
 
-  - `prune_type`: pruning algorithm, currently ``basic_magnitude`` and ``gradient_sensitivity`` are supported.
+  - `prune_type`: pruning algorithm, currently ``basic_magnitude``, ``gradient_sensitivity`` and ``group_lasso``are supported.
 
   - `names`: weight name to be pruned. If no weight is specified, all weights of the model will be pruned.
 
-  - `parameters`: Additional parameters is required ``gradient_sensitivity`` prune_type, which is defined in ``parameters`` field. Those parameters determined how a weight is pruned, including the pruning target and the calculation of weight's importance. it contains:
+  - `parameters`: Additional parameters is required ``gradient_sensitivity`` prune_type, which is defined in ``parameters`` field. Those parameters determined how a weight is pruned, including the pruning target and the calculation of weight's importance. It contains:
 
-    - `target`: the pruning target for weight.
+    - `target`: the pruning target for weight, will override global config `target_sparsity` if set.
     - `stride`: each stride of the pruned weight.
     - `transpose`: whether to transpose weight before prune.
     - `normalize`: whether to normalize the calculated importance.
@@ -119,18 +131,32 @@ The `approach` section defines which pruning algorithm is used and how to apply
 
     Take above as an example, if we assume the 'bert.encoder.layer.0.attention.output.dense.weight' is the shape of [N, 12\*64]. The target 8 and stride 64 is used to control the pruned weight shape to be [N, 8\*64]. `Transpose` set to True indicates the weight is pruned at dim 1 and should be transposed to [12\*64, N] before pruning. `importance_input` and `importance_metric` specify the actual input and metric to calculate importance matrix.
 
+### Usage 2: Launch pruning with user-defined pruning function
 
-### Pruning with user-defined pruning_func()
+#### Launcher code
 
-User can pass the customized training/evaluation functions to `Pruning` for flexible scenarios. `Pruning`  In this case, pruning process can be done by pre-defined hooks in Neural Compressor. User needs to put those hooks inside the training function.
+In this case, the launcher code is like the following:
 
-Neural Compressor defines several hooks for user pass
+```python
+from neural_compressor.experimental import Pruning, common
+prune = Pruning(args.config)
+prune.model = model
+prune.pruning_func = pruning_func
+model = prune.fit()
+```
+
+#### User-defined pruning function
+
+User can pass the customized training/evaluation functions to `Pruning` for flexible scenarios. In this case, pruning process can be done by pre-defined hooks in Neural Compressor. User needs to put those hooks inside the training function.
+
+Neural Compressor defines several hooks for user use:
 
 ```
 on_epoch_begin(epoch) : Hook executed at each epoch beginning
 on_batch_begin(batch) : Hook executed at each batch beginning
 on_batch_end() : Hook executed at each batch end
 on_epoch_end() : Hook executed at each epoch end
+on_post_grad() : Hook executed after gradients calculated and before backward
 ```
 
 Following section shows how to use hooks in user pass-in training function which is part of example from BERT training:
@@ -169,41 +195,6 @@ def pruning_func(model):
 ...
 ```
 
-In this case, the launcher code is like the following:
-
-```python
-from neural_compressor.experimental import Pruning, common
-prune = Pruning(args.config)
-prune.model = model
-prune.pruning_func = pruning_func
-model = prune.fit()
-```
-
-### Scheduler for Pruning and Quantization
-
-Neural Compressor defined Scheduler to automatically pipeline execute prune and post-training quantization. After appending separate component into scheduler pipeline, scheduler executes them one by one. In following example it executes the pruning and then post-training quantization.
-
-```python
-from neural_compressor.experimental import Quantization, common, Pruning, Scheduler
-prune = Pruning(prune_conf)
-quantizer = Quantization(post_training_quantization_conf)
-scheduler = Scheduler()
-scheduler.model = model
-scheduler.append(prune)
-scheduler.append(quantizer)
-opt_model = scheduler.fit()
-```
-
 ## Examples
 
-### Examples in Neural Compressor
-Following examples are supported in Neural Compressor:
-
-- CNN Examples:
-  - [resnet example](../examples/pytorch/image_recognition/torchvision_models/pruning/magnitude/eager/README.md): magnitude pruning on resnet.
-  - [pruning and post-training quantization](../examples/pytorch/image_recognition/torchvision_models/optimization_pipeline/prune_and_ptq/eager/README.md): magnitude pruning and then post-training quantization on resnet.
-  - [resnet_v2 example](../examples/tensorflow/image_recognition/resnet_v2/pruning/magnitude/README.md): magnitude pruning on resnet_v2 for tensorflow.
-- NLP Examples:
-  - [BERT example](../examples/pytorch/nlp/huggingface_models/text-classification/pruning/magnitude/eager/README.md): magnitude pruning on DistilBERT.
-  - [BERT example](../examples/pytorch/nlp/huggingface_models/text-classification/pruning/pattern_lock/eager/README.md): Pattern-lock and head-pruning on BERT-base.
-
+For related examples, please refer to [Pruning examples](../examples/README.md).
diff --git a/docs/pruning.yaml b/docs/pruning.yaml
deleted file mode 100644
index a290fe285f8..00000000000
--- a/docs/pruning.yaml
+++ /dev/null
@@ -1,63 +0,0 @@
-```
-pruning:
-  train:                    # Section "train" is optional. If user implements `pruning_func` and pass to `pruning_func` attribute of pruning instance, skip this section.
-    start_epoch: 0
-    end_epoch: 10
-    iteration: 100
-    frequency: 2
-
-    dataloader:
-      batch_size: 256
-      dataset:
-        ImageFolder:
-          root: /path/to/imagenet/train
-      transform:
-        RandomResizedCrop:
-          size: 224
-        RandomHorizontalFlip:
-        ToTensor:
-        Normalize:
-          mean: [0.485, 0.456, 0.406]
-          std: [0.229, 0.224, 0.225]
-    criterion:
-      CrossEntropyLoss:
-        reduction: None
-    optimizer:
-      SGD:
-        learning_rate: 0.1
-        momentum: 0.9
-        weight_decay: 0.0004
-        nesterov: False
-
-  approach:
-    weight_compression:
-      initial_sparsity: 0.0
-      target_sparsity: 0.3
-      pruners:
-        - !Pruner
-            initial_sparsity: 0.0
-            target_sparsity: 0.97
-            start_epoch: 0
-            end_epoch: 2
-            prune_type: basic_magnitude
-            update_frequency: 0.1
-            names: ['layer1.0.conv1.weight']
-        - !Pruner
-            start_epoch: 0
-            end_epoch: 1
-            prune_type: gradient_sensitivity
-            update_frequency: 1
-            names: [
-                     'bert.encoder.layer.0.attention.output.dense.weight',
-                   ]
-            parameters: {
-                          target: 8,
-                          transpose: True,
-                          stride: 64,
-                          index: 0,
-                          normalize: True,
-                          importance_inputs: ['head_mask'],
-                          importance_metric: abs_gradient
-                        }
-
-```
diff --git a/docs/validated_model_list.md b/docs/validated_model_list.md
index b0e4bbe6855..a0aee05287b 100644
--- a/docs/validated_model_list.md
+++ b/docs/validated_model_list.md
@@ -12,7 +12,7 @@ Validated Models
 </thead>
 <tbody>
   <tr>
-    <td rowspan="2">ResNet50 v1.5</td>
+    <td rowspan="2">ResNet50 V1.5</td>
     <td>TensorFlow</td>
     <td>Yes</td>
     <td><a href="../examples/tensorflow/image_recognition/tensorflow_models/quantization/ptq">Link</a></td>
@@ -29,7 +29,7 @@ Validated Models
     <td><a href="../examples/pytorch/recommendation/dlrm/quantization/ptq">Link</a></td>
   </tr>
   <tr>
-    <td rowspan="2">BERT-large</td>
+    <td rowspan="2">BERT large</td>
     <td>TensorFlow</td>
     <td>Yes</td>
     <td><a href="../examples/tensorflow/nlp/bert_large_squad/quantization/ptq">Link</a></td>
@@ -40,7 +40,7 @@ Validated Models
     <td><a href="../examples/pytorch/nlp/huggingface_models/question-answering/quantization/ptq_static/ipex">Link</a></td>
   </tr>
   <tr>
-    <td rowspan="2">SSD-ResNet34</td>
+    <td rowspan="2">SSD ResNet34</td>
     <td>TensorFlow</td>
     <td>Yes</td>
     <td><a href="../examples/tensorflow/object_detection/tensorflow_models/quantization/ptq">Link</a></td>
@@ -70,1641 +70,1446 @@ Validated Models
 </tbody>
 </table>
 
-## Full Validated Models on Intel Xeon Platinum 8380 Scalable processor
+## Validated Quantization Examples
 
-The below tables are models enabled by the Intel® Neural Compressor. 
+Performance results test on ​​06/07/2022 with Intel Xeon Platinum 8380 Scalable processor, using 1 socket, 4 cores/instance, 10 instances and batch size 1. 
 
-Performance varies by use, configuration and other factors. See backup for configuration details. For more complete information about performance and benchmark results, visit www.intel.com/benchmarks
+Performance varies by use, configuration and other factors. See [platform configuration](./platform_configuration.md) for configuration details. For more complete information about performance and benchmark results, visit www.intel.com/benchmarks
 
-Performance results are based on testing as of ​​04/08/2022 and may not reflect all publicly available ​updates. No product or component can be absolutely secure.
-
-Intel optimizations, for Intel compilers or other products, may not optimize to the same degree for non-Intel products.
-
-Your costs may vary.
-
-Intel technologies may require enabled hardware, software or service activation.
-
-© Intel Corporation.  Intel, the Intel logo, and other Intel marks are trademarks of Intel Corporation or its subsidiaries.  Other names and brands may be claimed as the property of others​.​​
-
-### TensorFlow 2.x models
+### TensorFlow models with Intel TensorFlow 2.9.1
 
 <table>
 <thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
+    <th rowspan="2">Model</th>
     <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
+    <th rowspan="2">Example</th>
   </tr>
   <tr>
     <th>INT8</th>
     <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
     <th>INT8</th>
     <th>FP32</th>
     <th>Performance Ratio[INT8/FP32]</th>
   </tr>
 </thead>
-<tbody>
+<tbody align="center">
+  <tr>
+    <td class="tg-za14">BERT large SQuAD</td>
+    <td class="tg-za14">92.39</td>
+    <td class="tg-za14">92.99</td>
+    <td class="tg-za14">-0.64%</td>
+    <td class="tg-za14">25.32</td>
+    <td class="tg-za14">12.53</td>
+    <td class="tg-za14">2.02x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">DenseNet121</td>
+    <td class="tg-za14">73.57%</td>
+    <td class="tg-za14">72.89%</td>
+    <td class="tg-za14">0.93%</td>
+    <td class="tg-za14">370.52</td>
+    <td class="tg-za14">329.74</td>
+    <td class="tg-za14">1.12x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">DenseNet161</td>
+    <td class="tg-za14">76.24%</td>
+    <td class="tg-za14">76.29%</td>
+    <td class="tg-za14">-0.07%</td>
+    <td class="tg-za14">219.46</td>
+    <td class="tg-za14">180.75</td>
+    <td class="tg-za14">1.21x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-6oje">DenseNet169</td>
+    <td class="tg-za14">74.40%</td>
+    <td class="tg-za14">74.65%</td>
+    <td class="tg-za14">-0.33%</td>
+    <td class="tg-za14">301.33</td>
+    <td class="tg-za14">259.88</td>
+    <td class="tg-za14">1.16x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">Faster R-CNN Inception ResNet V2</td>
+    <td class="tg-za14">37.98%</td>
+    <td class="tg-za14">38.33%</td>
+    <td class="tg-za14">-0.91%</td>
+    <td class="tg-za14">3.96</td>
+    <td class="tg-za14">2.34</td>
+    <td class="tg-za14">1.69x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">Faster R-CNN Inception ResNet V2 </td>
+    <td class="tg-za14">37.84%</td>
+    <td class="tg-za14">38.33%</td>
+    <td class="tg-za14">-1.28%</td>
+    <td class="tg-za14">3.98</td>
+    <td class="tg-za14">2.31</td>
+    <td class="tg-za14">1.72x</td>
+    <td class="tg-7zrl">SavedModel</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">Faster R-CNN ResNet101</td>
+    <td class="tg-za14">30.28%</td>
+    <td class="tg-za14">30.39%</td>
+    <td class="tg-za14">-0.36%</td>
+    <td class="tg-za14">70</td>
+    <td class="tg-za14">19.98</td>
+    <td class="tg-za14">3.50x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">Faster R-CNN ResNet101</td>
+    <td class="tg-7zrl">30.37%</td>
+    <td class="tg-7zrl">30.39%</td>
+    <td class="tg-7zrl">-0.07%</td>
+    <td class="tg-7zrl">70.26</td>
+    <td class="tg-7zrl">16.98</td>
+    <td class="tg-7zrl">4.14x</td>
+    <td class="tg-7zrl">SavedModel</td>
+  </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnet50v1.5</td>
-    <td class="tg-7zrl">76.82%</td>
-    <td class="tg-7zrl">76.46%</td>
-    <td class="tg-7zrl">0.47%</td>
-    <td class="tg-7zrl">1239.52</td>
-    <td class="tg-7zrl">433.07</td>
-    <td class="tg-7zrl">2.86x</td>
+    <td class="tg-7zrl">Inception ResNet V2</td>
+    <td class="tg-7zrl">80.44%</td>
+    <td class="tg-7zrl">80.40%</td>
+    <td class="tg-7zrl">0.05%</td>
+    <td class="tg-7zrl">281.79</td>
+    <td class="tg-7zrl">137.91</td>
+    <td class="tg-7zrl">2.04x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnet101</td>
-    <td class="tg-7zrl">77.50%</td>
-    <td class="tg-7zrl">76.45%</td>
-    <td class="tg-7zrl">1.37%</td>
-    <td class="tg-7zrl">874.41</td>
-    <td class="tg-7zrl">352.91</td>
-    <td class="tg-7zrl">2.48x</td>
+    <td class="tg-7zrl">Inception V1</td>
+    <td class="tg-7zrl">70.48%</td>
+    <td class="tg-7zrl">69.74%</td>
+    <td class="tg-7zrl">1.06%</td>
+    <td class="tg-7zrl">2193.17</td>
+    <td class="tg-7zrl">975.6</td>
+    <td class="tg-7zrl">2.25x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">inception_v2</td>
+    <td class="tg-7zrl">Inception V2</td>
     <td class="tg-7zrl">74.36%</td>
     <td class="tg-7zrl">73.97%</td>
     <td class="tg-7zrl">0.53%</td>
-    <td class="tg-7zrl">1840.78</td>
-    <td class="tg-7zrl">853.52</td>
-    <td class="tg-7zrl">2.16x</td>
+    <td class="tg-7zrl">1835.35</td>
+    <td class="tg-7zrl">838.82</td>
+    <td class="tg-7zrl">2.19x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">inception_v3</td>
+    <td class="tg-7zrl">Inception V3</td>
     <td class="tg-7zrl">77.28%</td>
     <td class="tg-7zrl">76.75%</td>
     <td class="tg-7zrl">0.69%</td>
-    <td class="tg-7zrl">954.63</td>
-    <td class="tg-7zrl">391.35</td>
-    <td class="tg-7zrl">2.44x</td>
+    <td class="tg-7zrl">973.42</td>
+    <td class="tg-7zrl">376.3</td>
+    <td class="tg-7zrl">2.59x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">inception_v4</td>
+    <td class="tg-7zrl">Inception V4</td>
     <td class="tg-7zrl">80.40%</td>
     <td class="tg-7zrl">80.27%</td>
     <td class="tg-7zrl">0.16%</td>
-    <td class="tg-7zrl">580.02</td>
-    <td class="tg-7zrl">202.14</td>
+    <td class="tg-7zrl">575.9</td>
+    <td class="tg-7zrl">200.55</td>
     <td class="tg-7zrl">2.87x</td>
+    <td class="tg-7zrl">pb</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">Mask R-CNN Inception V2</td>
+    <td class="tg-7zrl">28.53%</td>
+    <td class="tg-7zrl">28.73%</td>
+    <td class="tg-7zrl">-0.70%</td>
+    <td class="tg-7zrl">132.51</td>
+    <td class="tg-7zrl">50.3</td>
+    <td class="tg-7zrl">2.63x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">mobilenetv1</td>
+    <td class="tg-zk71">Mask R-CNN Inception V2 </td>
+    <td class="tg-7zrl">28.53%</td>
+    <td class="tg-7zrl">28.73%</td>
+    <td class="tg-7zrl">-0.70%</td>
+    <td class="tg-7zrl">132.89</td>
+    <td class="tg-7zrl">50.97</td>
+    <td class="tg-7zrl">2.61x</td>
+    <td class="tg-7zrl">ckpt</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">MobileNet V1</td>
     <td class="tg-7zrl">71.79%</td>
     <td class="tg-7zrl">70.96%</td>
     <td class="tg-7zrl">1.17%</td>
-    <td class="tg-7zrl">3587.79</td>
-    <td class="tg-7zrl">1343.07</td>
-    <td class="tg-7zrl">2.67x</td>
+    <td class="tg-7zrl">3545.79</td>
+    <td class="tg-7zrl">1191.94</td>
+    <td class="tg-7zrl">2.97x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">mobilenetv2</td>
+    <td class="tg-7zrl">MobileNet V2</td>
     <td class="tg-7zrl">71.89%</td>
     <td class="tg-7zrl">71.76%</td>
     <td class="tg-7zrl">0.18%</td>
-    <td class="tg-7zrl">2469.92</td>
-    <td class="tg-7zrl">1434.87</td>
-    <td class="tg-7zrl">1.72x</td>
+    <td class="tg-7zrl">2431.66</td>
+    <td class="tg-7zrl">1420.11</td>
+    <td class="tg-7zrl">1.71x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">ssd_resnet50_v1</td>
-    <td class="tg-7zrl">37.86%</td>
-    <td class="tg-7zrl">38.00%</td>
-    <td class="tg-7zrl">-0.37%</td>
-    <td class="tg-7zrl">70.35</td>
-    <td class="tg-7zrl">26.34</td>
-    <td class="tg-7zrl">2.67x</td>
+    <td class="tg-zk71">ResNet101</td>
+    <td class="tg-7zrl">77.50%</td>
+    <td class="tg-7zrl">76.45%</td>
+    <td class="tg-7zrl">1.37%</td>
+    <td class="tg-7zrl">877.91</td>
+    <td class="tg-7zrl">355.49</td>
+    <td class="tg-7zrl">2.47x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v1</td>
-    <td class="tg-7zrl">22.97%</td>
-    <td class="tg-7zrl">23.13%</td>
-    <td class="tg-7zrl">-0.69%</td>
-    <td class="tg-7zrl">852.80</td>
-    <td class="tg-7zrl">460.33</td>
+    <td class="tg-7zrl">ResNet50 Fashion</td>
+    <td class="tg-7zrl">77.80%</td>
+    <td class="tg-7zrl">78.12%</td>
+    <td class="tg-7zrl">-0.41%</td>
+    <td class="tg-7zrl">3977.5</td>
+    <td class="tg-7zrl">2150.68</td>
     <td class="tg-7zrl">1.85x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">faster_rcnn_inception_resnet_v2</td>
-    <td class="tg-7zrl">37.99%</td>
-    <td class="tg-7zrl">38.33%</td>
-    <td class="tg-7zrl">-0.89%</td>
-    <td class="tg-7zrl">4.06</td>
-    <td class="tg-7zrl">2.33</td>
-    <td class="tg-7zrl">1.74x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">faster_rcnn_resnet101_saved</td>
-    <td class="tg-7zrl">30.37%</td>
-    <td class="tg-7zrl">30.39%</td>
-    <td class="tg-7zrl">-0.07%</td>
-    <td class="tg-7zrl">69.69</td>
-    <td class="tg-7zrl">17.71</td>
-    <td class="tg-7zrl">3.94x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">mask_rcnn_inception_v2</td>
-    <td class="tg-7zrl">28.54%</td>
-    <td class="tg-7zrl">28.72%</td>
-    <td class="tg-7zrl">-0.63%</td>
-    <td class="tg-7zrl">123.97</td>
-    <td class="tg-7zrl">53.23</td>
-    <td class="tg-7zrl">2.33x</td>
+    <td class="tg-zk71">ResNet50 V1.0</td>
+    <td class="tg-7zrl">74.11%</td>
+    <td class="tg-7zrl">74.27%</td>
+    <td class="tg-7zrl">-0.22%</td>
+    <td class="tg-7zrl">1509.64</td>
+    <td class="tg-7zrl">472.66</td>
+    <td class="tg-7zrl">3.19x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">wide_deep_large_ds</td>
-    <td class="tg-7zrl">77.62%</td>
-    <td class="tg-7zrl">77.67%</td>
-    <td class="tg-7zrl">-0.07%</td>
-    <td class="tg-7zrl">22704.16</td>
-    <td class="tg-7zrl">21249.52</td>
-    <td class="tg-7zrl">1.07x</td>
+    <td class="tg-7zrl">ResNet50 V1.5</td>
+    <td class="tg-7zrl">76.82%</td>
+    <td class="tg-7zrl">76.46%</td>
+    <td class="tg-7zrl">0.47%</td>
+    <td class="tg-7zrl">1260.01</td>
+    <td class="tg-7zrl">415.83</td>
+    <td class="tg-7zrl">3.03x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">vgg16</td>
-    <td class="tg-7zrl">72.66%</td>
-    <td class="tg-7zrl">70.89%</td>
-    <td class="tg-7zrl">2.50%</td>
-    <td class="tg-7zrl">669.62</td>
-    <td class="tg-7zrl">178.75</td>
-    <td class="tg-7zrl">3.75x</td>
+    <td class="tg-zk71">ResNet V2 101</td>
+    <td class="tg-7zrl">72.67%</td>
+    <td class="tg-7zrl">71.87%</td>
+    <td class="tg-7zrl">1.11%</td>
+    <td class="tg-7zrl">436.52</td>
+    <td class="tg-7zrl">318.3</td>
+    <td class="tg-7zrl">1.37x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">vgg19</td>
-    <td class="tg-7zrl">72.72%</td>
-    <td class="tg-7zrl">71.01%</td>
-    <td class="tg-7zrl">2.41%</td>
-    <td class="tg-7zrl">558.43</td>
-    <td class="tg-7zrl">148.19</td>
-    <td class="tg-7zrl">3.77x</td>
+    <td class="tg-zk71">ResNet V2 152</td>
+    <td class="tg-7zrl">73.03%</td>
+    <td class="tg-7zrl">72.37%</td>
+    <td class="tg-7zrl">0.91%</td>
+    <td class="tg-7zrl">306.82</td>
+    <td class="tg-7zrl">221.4</td>
+    <td class="tg-7zrl">1.39x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnetv2_50</td>
+    <td class="tg-zk71">ResNet V2 50</td>
     <td class="tg-7zrl">70.33%</td>
     <td class="tg-7zrl">69.64%</td>
     <td class="tg-7zrl">0.99%</td>
-    <td class="tg-7zrl">765.73</td>
-    <td class="tg-7zrl">580.54</td>
-    <td class="tg-7zrl">1.32x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">densenet121</td>
-    <td class="tg-7zrl">73.57%</td>
-    <td class="tg-7zrl">72.89%</td>
-    <td class="tg-7zrl">0.93%</td>
-    <td class="tg-7zrl">366.59</td>
-    <td class="tg-7zrl">296.63</td>
-    <td class="tg-7zrl">1.24x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">densenet161</td>
-    <td class="tg-7zrl">76.24%</td>
-    <td class="tg-7zrl">76.29%</td>
-    <td class="tg-7zrl">-0.07%</td>
-    <td class="tg-7zrl">218.26</td>
-    <td class="tg-7zrl">164.48</td>
-    <td class="tg-7zrl">1.33x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">densenet169</td>
-    <td class="tg-7zrl">74.40%</td>
-    <td class="tg-7zrl">74.65%</td>
-    <td class="tg-7zrl">-0.33%</td>
-    <td class="tg-7zrl">294.82</td>
-    <td class="tg-7zrl">253.35</td>
-    <td class="tg-7zrl">1.16x</td>
+    <td class="tg-7zrl">749.85</td>
+    <td class="tg-7zrl">574.19</td>
+    <td class="tg-7zrl">1.31x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">ssd_resnet50_v1_ckpt</td>
-    <td class="tg-7zrl">37.81%</td>
-    <td class="tg-7zrl">38.00%</td>
-    <td class="tg-7zrl">-0.50%</td>
-    <td class="tg-7zrl">70.47</td>
-    <td class="tg-7zrl">21.79</td>
-    <td class="tg-7zrl">3.23x</td>
+    <td class="tg-zk71">SSD MobileNet V1</td>
+    <td class="tg-7zrl">22.97%</td>
+    <td class="tg-7zrl">23.13%</td>
+    <td class="tg-7zrl">-0.69%</td>
+    <td class="tg-7zrl">952.9</td>
+    <td class="tg-7zrl">582.87</td>
+    <td class="tg-7zrl">1.63x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v1_ckpt</td>
+    <td class="tg-zk71">SSD MobileNet V1</td>
     <td class="tg-7zrl">22.99%</td>
     <td class="tg-7zrl">23.13%</td>
     <td class="tg-7zrl">-0.61%</td>
-    <td class="tg-7zrl">852.49</td>
-    <td class="tg-7zrl">386.90</td>
-    <td class="tg-7zrl">2.20x</td>
+    <td class="tg-7zrl">954.92</td>
+    <td class="tg-7zrl">413.24</td>
+    <td class="tg-7zrl">2.31x</td>
+    <td class="tg-7zrl">ckpt</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">mask_rcnn_inception_v2_ckpt</td>
-    <td class="tg-7zrl">28.54%</td>
-    <td class="tg-7zrl">28.72%</td>
-    <td class="tg-7zrl">-0.63%</td>
-    <td class="tg-7zrl">131.43</td>
-    <td class="tg-7zrl">51.09</td>
-    <td class="tg-7zrl">2.57x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnet50v1.0</td>
-    <td class="tg-7zrl">74.11%</td>
-    <td class="tg-7zrl">74.27%</td>
-    <td class="tg-7zrl">-0.22%</td>
-    <td class="tg-7zrl">1543.95</td>
-    <td class="tg-7zrl">501.61</td>
-    <td class="tg-7zrl">3.08x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">ssd_resnet34</td>
+    <td class="tg-zk71">SSD ResNet34</td>
     <td class="tg-7zrl">21.69%</td>
     <td class="tg-7zrl">22.09%</td>
     <td class="tg-7zrl">-1.81%</td>
-    <td class="tg-7zrl">43.71</td>
-    <td class="tg-7zrl">11.78</td>
-    <td class="tg-7zrl">3.71x</td>
+    <td class="tg-7zrl">44.46</td>
+    <td class="tg-7zrl">11.81</td>
+    <td class="tg-7zrl">3.76x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">inception_v1</td>
-    <td class="tg-7zrl">70.48%</td>
-    <td class="tg-7zrl">69.74%</td>
-    <td class="tg-7zrl">1.06%</td>
-    <td class="tg-7zrl">2227.69</td>
-    <td class="tg-7zrl">1051.64</td>
-    <td class="tg-7zrl">2.12x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">faster_rcnn_inception_resnet_v2_saved</td>
-    <td class="tg-7zrl">37.90%</td>
-    <td class="tg-7zrl">38.33%</td>
-    <td class="tg-7zrl">-1.12%</td>
-    <td class="tg-7zrl">4.05</td>
-    <td class="tg-7zrl">2.33</td>
-    <td class="tg-7zrl">1.74x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">faster_rcnn_resnet101</td>
-    <td class="tg-7zrl">30.28%</td>
-    <td class="tg-7zrl">30.39%</td>
-    <td class="tg-7zrl">-0.36%</td>
-    <td class="tg-7zrl">69.74</td>
-    <td class="tg-7zrl">19.90</td>
-    <td class="tg-7zrl">3.50x</td>
+    <td class="tg-zk71">SSD ResNet50 V1</td>
+    <td class="tg-7zrl">37.86%</td>
+    <td class="tg-7zrl">38.00%</td>
+    <td class="tg-7zrl">-0.37%</td>
+    <td class="tg-7zrl">69.5</td>
+    <td class="tg-7zrl">26.04</td>
+    <td class="tg-7zrl">2.67x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnetv2_101</td>
-    <td class="tg-7zrl">72.67%</td>
-    <td class="tg-7zrl">71.87%</td>
-    <td class="tg-7zrl">1.11%</td>
-    <td class="tg-7zrl">444.06</td>
-    <td class="tg-7zrl">329.70</td>
-    <td class="tg-7zrl">1.35x</td>
+    <td class="tg-zk71">SSD ResNet50 V1</td>
+    <td class="tg-7zrl">37.81%</td>
+    <td class="tg-7zrl">38.00%</td>
+    <td class="tg-7zrl">-0.50%</td>
+    <td class="tg-7zrl">69.27</td>
+    <td class="tg-7zrl">21.17</td>
+    <td class="tg-7zrl">3.27x</td>
+    <td class="tg-7zrl">ckpt</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">inception_resnet_v2</td>
-    <td class="tg-7zrl">80.44%</td>
-    <td class="tg-7zrl">80.40%</td>
-    <td class="tg-7zrl">0.05%</td>
-    <td class="tg-7zrl">284.40</td>
-    <td class="tg-7zrl">143.73</td>
-    <td class="tg-7zrl">1.98x</td>
+    <td class="tg-zk71">VGG16</td>
+    <td class="tg-7zrl">72.66%</td>
+    <td class="tg-7zrl">70.89%</td>
+    <td class="tg-7zrl">2.50%</td>
+    <td class="tg-7zrl">660.46</td>
+    <td class="tg-7zrl">177.85</td>
+    <td class="tg-7zrl">3.71x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnetv2_152</td>
-    <td class="tg-7zrl">73.03%</td>
-    <td class="tg-7zrl">72.37%</td>
-    <td class="tg-7zrl">0.91%</td>
-    <td class="tg-7zrl">319.08</td>
-    <td class="tg-7zrl">223.37</td>
-    <td class="tg-7zrl">1.43x</td>
+    <td class="tg-zk71">VGG19</td>
+    <td class="tg-7zrl">72.72%</td>
+    <td class="tg-7zrl">71.01%</td>
+    <td class="tg-7zrl">2.41%</td>
+    <td class="tg-7zrl">562.04</td>
+    <td class="tg-7zrl">147.61</td>
+    <td class="tg-7zrl">3.81x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">2.7.0</td>
-    <td class="tg-7zrl">resnet50_fashion</td>
-    <td class="tg-7zrl">77.80%</td>
-    <td class="tg-7zrl">78.12%</td>
-    <td class="tg-7zrl">-0.41%</td>
-    <td class="tg-7zrl">3953.56</td>
-    <td class="tg-7zrl">2170.49</td>
-    <td class="tg-7zrl">1.82x</td>
+    <td class="tg-zk71">Wide &amp; Deep</td>
+    <td class="tg-7zrl">77.62%</td>
+    <td class="tg-7zrl">77.67%</td>
+    <td class="tg-7zrl">-0.07%</td>
+    <td class="tg-7zrl">21332.47</td>
+    <td class="tg-7zrl">19714.08</td>
+    <td class="tg-7zrl">1.08x</td>
+    <td class="tg-7zrl">pb</td>
   </tr>
 </tbody>
 </table>
 
-
-### Intel-tensorflow 1.x models
+### PyTorch models with Torch 1.11.0+cpu in PTQ mode
 
 <table>
 <thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
+    <th rowspan="2">Model</th>
     <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
+    <th rowspan="2">Example</th>
   </tr>
   <tr>
     <th>INT8</th>
     <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
     <th>INT8</th>
     <th>FP32</th>
     <th>Performance Ratio[INT8/FP32]</th>
   </tr>
 </thead>
-<tbody>
+<tbody align="center">
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">bert_large_squad</td>
-    <td class="tg-7zrl">92.42</td>
-    <td class="tg-7zrl">92.98</td>
-    <td class="tg-7zrl">-0.61%</td>
-    <td class="tg-7zrl">25.99</td>
-    <td class="tg-7zrl">12.55</td>
-    <td class="tg-7zrl">2.07x</td>
+    <td class="tg-iz6e">ALBERT base MRPC</td>
+    <td class="tg-za14">88.06%</td>
+    <td class="tg-za14">88.50%</td>
+    <td class="tg-za14">-0.50%</td>
+    <td class="tg-za14">34.28</td>
+    <td class="tg-za14">29.54</td>
+    <td class="tg-za14">1.16x</td>
+    <td class="tg-za14">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">bert_base_mrpc</td>
-    <td class="tg-7zrl">86.52%</td>
-    <td class="tg-7zrl">86.52%</td>
-    <td class="tg-7zrl">0.00%</td>
-    <td class="tg-7zrl">266.15</td>
-    <td class="tg-7zrl">145.02</td>
-    <td class="tg-7zrl">1.84x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnet_v1_50_slim</td>
-    <td class="tg-7zrl">76.38%</td>
-    <td class="tg-7zrl">75.18%</td>
-    <td class="tg-7zrl">1.60%</td>
-    <td class="tg-7zrl">1515.24</td>
-    <td class="tg-7zrl">409.44</td>
-    <td class="tg-7zrl">3.70x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnet_v1_101_slim</td>
-    <td class="tg-7zrl">77.52%</td>
-    <td class="tg-7zrl">76.40%</td>
-    <td class="tg-7zrl">1.47%</td>
-    <td class="tg-7zrl">837.49</td>
-    <td class="tg-7zrl">224.57</td>
-    <td class="tg-7zrl">3.73x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnet_v1_152_slim</td>
-    <td class="tg-7zrl">77.08%</td>
-    <td class="tg-7zrl">76.81%</td>
-    <td class="tg-7zrl">0.35%</td>
-    <td class="tg-7zrl">587.75</td>
-    <td class="tg-7zrl">152.39</td>
-    <td class="tg-7zrl">3.86x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">inception_v1_slim</td>
-    <td class="tg-7zrl">70.49%</td>
-    <td class="tg-7zrl">69.77%</td>
-    <td class="tg-7zrl">1.03%</td>
-    <td class="tg-7zrl">1968.87</td>
-    <td class="tg-7zrl">803.53</td>
-    <td class="tg-7zrl">2.45x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">inception_v2_slim</td>
-    <td class="tg-7zrl">74.35%</td>
-    <td class="tg-7zrl">73.98%</td>
-    <td class="tg-7zrl">0.50%</td>
-    <td class="tg-7zrl">1591.25</td>
-    <td class="tg-7zrl">658.54</td>
-    <td class="tg-7zrl">2.42x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">inception_v3_slim</td>
-    <td class="tg-7zrl">78.32%</td>
-    <td class="tg-7zrl">77.99%</td>
-    <td class="tg-7zrl">0.42%</td>
-    <td class="tg-7zrl">941.48</td>
-    <td class="tg-7zrl">285.17</td>
-    <td class="tg-7zrl">3.30x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">inception_v4_slim</td>
-    <td class="tg-7zrl">80.30%</td>
-    <td class="tg-7zrl">80.19%</td>
-    <td class="tg-7zrl">0.14%</td>
-    <td class="tg-7zrl">512.74</td>
-    <td class="tg-7zrl">143.42</td>
-    <td class="tg-7zrl">3.58x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">vgg16_slim</td>
-    <td class="tg-7zrl">72.78%</td>
-    <td class="tg-7zrl">70.89%</td>
-    <td class="tg-7zrl">2.67%</td>
-    <td class="tg-7zrl">609.29</td>
-    <td class="tg-7zrl">151.15</td>
-    <td class="tg-7zrl">4.03x</td>
+    <td class="tg-zk71">Barthez MRPC</td>
+    <td class="tg-7zrl">82.99%</td>
+    <td class="tg-7zrl">83.81%</td>
+    <td class="tg-7zrl">-0.97%</td>
+    <td class="tg-7zrl">166.84</td>
+    <td class="tg-7zrl">89.56</td>
+    <td class="tg-7zrl">1.86x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">vgg19_slim</td>
-    <td class="tg-7zrl">72.60%</td>
-    <td class="tg-7zrl">71.01%</td>
-    <td class="tg-7zrl">2.24%</td>
-    <td class="tg-7zrl">510.33</td>
-    <td class="tg-7zrl">122.87</td>
-    <td class="tg-7zrl">4.15x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnetv2_50_slim</td>
-    <td class="tg-7zrl">70.47%</td>
-    <td class="tg-7zrl">69.72%</td>
-    <td class="tg-7zrl">1.08%</td>
-    <td class="tg-7zrl">823.59</td>
-    <td class="tg-7zrl">470.80</td>
-    <td class="tg-7zrl">1.75x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnetv2_101_slim</td>
-    <td class="tg-7zrl">72.62%</td>
-    <td class="tg-7zrl">71.91%</td>
-    <td class="tg-7zrl">0.99%</td>
-    <td class="tg-7zrl">471.451</td>
-    <td class="tg-7zrl">247.627</td>
-    <td class="tg-7zrl">1.90x</td>
+    <td class="tg-7zrl">BERT base COLA</td>
+    <td class="tg-7zrl">58.80%</td>
+    <td class="tg-7zrl">58.84%</td>
+    <td class="tg-7zrl">-0.07%</td>
+    <td class="tg-7zrl">260</td>
+    <td class="tg-7zrl">126.47</td>
+    <td class="tg-7zrl">2.06x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">intel-tensorflow</td>
-    <td class="tg-7zrl">1.15.0-up3</td>
-    <td class="tg-7zrl">resnetv2_152_slim</td>
-    <td class="tg-7zrl">72.95%</td>
-    <td class="tg-7zrl">72.40%</td>
-    <td class="tg-7zrl">0.76%</td>
-    <td class="tg-7zrl">339.192</td>
-    <td class="tg-7zrl">170.545</td>
+    <td class="tg-zk71">BERT base MRPC</td>
+    <td class="tg-7zrl">90.28%</td>
+    <td class="tg-7zrl">90.69%</td>
+    <td class="tg-7zrl">-0.45%</td>
+    <td class="tg-7zrl">251.79</td>
+    <td class="tg-7zrl">126.46</td>
     <td class="tg-7zrl">1.99x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
-</tbody>
-</table>
-
-
-### PyTorch models
-
-<table>
-<thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
-    <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <td class="tg-7zrl">BERT base RTE</td>
+    <td class="tg-7zrl">69.31%</td>
+    <td class="tg-7zrl">69.68%</td>
+    <td class="tg-7zrl">-0.52%</td>
+    <td class="tg-7zrl">252.14</td>
+    <td class="tg-7zrl">126.45</td>
+    <td class="tg-7zrl">1.99x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <th>INT8</th>
-    <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
-    <th>INT8</th>
-    <th>FP32</th>
-    <th>Performance Ratio[INT8/FP32]</th>
+    <td class="tg-7zrl">BERT base SST2</td>
+    <td class="tg-7zrl">91.97%</td>
+    <td class="tg-7zrl">91.86%</td>
+    <td class="tg-7zrl">0.12%</td>
+    <td class="tg-7zrl">258.98</td>
+    <td class="tg-7zrl">126.42</td>
+    <td class="tg-7zrl">2.05x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
-</thead>
-<tbody>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">se_resnext50_32x4d</td>
-    <td class="tg-7zrl">79.04%</td>
-    <td class="tg-7zrl">79.08%</td>
-    <td class="tg-7zrl">-0.05%</td>
-    <td class="tg-7zrl">350.90</td>
-    <td class="tg-7zrl">171.32</td>
-    <td class="tg-7zrl">2.05x</td>
+    <td class="tg-7zrl">BERT base STSB</td>
+    <td class="tg-7zrl">89.13%</td>
+    <td class="tg-7zrl">89.75%</td>
+    <td class="tg-7zrl">-0.68%</td>
+    <td class="tg-7zrl">249.57</td>
+    <td class="tg-7zrl">126.39</td>
+    <td class="tg-7zrl">1.97x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">mobilenet_v2</td>
-    <td class="tg-7zrl">70.54%</td>
-    <td class="tg-7zrl">71.84%</td>
-    <td class="tg-7zrl">-1.81%</td>
-    <td class="tg-7zrl">707.15</td>
-    <td class="tg-7zrl">490.61</td>
-    <td class="tg-7zrl">1.44x</td>
+    <td class="tg-7zrl">BERT large COLA</td>
+    <td class="tg-7zrl">62.88%</td>
+    <td class="tg-7zrl">62.57%</td>
+    <td class="tg-7zrl">0.49%</td>
+    <td class="tg-7zrl">88.75</td>
+    <td class="tg-7zrl">36.7</td>
+    <td class="tg-7zrl">2.42x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">rnnt</td>
-    <td class="tg-7zrl">92.48</td>
-    <td class="tg-7zrl">92.54</td>
-    <td class="tg-7zrl">-0.07%</td>
-    <td class="tg-7zrl">75.74</td>
-    <td class="tg-7zrl">20.44</td>
-    <td class="tg-7zrl">3.71x</td>
+    <td class="tg-7zrl">BERT large MRPC</td>
+    <td class="tg-7zrl">89.93%</td>
+    <td class="tg-7zrl">90.38%</td>
+    <td class="tg-7zrl">-0.49%</td>
+    <td class="tg-7zrl">89.43</td>
+    <td class="tg-7zrl">36.62</td>
+    <td class="tg-7zrl">2.44x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">barthez_mrpc</td>
-    <td class="tg-7zrl">82.99%</td>
-    <td class="tg-7zrl">83.81%</td>
-    <td class="tg-7zrl">-0.97%</td>
-    <td class="tg-7zrl">155.80</td>
-    <td class="tg-7zrl">89.41</td>
-    <td class="tg-7zrl">1.74x</td>
+    <td class="tg-7zrl">BERT large QNLI</td>
+    <td class="tg-7zrl">90.96%</td>
+    <td class="tg-7zrl">91.82%</td>
+    <td class="tg-7zrl">-0.94%</td>
+    <td class="tg-7zrl">91.27</td>
+    <td class="tg-7zrl">37</td>
+    <td class="tg-7zrl">2.47x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">longformer_mrpc</td>
-    <td class="tg-7zrl">90.59%</td>
-    <td class="tg-7zrl">91.46%</td>
-    <td class="tg-7zrl">-0.95%</td>
-    <td class="tg-7zrl">21.29</td>
-    <td class="tg-7zrl">17.15</td>
-    <td class="tg-7zrl">1.24x</td>
+    <td class="tg-7zrl">BERT large RTE</td>
+    <td class="tg-7zrl">71.84%</td>
+    <td class="tg-7zrl">72.56%</td>
+    <td class="tg-7zrl">-1.00%</td>
+    <td class="tg-7zrl">77.62</td>
+    <td class="tg-7zrl">36.01</td>
+    <td class="tg-7zrl">2.16x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet18</td>
-    <td class="tg-7zrl">69.57%</td>
-    <td class="tg-7zrl">69.76%</td>
-    <td class="tg-7zrl">-0.27%</td>
-    <td class="tg-7zrl">749.77</td>
-    <td class="tg-7zrl">377.16</td>
-    <td class="tg-7zrl">1.99x</td>
+    <td class="tg-7zrl">CamemBERT base MRPC</td>
+    <td class="tg-7zrl">86.56%</td>
+    <td class="tg-7zrl">86.82%</td>
+    <td class="tg-7zrl">-0.30%</td>
+    <td class="tg-7zrl">241.39</td>
+    <td class="tg-7zrl">124.77</td>
+    <td class="tg-7zrl">1.93x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet50</td>
-    <td class="tg-7zrl">75.98%</td>
-    <td class="tg-7zrl">76.15%</td>
-    <td class="tg-7zrl">-0.21%</td>
-    <td class="tg-7zrl">487.25</td>
-    <td class="tg-7zrl">199.64</td>
-    <td class="tg-7zrl">2.44x</td>
+    <td class="tg-7zrl">Deberta MRPC</td>
+    <td class="tg-7zrl">91.17%</td>
+    <td class="tg-7zrl">90.91%</td>
+    <td class="tg-7zrl">0.28%</td>
+    <td class="tg-7zrl">152.09</td>
+    <td class="tg-7zrl">85.13</td>
+    <td class="tg-7zrl">1.79x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnext101_32x8d</td>
-    <td class="tg-7zrl">79.03%</td>
-    <td class="tg-7zrl">79.31%</td>
-    <td class="tg-7zrl">-0.35%</td>
-    <td class="tg-7zrl">198.94</td>
-    <td class="tg-7zrl">73.88</td>
-    <td class="tg-7zrl">2.69x</td>
+    <td class="tg-zk71">DistilBERT base MRPC</td>
+    <td class="tg-7zrl">88.66%</td>
+    <td class="tg-7zrl">89.16%</td>
+    <td class="tg-7zrl">-0.56%</td>
+    <td class="tg-7zrl">415.09</td>
+    <td class="tg-7zrl">246.9</td>
+    <td class="tg-7zrl">1.68x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet18_qat</td>
-    <td class="tg-7zrl">69.74%</td>
-    <td class="tg-7zrl">69.76%</td>
-    <td class="tg-7zrl">-0.03%</td>
-    <td class="tg-7zrl">750.71</td>
-    <td class="tg-7zrl">379.57</td>
-    <td class="tg-7zrl">1.98x</td>
+    <td class="tg-7zrl">DistilBERT base MRPC</td>
+    <td class="tg-7zrl">88.74%</td>
+    <td class="tg-7zrl">89.16%</td>
+    <td class="tg-7zrl">-0.47%</td>
+    <td class="tg-7zrl">459.93</td>
+    <td class="tg-7zrl">245.33</td>
+    <td class="tg-7zrl">1.87x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet50_qat</td>
-    <td class="tg-7zrl">76.04%</td>
-    <td class="tg-7zrl">76.15%</td>
-    <td class="tg-7zrl">-0.14%</td>
-    <td class="tg-7zrl">478.44</td>
-    <td class="tg-7zrl">197.69</td>
-    <td class="tg-7zrl">2.42x</td>
+    <td class="tg-7zrl">FlauBERT MRPC</td>
+    <td class="tg-7zrl">81.01%</td>
+    <td class="tg-7zrl">80.19%</td>
+    <td class="tg-7zrl">1.01%</td>
+    <td class="tg-7zrl">644.05</td>
+    <td class="tg-7zrl">457.32</td>
+    <td class="tg-7zrl">1.41x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">inception_v3</td>
+    <td class="tg-zk71">Inception V3</td>
     <td class="tg-7zrl">69.43%</td>
     <td class="tg-7zrl">69.52%</td>
     <td class="tg-7zrl">-0.13%</td>
-    <td class="tg-7zrl">433.36</td>
-    <td class="tg-7zrl">216.31</td>
-    <td class="tg-7zrl">2.00x</td>
+    <td class="tg-7zrl">454.3</td>
+    <td class="tg-7zrl">213.7</td>
+    <td class="tg-7zrl">2.13x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">peleenet</td>
-    <td class="tg-7zrl">71.64%</td>
-    <td class="tg-7zrl">72.10%</td>
-    <td class="tg-7zrl">-0.64%</td>
-    <td class="tg-7zrl">479.00</td>
-    <td class="tg-7zrl">377.54</td>
-    <td class="tg-7zrl">1.27x</td>
+    <td class="tg-7zrl">Longformer MRPC</td>
+    <td class="tg-7zrl">90.59%</td>
+    <td class="tg-7zrl">91.46%</td>
+    <td class="tg-7zrl">-0.95%</td>
+    <td class="tg-7zrl">21.51</td>
+    <td class="tg-7zrl">17.45</td>
+    <td class="tg-7zrl">1.23x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">yolo_v3</td>
-    <td class="tg-7zrl">24.60%</td>
-    <td class="tg-7zrl">24.54%</td>
-    <td class="tg-7zrl">0.21%</td>
-    <td class="tg-7zrl">105.84</td>
-    <td class="tg-7zrl">39.80</td>
-    <td class="tg-7zrl">2.66x</td>
+    <td class="tg-zk71">Mask R-CNN</td>
+    <td class="tg-7zrl">37.70%</td>
+    <td class="tg-7zrl">37.80%</td>
+    <td class="tg-7zrl">-0.26%</td>
+    <td class="tg-7zrl">17.61</td>
+    <td class="tg-7zrl">5.76</td>
+    <td class="tg-7zrl">3.06x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">blendcnn</td>
-    <td class="tg-7zrl">68.40%</td>
-    <td class="tg-7zrl">68.40%</td>
+    <td class="tg-7zrl">mBart WNLI</td>
+    <td class="tg-7zrl">56.34%</td>
+    <td class="tg-7zrl">56.34%</td>
     <td class="tg-7zrl">0.00%</td>
-    <td class="tg-7zrl">4997.74</td>
-    <td class="tg-7zrl">4621.03</td>
-    <td class="tg-7zrl">1.08x</td>
+    <td class="tg-7zrl">65.05</td>
+    <td class="tg-7zrl">31.26</td>
+    <td class="tg-7zrl">2.08x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">roberta_base_mrpc</td>
-    <td class="tg-7zrl">87.88%</td>
-    <td class="tg-7zrl">88.18%</td>
-    <td class="tg-7zrl">-0.34%</td>
-    <td class="tg-7zrl">246.27</td>
-    <td class="tg-7zrl">125.03</td>
-    <td class="tg-7zrl">1.97x</td>
+    <td class="tg-zk71">MobileNet V2</td>
+    <td class="tg-7zrl">70.54%</td>
+    <td class="tg-7zrl">71.84%</td>
+    <td class="tg-7zrl">-1.81%</td>
+    <td class="tg-7zrl">740.97</td>
+    <td class="tg-7zrl">535.54</td>
+    <td class="tg-7zrl">1.38x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">camembert_base_mrpc</td>
-    <td class="tg-7zrl">86.56%</td>
-    <td class="tg-7zrl">86.82%</td>
-    <td class="tg-7zrl">-0.30%</td>
-    <td class="tg-7zrl">236.17</td>
-    <td class="tg-7zrl">124.68</td>
-    <td class="tg-7zrl">1.89x</td>
+    <td class="tg-zk71">lvwerra/pegasus-samsum</td>
+    <td class="tg-7zrl">42.21</td>
+    <td class="tg-7zrl">42.67</td>
+    <td class="tg-7zrl">-1.09%</td>
+    <td class="tg-7zrl">3.89</td>
+    <td class="tg-7zrl">1.14</td>
+    <td class="tg-7zrl">3.41x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">distilbert_base_mrpc</td>
-    <td class="tg-7zrl">88.66%</td>
-    <td class="tg-7zrl">89.16%</td>
-    <td class="tg-7zrl">-0.56%</td>
-    <td class="tg-7zrl">422.29</td>
-    <td class="tg-7zrl">246.37</td>
-    <td class="tg-7zrl">1.71x</td>
+    <td class="tg-zk71">PeleeNet</td>
+    <td class="tg-7zrl">71.64%</td>
+    <td class="tg-7zrl">72.10%</td>
+    <td class="tg-7zrl">-0.64%</td>
+    <td class="tg-7zrl">502.01</td>
+    <td class="tg-7zrl">391.31</td>
+    <td class="tg-7zrl">1.28x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">albert_base_mrpc</td>
-    <td class="tg-7zrl">88.06%</td>
-    <td class="tg-7zrl">88.50%</td>
-    <td class="tg-7zrl">-0.50%</td>
-    <td class="tg-7zrl">34.44</td>
-    <td class="tg-7zrl">28.85</td>
-    <td class="tg-7zrl">1.19x</td>
+    <td class="tg-zk71">ResNet18 </td>
+    <td class="tg-7zrl">69.57%</td>
+    <td class="tg-7zrl">69.76%</td>
+    <td class="tg-7zrl">-0.27%</td>
+    <td class="tg-7zrl">800.43</td>
+    <td class="tg-7zrl">381.27</td>
+    <td class="tg-7zrl">2.10x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">pegasus_samsum</td>
-    <td class="tg-7zrl">42.20</td>
-    <td class="tg-7zrl">42.67</td>
-    <td class="tg-7zrl">-1.09%</td>
-    <td class="tg-7zrl">3.80</td>
-    <td class="tg-7zrl">1.14</td>
-    <td class="tg-7zrl">3.33x</td>
+    <td class="tg-zk71">ResNet18 </td>
+    <td class="tg-7zrl">69.57%</td>
+    <td class="tg-7zrl">69.76%</td>
+    <td class="tg-7zrl">-0.28%</td>
+    <td class="tg-7zrl">811.09</td>
+    <td class="tg-7zrl">389.36</td>
+    <td class="tg-7zrl">2.08x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">flaubert_mrpc</td>
-    <td class="tg-7zrl">81.01%</td>
-    <td class="tg-7zrl">80.19%</td>
-    <td class="tg-7zrl">1.01%</td>
-    <td class="tg-7zrl">672.25</td>
-    <td class="tg-7zrl">457.05</td>
-    <td class="tg-7zrl">1.47x</td>
+    <td class="tg-zk71">ResNet50</td>
+    <td class="tg-7zrl">75.98%</td>
+    <td class="tg-7zrl">76.15%</td>
+    <td class="tg-7zrl">-0.21%</td>
+    <td class="tg-7zrl">507.55</td>
+    <td class="tg-7zrl">200.52</td>
+    <td class="tg-7zrl">2.53x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">deberta_mrpc</td>
-    <td class="tg-7zrl">91.17%</td>
-    <td class="tg-7zrl">90.91%</td>
-    <td class="tg-7zrl">0.28%</td>
-    <td class="tg-7zrl">131.09</td>
-    <td class="tg-7zrl">79.85</td>
-    <td class="tg-7zrl">1.64x</td>
+    <td class="tg-zk71">ResNeXt101_32x8d</td>
+    <td class="tg-7zrl">79.08%</td>
+    <td class="tg-7zrl">79.31%</td>
+    <td class="tg-7zrl">-0.29%</td>
+    <td class="tg-7zrl">203.54</td>
+    <td class="tg-7zrl">73.85</td>
+    <td class="tg-7zrl">2.76x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">squeezebert_mrpc</td>
-    <td class="tg-7zrl">87.77%</td>
-    <td class="tg-7zrl">87.65%</td>
-    <td class="tg-7zrl">0.14%</td>
-    <td class="tg-7zrl">239.56</td>
-    <td class="tg-7zrl">209.01</td>
-    <td class="tg-7zrl">1.15x</td>
+    <td class="tg-zk71">RNN-T</td>
+    <td class="tg-7zrl">92.45</td>
+    <td class="tg-7zrl">92.55</td>
+    <td class="tg-7zrl">-0.10%</td>
+    <td class="tg-7zrl">79.21</td>
+    <td class="tg-7zrl">20.47</td>
+    <td class="tg-7zrl">3.87x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet18_fx</td>
-    <td class="tg-7zrl">69.57%</td>
-    <td class="tg-7zrl">69.76%</td>
-    <td class="tg-7zrl">-0.28%</td>
-    <td class="tg-7zrl">761.15</td>
-    <td class="tg-7zrl">379.99</td>
+    <td class="tg-zk71">Roberta Base MRPC</td>
+    <td class="tg-7zrl">87.88%</td>
+    <td class="tg-7zrl">88.18%</td>
+    <td class="tg-7zrl">-0.34%</td>
+    <td class="tg-7zrl">250.21</td>
+    <td class="tg-7zrl">124.92</td>
     <td class="tg-7zrl">2.00x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet18_qat_fx</td>
-    <td class="tg-7zrl">69.73%</td>
-    <td class="tg-7zrl">69.76%</td>
-    <td class="tg-7zrl">-0.04%</td>
-    <td class="tg-7zrl">765.09</td>
-    <td class="tg-7zrl">377.01</td>
-    <td class="tg-7zrl">2.03x</td>
+    <td class="tg-zk71">Se_ResNeXt50_32x4d</td>
+    <td class="tg-7zrl">78.98%</td>
+    <td class="tg-7zrl">79.08%</td>
+    <td class="tg-7zrl">-0.13%</td>
+    <td class="tg-7zrl">358.63</td>
+    <td class="tg-7zrl">173.03</td>
+    <td class="tg-7zrl">2.07x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">transfo_xl_mrpc</td>
+    <td class="tg-7zrl">SqueezeBERT MRPC</td>
+    <td class="tg-7zrl">87.77%</td>
+    <td class="tg-7zrl">87.65%</td>
+    <td class="tg-7zrl">0.14%</td>
+    <td class="tg-7zrl">249.89</td>
+    <td class="tg-7zrl">207.43</td>
+    <td class="tg-7zrl">1.20x</td>
+    <td class="tg-7zrl">eager</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">Transfo-xl MRPC</td>
     <td class="tg-7zrl">81.97%</td>
     <td class="tg-7zrl">81.20%</td>
     <td class="tg-7zrl">0.94%</td>
-    <td class="tg-7zrl">11.10</td>
-    <td class="tg-7zrl">8.22</td>
+    <td class="tg-7zrl">11.25</td>
+    <td class="tg-7zrl">8.34</td>
     <td class="tg-7zrl">1.35x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_base_mrpc</td>
-    <td class="tg-7zrl">90.28%</td>
-    <td class="tg-7zrl">90.69%</td>
-    <td class="tg-7zrl">-0.45%</td>
-    <td class="tg-7zrl">241.46</td>
-    <td class="tg-7zrl">125.09</td>
-    <td class="tg-7zrl">1.93x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_base_cola</td>
-    <td class="tg-7zrl">58.80%</td>
-    <td class="tg-7zrl">58.84%</td>
-    <td class="tg-7zrl">-0.07%</td>
-    <td class="tg-7zrl">253.12</td>
-    <td class="tg-7zrl">125.17</td>
-    <td class="tg-7zrl">2.02x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_base_sts-b</td>
-    <td class="tg-7zrl">89.13%</td>
-    <td class="tg-7zrl">89.75%</td>
-    <td class="tg-7zrl">-0.68%</td>
-    <td class="tg-7zrl">243.50</td>
-    <td class="tg-7zrl">124.54</td>
-    <td class="tg-7zrl">1.96x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_base_sst-2</td>
-    <td class="tg-7zrl">91.97%</td>
-    <td class="tg-7zrl">91.86%</td>
-    <td class="tg-7zrl">0.12%</td>
-    <td class="tg-7zrl">252.00</td>
-    <td class="tg-7zrl">121.14</td>
-    <td class="tg-7zrl">2.08x</td>
+    <td class="tg-zk71">YOLOv3</td>
+    <td class="tg-7zrl">24.60%</td>
+    <td class="tg-7zrl">24.54%</td>
+    <td class="tg-7zrl">0.21%</td>
+    <td class="tg-7zrl">108.09</td>
+    <td class="tg-7zrl">40.02</td>
+    <td class="tg-7zrl">2.70x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
+</tbody>
+</table>
+
+### PyTorch models with Torch 1.11.0+cpu in QAT mode
+<table>
+<thead>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_large_cola</td>
-    <td class="tg-7zrl">62.88%</td>
-    <td class="tg-7zrl">62.57%</td>
-    <td class="tg-7zrl">0.49%</td>
-    <td class="tg-7zrl">87.88</td>
-    <td class="tg-7zrl">36.93</td>
-    <td class="tg-7zrl">2.38x</td>
+    <th rowspan="2">Model</th>
+    <th colspan="3">Accuracy</th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
+    <th rowspan="2">Example</th>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_base_rte</td>
-    <td class="tg-7zrl">69.31%</td>
-    <td class="tg-7zrl">69.68%</td>
-    <td class="tg-7zrl">-0.52%</td>
-    <td class="tg-7zrl">244.20</td>
-    <td class="tg-7zrl">125.71</td>
-    <td class="tg-7zrl">1.94x</td>
+    <th>INT8</th>
+    <th>FP32</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
+    <th>INT8</th>
+    <th>FP32</th>
+    <th>Performance Ratio[INT8/FP32]</th>
   </tr>
+</thead>
+<tbody align="center">
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_large_mrpc</td>
-    <td class="tg-7zrl">89.93%</td>
-    <td class="tg-7zrl">90.38%</td>
-    <td class="tg-7zrl">-0.49%</td>
-    <td class="tg-7zrl">87.44</td>
-    <td class="tg-7zrl">36.71</td>
-    <td class="tg-7zrl">2.38x</td>
+    <td class="tg-iz6e">ResNet18</td>
+    <td class="tg-za14">69.74%</td>
+    <td class="tg-za14">69.76%</td>
+    <td class="tg-za14">-0.03%</td>
+    <td class="tg-za14">804.76</td>
+    <td class="tg-za14">388.67</td>
+    <td class="tg-za14">2.07x</td>
+    <td class="tg-za14">eager</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_large_qnli</td>
-    <td class="tg-7zrl">90.96%</td>
-    <td class="tg-7zrl">91.82%</td>
-    <td class="tg-7zrl">-0.94%</td>
-    <td class="tg-7zrl">89.18</td>
-    <td class="tg-7zrl">36.87</td>
-    <td class="tg-7zrl">2.42x</td>
+    <td class="tg-zk71">ResNet18</td>
+    <td class="tg-7zrl">69.73%</td>
+    <td class="tg-7zrl">69.76%</td>
+    <td class="tg-7zrl">-0.04%</td>
+    <td class="tg-7zrl">806.44</td>
+    <td class="tg-7zrl">386.59</td>
+    <td class="tg-7zrl">2.09x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_large_rte</td>
-    <td class="tg-7zrl">71.84%</td>
-    <td class="tg-7zrl">72.56%</td>
-    <td class="tg-7zrl">-1.00%</td>
-    <td class="tg-7zrl">75.91</td>
-    <td class="tg-7zrl">36.72</td>
-    <td class="tg-7zrl">2.07x</td>
+    <td class="tg-7zrl">BERT base MRPC QAT</td>
+    <td class="tg-7zrl">89.60%</td>
+    <td class="tg-7zrl">89.50%</td>
+    <td class="tg-7zrl">0.11%</td>
+    <td class="tg-7zrl">258.89</td>
+    <td class="tg-7zrl">125.79</td>
+    <td class="tg-7zrl">2.06x</td>
+    <td class="tg-7zrl">fx</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">mbart_wnli</td>
-    <td class="tg-7zrl">56.34%</td>
-    <td class="tg-7zrl">56.34%</td>
-    <td class="tg-7zrl">0.00%</td>
-    <td class="tg-7zrl">65.24</td>
-    <td class="tg-7zrl">31.06</td>
-    <td class="tg-7zrl">2.10x</td>
+    <td class="tg-zk71">ResNet50</td>
+    <td class="tg-7zrl">76.04%</td>
+    <td class="tg-7zrl">76.15%</td>
+    <td class="tg-7zrl">-0.14%</td>
+    <td class="tg-7zrl">490.64</td>
+    <td class="tg-7zrl">203.49</td>
+    <td class="tg-7zrl">2.41x</td>
+    <td class="tg-7zrl">eager</td>
   </tr>
 </tbody>
 </table>
 
-### PyTorch models along with ipex
+### PyTorch models with IPEX 1.11.0
 
 <table>
 <thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
+    <th rowspan="2">Model</th>
     <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
+    <th rowspan="2">Example</th>
   </tr>
   <tr>
     <th>INT8</th>
     <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
     <th>INT8</th>
     <th>FP32</th>
     <th>Performance Ratio[INT8/FP32]</th>
   </tr>
 </thead>
-<tbody>
-<tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnet50_ipex</td>
-    <td class="tg-7zrl">76.14%</td>
-    <td class="tg-7zrl">76.15%</td>
-    <td class="tg-7zrl">0.00%</td>
-    <td class="tg-7zrl">654.50</td>
-    <td class="tg-7zrl">202.31</td>
-    <td class="tg-7zrl">3.24x</td>
-  </tr>
-<tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">bert_large_ipex</td>
-    <td class="tg-7zrl">92.77</td>
-    <td class="tg-7zrl">93.16</td>
-    <td class="tg-7zrl">-0.41%</td>
-    <td class="tg-7zrl">29.74</td>
-    <td class="tg-7zrl">13.61</td>
-    <td class="tg-7zrl">2.18x</td>
-</tr>
-  <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">resnext101_32x16d_wsl_ipex</td>
+<tbody align="center">
+  <tr>
+    <td class="tg-za14">bert-large-uncased-whole-word-masking-finetuned-squad </td>
+    <td class="tg-za14">92.9</td>
+    <td class="tg-za14">93.16</td>
+    <td class="tg-za14">-0.28%</td>
+    <td class="tg-za14">37.13</td>
+    <td class="tg-za14">11.45</td>
+    <td class="tg-za14">3.24x</td>
+    <td class="tg-za14">ipex</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">ResNeXt101_32x16d_wsl</td>
     <td class="tg-7zrl">84.02%</td>
     <td class="tg-7zrl">84.17%</td>
     <td class="tg-7zrl">-0.18%</td>
-    <td class="tg-7zrl">157.78</td>
-    <td class="tg-7zrl">28.54</td>
-    <td class="tg-7zrl">5.53x</td>
+    <td class="tg-7zrl">163.45</td>
+    <td class="tg-7zrl">28.9</td>
+    <td class="tg-7zrl">5.66x</td>
+    <td class="tg-7zrl">ipex</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">ResNet50</td>
+    <td class="tg-7zrl">76.00%</td>
+    <td class="tg-7zrl">76.15%</td>
+    <td class="tg-7zrl">-0.20%</td>
+    <td class="tg-7zrl">707.86</td>
+    <td class="tg-7zrl">202.02</td>
+    <td class="tg-7zrl">3.51x</td>
+    <td class="tg-7zrl">ipex</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">pytorch</td>
-    <td class="tg-7zrl">1.10.0+cpu</td>
-    <td class="tg-7zrl">ssd_resnet34_ipex</td>
-    <td class="tg-7zrl">19.95%</td>
+    <td class="tg-7zrl">SSD ResNet34</td>
+    <td class="tg-7zrl">19.97%</td>
     <td class="tg-7zrl">20.00%</td>
-    <td class="tg-7zrl">-0.25%</td>
-    <td class="tg-7zrl">30.50</td>
-    <td class="tg-7zrl">8.50</td>
-    <td class="tg-7zrl">3.59x</td>
+    <td class="tg-7zrl">-0.15%</td>
+    <td class="tg-7zrl">30.84</td>
+    <td class="tg-7zrl">8.55</td>
+    <td class="tg-7zrl">3.61x</td>
+    <td class="tg-7zrl">ipex</td>
   </tr>
 </tbody>
 </table>
 
-
-### MXNet models
+### ONNX Models with ONNX Runtime 1.11.0
 
 <table>
 <thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
+    <th rowspan="2">Model</th>
     <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
+    <th rowspan="2">Example</th>
   </tr>
   <tr>
     <th>INT8</th>
     <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
     <th>INT8</th>
     <th>FP32</th>
     <th>Performance Ratio[INT8/FP32]</th>
   </tr>
 </thead>
-<tbody>
+<tbody align="center">
   <tr>
-    <td class="tg-7zrl">mxnet</td>
-    <td class="tg-7zrl">1.7.0</td>
-    <td class="tg-7zrl">inceptionv3</td>
-    <td class="tg-7zrl">77.80%</td>
-    <td class="tg-7zrl">77.65%</td>
-    <td class="tg-7zrl">0.20%</td>
-    <td class="tg-7zrl">918.73</td>
-    <td class="tg-7zrl">238.90</td>
-    <td class="tg-7zrl">3.85x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">mxnet</td>
-    <td class="tg-7zrl">1.7.0</td>
-    <td class="tg-7zrl">squeezenet1.0</td>
-    <td class="tg-7zrl">56.80%</td>
-    <td class="tg-7zrl">56.97%</td>
-    <td class="tg-7zrl">-0.28%</td>
-    <td class="tg-7zrl">4693.55</td>
-    <td class="tg-7zrl">1272.50</td>
-    <td class="tg-7zrl">3.69x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">mxnet</td>
-    <td class="tg-7zrl">1.7.0</td>
-    <td class="tg-7zrl">ssd-mobilenet1.0</td>
-    <td class="tg-7zrl">74.94%</td>
-    <td class="tg-7zrl">75.54%</td>
-    <td class="tg-7zrl">-0.79%</td>
-    <td class="tg-7zrl">771.65</td>
-    <td class="tg-7zrl">189.81</td>
-    <td class="tg-7zrl">4.07x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">mxnet</td>
-    <td class="tg-7zrl">1.7.0</td>
-    <td class="tg-7zrl">resnet152_v1</td>
-    <td class="tg-7zrl">78.28%</td>
-    <td class="tg-7zrl">78.54%</td>
-    <td class="tg-7zrl">-0.33%</td>
-    <td class="tg-7zrl">574.23</td>
-    <td class="tg-7zrl">126.78</td>
-    <td class="tg-7zrl">4.53x</td>
+    <td class="tg-iz6e">AlexNet</td>
+    <td class="tg-za14">54.74%</td>
+    <td class="tg-za14">54.79%</td>
+    <td class="tg-za14">-0.09%</td>
+    <td class="tg-za14">1518.97</td>
+    <td class="tg-za14">676.74</td>
+    <td class="tg-za14">2.24x</td>
+    <td class="tg-za14">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-zk71">AlexNet </td>
+    <td class="tg-7zrl">54.74%</td>
+    <td class="tg-7zrl">54.79%</td>
+    <td class="tg-7zrl">-0.09%</td>
+    <td class="tg-7zrl">1411.3</td>
+    <td class="tg-7zrl">652.6</td>
+    <td class="tg-7zrl">2.16x</td>
+    <td class="tg-7zrl">qdq</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">BERT base MRPC DYNAMIC</td>
+    <td class="tg-7zrl">85.54%</td>
+    <td class="tg-7zrl">86.03%</td>
+    <td class="tg-7zrl">-0.57%</td>
+    <td class="tg-7zrl">379.71</td>
+    <td class="tg-7zrl">156.16</td>
+    <td class="tg-7zrl">2.43x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-zk71">BERT base MRPC STATIC</td>
+    <td class="tg-7zrl">85.29%</td>
+    <td class="tg-7zrl">86.03%</td>
+    <td class="tg-7zrl">-0.86%</td>
+    <td class="tg-7zrl">756.33</td>
+    <td class="tg-7zrl">316.36</td>
+    <td class="tg-7zrl">2.39x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">BERT SQuAD</td>
+    <td class="tg-7zrl">80.44</td>
+    <td class="tg-7zrl">80.67</td>
+    <td class="tg-7zrl">-0.29%</td>
+    <td class="tg-7zrl">115.58</td>
+    <td class="tg-7zrl">64.71</td>
+    <td class="tg-7zrl">1.79x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">BERT SQuAD</td>
+    <td class="tg-7zrl">80.44</td>
+    <td class="tg-7zrl">80.67</td>
+    <td class="tg-7zrl">-0.29%</td>
+    <td class="tg-7zrl">115.4</td>
+    <td class="tg-7zrl">64.68</td>
+    <td class="tg-7zrl">1.78x</td>
+    <td class="tg-7zrl">qdq</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">CaffeNet</td>
+    <td class="tg-7zrl">56.19%</td>
+    <td class="tg-7zrl">56.30%</td>
+    <td class="tg-7zrl">-0.20%</td>
+    <td class="tg-7zrl">2786.79</td>
+    <td class="tg-7zrl">802.7</td>
+    <td class="tg-7zrl">3.47x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">CaffeNet</td>
+    <td class="tg-7zrl">56.19%</td>
+    <td class="tg-7zrl">56.30%</td>
+    <td class="tg-7zrl">-0.20%</td>
+    <td class="tg-7zrl">2726.86</td>
+    <td class="tg-7zrl">819.41</td>
+    <td class="tg-7zrl">3.33x</td>
+    <td class="tg-7zrl">qdq</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">DenseNet</td>
+    <td class="tg-7zrl">60.20%</td>
+    <td class="tg-7zrl">60.96%</td>
+    <td class="tg-7zrl">-1.25%</td>
+    <td class="tg-7zrl">404.83</td>
+    <td class="tg-7zrl">340.63</td>
+    <td class="tg-7zrl">1.19x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">DistilBERT base MRPC</td>
+    <td class="tg-7zrl">84.56%</td>
+    <td class="tg-7zrl">84.56%</td>
+    <td class="tg-7zrl">0.00%</td>
+    <td class="tg-7zrl">1630.41</td>
+    <td class="tg-7zrl">596.68</td>
+    <td class="tg-7zrl">2.73x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">EfficientNet</td>
+    <td class="tg-7zrl">77.58%</td>
+    <td class="tg-7zrl">77.70%</td>
+    <td class="tg-7zrl">-0.15%</td>
+    <td class="tg-7zrl">1985.35</td>
+    <td class="tg-7zrl">1097.33</td>
+    <td class="tg-7zrl">1.81x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">Faster R-CNN</td>
+    <td class="tg-7zrl">33.99%</td>
+    <td class="tg-7zrl">34.37%</td>
+    <td class="tg-7zrl">-1.11%</td>
+    <td class="tg-7zrl">10.02</td>
+    <td class="tg-7zrl">4.32</td>
+    <td class="tg-7zrl">2.32x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">Faster R-CNN</td>
+    <td class="tg-7zrl">33.94%</td>
+    <td class="tg-7zrl">34.37%</td>
+    <td class="tg-7zrl">-1.25%</td>
+    <td class="tg-7zrl">10.41</td>
+    <td class="tg-7zrl">4.28</td>
+    <td class="tg-7zrl">2.43x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
-</tbody>
-</table>
-
-
-### ONNX Models
-
-<table>
-<thead>
   <tr>
-    <th rowspan="2">Framework</th>
-    <th rowspan="2">version</th>
-    <th rowspan="2">model</th>
-    <th colspan="3">Accuracy</th>
-    <th colspan="3">Performance<br>1s4c10ins1bs/throughput<br>(samples/sec)<br></th>
+    <td class="tg-zk71">FCN</td>
+    <td class="tg-7zrl">64.66%</td>
+    <td class="tg-7zrl">64.98%</td>
+    <td class="tg-7zrl">-0.49%</td>
+    <td class="tg-7zrl">44.31</td>
+    <td class="tg-7zrl">14.2</td>
+    <td class="tg-7zrl">3.12x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <th>INT8</th>
-    <th>FP32</th>
-    <th>Acc Ratio[(INT8-FP32)/FP32]</th>
-    <th>INT8</th>
-    <th>FP32</th>
-    <th>Performance Ratio[INT8/FP32]</th>
+    <td class="tg-7zrl">FCN</td>
+    <td class="tg-7zrl">64.66%</td>
+    <td class="tg-7zrl">64.98%</td>
+    <td class="tg-7zrl">-0.49%</td>
+    <td class="tg-7zrl">18.11</td>
+    <td class="tg-7zrl">14.19</td>
+    <td class="tg-7zrl">1.28x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
-</thead>
-<tbody>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">alexnet</td>
-    <td class="tg-7zrl">54.74%</td>
-    <td class="tg-7zrl">54.79%</td>
-    <td class="tg-7zrl">-0.09%</td>
-    <td class="tg-7zrl">1505.75</td>
-    <td class="tg-7zrl">656.81</td>
-    <td class="tg-7zrl">2.29x</td>
+    <td class="tg-7zrl">GoogleNet</td>
+    <td class="tg-7zrl">67.61%</td>
+    <td class="tg-7zrl">67.79%</td>
+    <td class="tg-7zrl">-0.27%</td>
+    <td class="tg-7zrl">1165.84</td>
+    <td class="tg-7zrl">810.65</td>
+    <td class="tg-7zrl">1.44x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">zfnet</td>
-    <td class="tg-7zrl">55.89%</td>
-    <td class="tg-7zrl">55.96%</td>
-    <td class="tg-7zrl">-0.13%</td>
-    <td class="tg-7zrl">661.16</td>
-    <td class="tg-7zrl">353.20</td>
-    <td class="tg-7zrl">1.87x</td>
+    <td class="tg-zk71">GoogleNet</td>
+    <td class="tg-7zrl">67.61%</td>
+    <td class="tg-7zrl">67.79%</td>
+    <td class="tg-7zrl">-0.27%</td>
+    <td class="tg-7zrl">1165.73</td>
+    <td class="tg-7zrl">809.98</td>
+    <td class="tg-7zrl">1.44x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">efficientnet</td>
-    <td class="tg-7zrl">77.58%</td>
-    <td class="tg-7zrl">77.70%</td>
-    <td class="tg-7zrl">-0.15%</td>
-    <td class="tg-7zrl">2065.72</td>
-    <td class="tg-7zrl">1094.77</td>
-    <td class="tg-7zrl">1.89x</td>
+    <td class="tg-7zrl">Inception V1</td>
+    <td class="tg-7zrl">67.23%</td>
+    <td class="tg-7zrl">67.24%</td>
+    <td class="tg-7zrl">-0.01%</td>
+    <td class="tg-7zrl">1205.89</td>
+    <td class="tg-7zrl">838.71</td>
+    <td class="tg-7zrl">1.44x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">squeezenet_qdq</td>
-    <td class="tg-7zrl">56.55%</td>
-    <td class="tg-7zrl">56.87%</td>
-    <td class="tg-7zrl">-0.56%</td>
-    <td class="tg-7zrl">5965.78</td>
-    <td class="tg-7zrl">4300.12</td>
-    <td class="tg-7zrl">1.39x</td>
+    <td class="tg-zk71">Inception V1</td>
+    <td class="tg-7zrl">67.23%</td>
+    <td class="tg-7zrl">67.24%</td>
+    <td class="tg-7zrl">-0.01%</td>
+    <td class="tg-7zrl">1204.93</td>
+    <td class="tg-7zrl">843.16</td>
+    <td class="tg-7zrl">1.43x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd-12_qdq</td>
-    <td class="tg-7zrl">18.38%</td>
-    <td class="tg-7zrl">18.98%</td>
-    <td class="tg-7zrl">-3.16%</td>
-    <td class="tg-7zrl">42.24</td>
-    <td class="tg-7zrl">11.12</td>
-    <td class="tg-7zrl">3.80x</td>
+    <td class="tg-7zrl">Mask R-CNN</td>
+    <td class="tg-7zrl">33.40%</td>
+    <td class="tg-7zrl">33.72%</td>
+    <td class="tg-7zrl">-0.95%</td>
+    <td class="tg-7zrl">8.56</td>
+    <td class="tg-7zrl">3.76</td>
+    <td class="tg-7zrl">2.27x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">resnet50_v1_5</td>
-    <td class="tg-7zrl">72.28%</td>
-    <td class="tg-7zrl">72.29%</td>
-    <td class="tg-7zrl">-0.01%</td>
-    <td class="tg-7zrl">1166.31</td>
-    <td class="tg-7zrl">554.34</td>
-    <td class="tg-7zrl">2.10x</td>
+    <td class="tg-zk71">Mask R-CNN</td>
+    <td class="tg-7zrl">33.33%</td>
+    <td class="tg-7zrl">33.72%</td>
+    <td class="tg-7zrl">-1.16%</td>
+    <td class="tg-7zrl">8.4</td>
+    <td class="tg-7zrl">3.81</td>
+    <td class="tg-7zrl">2.20x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">bert_base_mrpc_static</td>
-    <td class="tg-7zrl">85.29%</td>
+    <td class="tg-zk71">Mobile bert MRPC</td>
     <td class="tg-7zrl">86.03%</td>
-    <td class="tg-7zrl">-0.86%</td>
-    <td class="tg-7zrl">766.46</td>
-    <td class="tg-7zrl">315.22</td>
-    <td class="tg-7zrl">2.43x</td>
+    <td class="tg-7zrl">86.27%</td>
+    <td class="tg-7zrl">-0.28%</td>
+    <td class="tg-7zrl">790.11</td>
+    <td class="tg-7zrl">686.35</td>
+    <td class="tg-7zrl">1.15x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">bert_base_mrpc_dynamic</td>
-    <td class="tg-7zrl">85.54%</td>
-    <td class="tg-7zrl">86.03%</td>
-    <td class="tg-7zrl">-0.57%</td>
-    <td class="tg-7zrl">381.30</td>
-    <td class="tg-7zrl">155.90</td>
-    <td class="tg-7zrl">2.45x</td>
+    <td class="tg-zk71">MobileBERT SQuAD MLPerf</td>
+    <td class="tg-7zrl">89.84</td>
+    <td class="tg-7zrl">90.03</td>
+    <td class="tg-7zrl">-0.20%</td>
+    <td class="tg-7zrl">102.92</td>
+    <td class="tg-7zrl">95.19</td>
+    <td class="tg-7zrl">1.08x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilenet_v2</td>
+    <td class="tg-zk71">MobileNet V2</td>
     <td class="tg-7zrl">65.47%</td>
     <td class="tg-7zrl">66.89%</td>
     <td class="tg-7zrl">-2.12%</td>
-    <td class="tg-7zrl">5128.93</td>
-    <td class="tg-7zrl">3390.19</td>
+    <td class="tg-7zrl">5133.84</td>
+    <td class="tg-7zrl">3394.73</td>
     <td class="tg-7zrl">1.51x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v1</td>
-    <td class="tg-7zrl">22.20%</td>
-    <td class="tg-7zrl">23.10%</td>
-    <td class="tg-7zrl">-3.90%</td>
-    <td class="tg-7zrl">914.92</td>
-    <td class="tg-7zrl">703.74</td>
-    <td class="tg-7zrl">1.30x</td>
+    <td class="tg-zk71">MobileNet V2</td>
+    <td class="tg-7zrl">65.47%</td>
+    <td class="tg-7zrl">66.89%</td>
+    <td class="tg-7zrl">-2.12%</td>
+    <td class="tg-7zrl">5066.31</td>
+    <td class="tg-7zrl">3386.3</td>
+    <td class="tg-7zrl">1.50x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v2</td>
-    <td class="tg-7zrl">23.83%</td>
-    <td class="tg-7zrl">24.68%</td>
-    <td class="tg-7zrl">-3.44%</td>
-    <td class="tg-7zrl">718.28</td>
-    <td class="tg-7zrl">501.31</td>
-    <td class="tg-7zrl">1.43x</td>
+    <td class="tg-zk71">MobileNet V3 MLPerf</td>
+    <td class="tg-7zrl">75.59%</td>
+    <td class="tg-7zrl">75.74%</td>
+    <td class="tg-7zrl">-0.20%</td>
+    <td class="tg-7zrl">4133.22</td>
+    <td class="tg-7zrl">2132.92</td>
+    <td class="tg-7zrl">1.94x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">distilbert_base_mrpc</td>
-    <td class="tg-7zrl">84.56%</td>
-    <td class="tg-7zrl">84.56%</td>
-    <td class="tg-7zrl">0.00%</td>
-    <td class="tg-7zrl">1675.94</td>
-    <td class="tg-7zrl">594.27</td>
-    <td class="tg-7zrl">2.82x</td>
+    <td class="tg-zk71">MobileNetV2 (ONNX Model Zoo)</td>
+    <td class="tg-7zrl">68.30%</td>
+    <td class="tg-7zrl">69.48%</td>
+    <td class="tg-7zrl">-1.70%</td>
+    <td class="tg-7zrl">5349.42</td>
+    <td class="tg-7zrl">3373.29</td>
+    <td class="tg-7zrl">1.59x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilebert_mrpc</td>
-    <td class="tg-7zrl">85.54%</td>
-    <td class="tg-7zrl">86.27%</td>
-    <td class="tg-7zrl">-0.85%</td>
-    <td class="tg-7zrl">766.00</td>
-    <td class="tg-7zrl">684.30</td>
-    <td class="tg-7zrl">1.12x</td>
+    <td class="tg-zk71">ResNet50 V1.5 MLPerf</td>
+    <td class="tg-7zrl">76.13%</td>
+    <td class="tg-7zrl">76.46%</td>
+    <td class="tg-7zrl">-0.43%</td>
+    <td class="tg-7zrl">1139.56</td>
+    <td class="tg-7zrl">549.88</td>
+    <td class="tg-7zrl">2.07x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">resnet50-v1-12</td>
+    <td class="tg-zk71">ResNet50 V1.5</td>
+    <td class="tg-7zrl">72.28%</td>
+    <td class="tg-7zrl">72.29%</td>
+    <td class="tg-7zrl">-0.01%</td>
+    <td class="tg-7zrl">1165.35</td>
+    <td class="tg-7zrl">556.02</td>
+    <td class="tg-7zrl">2.10x</td>
+    <td class="tg-7zrl">qlinearops</td>
+  </tr>
+  <tr>
+    <td class="tg-zk71">ResNet50 V1.5</td>
+    <td class="tg-7zrl">72.28%</td>
+    <td class="tg-7zrl">72.29%</td>
+    <td class="tg-7zrl">-0.01%</td>
+    <td class="tg-7zrl">1319.32</td>
+    <td class="tg-7zrl">543.44</td>
+    <td class="tg-7zrl">2.43x</td>
+    <td class="tg-7zrl">qdq</td>
+  </tr>
+  <tr>
+    <td class="tg-7zrl">ResNet50 V1.5 (ONNX Model Zoo)</td>
     <td class="tg-7zrl">74.76%</td>
     <td class="tg-7zrl">74.99%</td>
     <td class="tg-7zrl">-0.31%</td>
-    <td class="tg-7zrl">1380.38</td>
-    <td class="tg-7zrl">581.36</td>
-    <td class="tg-7zrl">2.37x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">resnet_v1_5_mlperf</td>
-    <td class="tg-7zrl">76.13%</td>
-    <td class="tg-7zrl">76.46%</td>
-    <td class="tg-7zrl">-0.43%</td>
-    <td class="tg-7zrl">1143.13</td>
-    <td class="tg-7zrl">550.77</td>
-    <td class="tg-7zrl">2.08x</td>
+    <td class="tg-7zrl">1363.39</td>
+    <td class="tg-7zrl">573.1</td>
+    <td class="tg-7zrl">2.38x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilenet_v3_mlperf</td>
-    <td class="tg-7zrl">75.59%</td>
-    <td class="tg-7zrl">75.74%</td>
-    <td class="tg-7zrl">-0.20%</td>
-    <td class="tg-7zrl">4121.33</td>
-    <td class="tg-7zrl">2135.31</td>
-    <td class="tg-7zrl">1.93x</td>
+    <td class="tg-7zrl">Roberta Base MRPC</td>
+    <td class="tg-7zrl">90.44%</td>
+    <td class="tg-7zrl">89.95%</td>
+    <td class="tg-7zrl">0.54%</td>
+    <td class="tg-7zrl">811.05</td>
+    <td class="tg-7zrl">312.71</td>
+    <td class="tg-7zrl">2.59x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">shufflenet-v2-12</td>
+    <td class="tg-zk71">ShuffleNet V2</td>
     <td class="tg-7zrl">66.13%</td>
     <td class="tg-7zrl">66.36%</td>
     <td class="tg-7zrl">-0.35%</td>
-    <td class="tg-7zrl">4901.74</td>
-    <td class="tg-7zrl">2853.37</td>
-    <td class="tg-7zrl">1.72x</td>
+    <td class="tg-7zrl">4948.77</td>
+    <td class="tg-7zrl">2847.66</td>
+    <td class="tg-7zrl">1.74x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">googlenet-12</td>
-    <td class="tg-7zrl">67.61%</td>
-    <td class="tg-7zrl">67.79%</td>
-    <td class="tg-7zrl">-0.27%</td>
-    <td class="tg-7zrl">1030.75</td>
-    <td class="tg-7zrl">805.76</td>
-    <td class="tg-7zrl">1.28x</td>
+    <td class="tg-7zrl">SqueezeNet</td>
+    <td class="tg-7zrl">56.55%</td>
+    <td class="tg-7zrl">56.87%</td>
+    <td class="tg-7zrl">-0.56%</td>
+    <td class="tg-7zrl">6296.79</td>
+    <td class="tg-7zrl">4340.51</td>
+    <td class="tg-7zrl">1.45x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">squeezenet</td>
+    <td class="tg-7zrl">SqueezeNet</td>
     <td class="tg-7zrl">56.55%</td>
     <td class="tg-7zrl">56.87%</td>
     <td class="tg-7zrl">-0.56%</td>
-    <td class="tg-7zrl">6119.01</td>
-    <td class="tg-7zrl">4321.71</td>
+    <td class="tg-7zrl">6227.76</td>
+    <td class="tg-7zrl">4383.8</td>
     <td class="tg-7zrl">1.42x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">caffenet</td>
-    <td class="tg-7zrl">56.19%</td>
-    <td class="tg-7zrl">56.30%</td>
-    <td class="tg-7zrl">-0.20%</td>
-    <td class="tg-7zrl">2644.16</td>
-    <td class="tg-7zrl">810.13</td>
-    <td class="tg-7zrl">3.26x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">inception_v1</td>
-    <td class="tg-7zrl">67.23%</td>
-    <td class="tg-7zrl">67.24%</td>
-    <td class="tg-7zrl">-0.01%</td>
-    <td class="tg-7zrl">1059.31</td>
-    <td class="tg-7zrl">848.19</td>
-    <td class="tg-7zrl">1.25x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">fcn</td>
-    <td class="tg-7zrl">64.66%</td>
-    <td class="tg-7zrl">64.98%</td>
-    <td class="tg-7zrl">-0.49%</td>
-    <td class="tg-7zrl">44.48</td>
-    <td class="tg-7zrl">14.23</td>
-    <td class="tg-7zrl">3.13x</td>
+    <td class="tg-7zrl">SSD MobileNet V1</td>
+    <td class="tg-7zrl">22.20%</td>
+    <td class="tg-7zrl">23.10%</td>
+    <td class="tg-7zrl">-3.90%</td>
+    <td class="tg-7zrl">917.64</td>
+    <td class="tg-7zrl">709.48</td>
+    <td class="tg-7zrl">1.29x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd-12</td>
-    <td class="tg-7zrl">18.84%</td>
-    <td class="tg-7zrl">18.98%</td>
-    <td class="tg-7zrl">-0.74%</td>
-    <td class="tg-7zrl">41.98</td>
-    <td class="tg-7zrl">11.11</td>
-    <td class="tg-7zrl">3.78x</td>
+    <td class="tg-7zrl">SSD MobileNet V1</td>
+    <td class="tg-7zrl">22.20%</td>
+    <td class="tg-7zrl">23.10%</td>
+    <td class="tg-7zrl">-3.90%</td>
+    <td class="tg-7zrl">840.99</td>
+    <td class="tg-7zrl">655.99</td>
+    <td class="tg-7zrl">1.28x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v1-2</td>
+    <td class="tg-7zrl">SSD MobileNet V1 (ONNX Model Zoo)</td>
     <td class="tg-7zrl">22.88%</td>
     <td class="tg-7zrl">23.03%</td>
     <td class="tg-7zrl">-0.65%</td>
-    <td class="tg-7zrl">836.01</td>
-    <td class="tg-7zrl">652.27</td>
-    <td class="tg-7zrl">1.28x</td>
-  </tr>
-  <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">faster_rcnn</td>
-    <td class="tg-7zrl">33.99%</td>
-    <td class="tg-7zrl">34.37%</td>
-    <td class="tg-7zrl">-1.11%</td>
-    <td class="tg-7zrl">9.23</td>
-    <td class="tg-7zrl">4.28</td>
-    <td class="tg-7zrl">2.16x</td>
+    <td class="tg-7zrl">845.17</td>
+    <td class="tg-7zrl">666.25</td>
+    <td class="tg-7zrl">1.27x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilenetv2-12</td>
-    <td class="tg-7zrl">68.30%</td>
-    <td class="tg-7zrl">69.48%</td>
-    <td class="tg-7zrl">-1.70%</td>
-    <td class="tg-7zrl">5314.59</td>
-    <td class="tg-7zrl">3369.52</td>
-    <td class="tg-7zrl">1.58x</td>
+    <td class="tg-7zrl">SSD MobileNet V1 (ONNX Model Zoo)</td>
+    <td class="tg-7zrl">22.88%</td>
+    <td class="tg-7zrl">23.03%</td>
+    <td class="tg-7zrl">-0.65%</td>
+    <td class="tg-7zrl">790.06</td>
+    <td class="tg-7zrl">624.2</td>
+    <td class="tg-7zrl">1.27x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mask_rcnn</td>
-    <td class="tg-7zrl">33.40%</td>
-    <td class="tg-7zrl">33.72%</td>
-    <td class="tg-7zrl">-0.95%</td>
-    <td class="tg-7zrl">7.88</td>
-    <td class="tg-7zrl">3.94</td>
-    <td class="tg-7zrl">2.00x</td>
+    <td class="tg-7zrl">SSD MobileNet V2</td>
+    <td class="tg-7zrl">23.83%</td>
+    <td class="tg-7zrl">24.68%</td>
+    <td class="tg-7zrl">-3.44%</td>
+    <td class="tg-7zrl">703.55</td>
+    <td class="tg-7zrl">506.6</td>
+    <td class="tg-7zrl">1.39x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">yolov3</td>
-    <td class="tg-7zrl">26.88%</td>
-    <td class="tg-7zrl">28.74%</td>
-    <td class="tg-7zrl">-6.47%</td>
-    <td class="tg-7zrl">157.85</td>
-    <td class="tg-7zrl">64.93</td>
-    <td class="tg-7zrl">2.43x</td>
+    <td class="tg-7zrl">SSD</td>
+    <td class="tg-7zrl">18.68%</td>
+    <td class="tg-7zrl">18.98%</td>
+    <td class="tg-7zrl">-1.58%</td>
+    <td class="tg-7zrl">41.99</td>
+    <td class="tg-7zrl">11.12</td>
+    <td class="tg-7zrl">3.78x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">densenet</td>
-    <td class="tg-7zrl">60.20%</td>
-    <td class="tg-7zrl">60.96%</td>
-    <td class="tg-7zrl">-1.25%</td>
-    <td class="tg-7zrl">408.55</td>
-    <td class="tg-7zrl">340.82</td>
-    <td class="tg-7zrl">1.20x</td>
+    <td class="tg-7zrl">Tiny YOLOv3</td>
+    <td class="tg-7zrl">12.08%</td>
+    <td class="tg-7zrl">12.43%</td>
+    <td class="tg-7zrl">-2.82%</td>
+    <td class="tg-7zrl">836.21</td>
+    <td class="tg-7zrl">659.69</td>
+    <td class="tg-7zrl">1.27x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">yolov4</td>
-    <td class="tg-7zrl">30.95%</td>
-    <td class="tg-7zrl">32.78%</td>
-    <td class="tg-7zrl">-5.58%</td>
-    <td class="tg-7zrl">53.51</td>
-    <td class="tg-7zrl">28.66</td>
-    <td class="tg-7zrl">1.87x</td>
+    <td class="tg-7zrl">VGG16</td>
+    <td class="tg-7zrl">66.60%</td>
+    <td class="tg-7zrl">66.69%</td>
+    <td class="tg-7zrl">-0.13%</td>
+    <td class="tg-7zrl">312.48</td>
+    <td class="tg-7zrl">128.98</td>
+    <td class="tg-7zrl">2.42x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">resnet50_v1_5_qdq</td>
+    <td class="tg-7zrl">VGG16 (ONNX Model Zoo)</td>
     <td class="tg-7zrl">72.28%</td>
-    <td class="tg-7zrl">72.29%</td>
-    <td class="tg-7zrl">-0.01%</td>
-    <td class="tg-7zrl">1271.61</td>
-    <td class="tg-7zrl">543.58</td>
-    <td class="tg-7zrl">2.34x</td>
+    <td class="tg-7zrl">72.40%</td>
+    <td class="tg-7zrl">-0.17%</td>
+    <td class="tg-7zrl">446.13</td>
+    <td class="tg-7zrl">131.04</td>
+    <td class="tg-7zrl">3.40x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilenet_v2_qdq</td>
-    <td class="tg-7zrl">65.47%</td>
-    <td class="tg-7zrl">66.89%</td>
-    <td class="tg-7zrl">-2.12%</td>
-    <td class="tg-7zrl">5069.54</td>
-    <td class="tg-7zrl">3404.88</td>
-    <td class="tg-7zrl">1.49x</td>
+    <td class="tg-7zrl">YOLOv3</td>
+    <td class="tg-7zrl">26.88%</td>
+    <td class="tg-7zrl">28.74%</td>
+    <td class="tg-7zrl">-6.47%</td>
+    <td class="tg-7zrl">157.39</td>
+    <td class="tg-7zrl">66.72</td>
+    <td class="tg-7zrl">2.36x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">ssd_mobilenet_v1_qdq</td>
-    <td class="tg-7zrl">22.25%</td>
-    <td class="tg-7zrl">23.10%</td>
-    <td class="tg-7zrl">-3.68%</td>
-    <td class="tg-7zrl">803.63</td>
-    <td class="tg-7zrl">644.18</td>
-    <td class="tg-7zrl">1.25x</td>
+    <td class="tg-7zrl">YOLOv4</td>
+    <td class="tg-7zrl">33.18%</td>
+    <td class="tg-7zrl">33.71%</td>
+    <td class="tg-7zrl">-1.57%</td>
+    <td class="tg-7zrl">58.55</td>
+    <td class="tg-7zrl">38.09</td>
+    <td class="tg-7zrl">1.54x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">vgg16</td>
-    <td class="tg-7zrl">66.60%</td>
-    <td class="tg-7zrl">66.69%</td>
+    <td class="tg-7zrl">ZFNet</td>
+    <td class="tg-7zrl">55.89%</td>
+    <td class="tg-7zrl">55.96%</td>
     <td class="tg-7zrl">-0.13%</td>
-    <td class="tg-7zrl">310.23</td>
-    <td class="tg-7zrl">128.81</td>
-    <td class="tg-7zrl">2.41x</td>
+    <td class="tg-7zrl">664.37</td>
+    <td class="tg-7zrl">358.62</td>
+    <td class="tg-7zrl">1.85x</td>
+    <td class="tg-7zrl">qlinearops</td>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">roberta_base_mrpc</td>
-    <td class="tg-7zrl">89.22%</td>
-    <td class="tg-7zrl">89.95%</td>
-    <td class="tg-7zrl">-0.81%</td>
-    <td class="tg-7zrl">766.66</td>
-    <td class="tg-7zrl">316.24</td>
-    <td class="tg-7zrl">2.42x</td>
+    <td class="tg-7zrl">ZFNet</td>
+    <td class="tg-7zrl">55.89%</td>
+    <td class="tg-7zrl">55.96%</td>
+    <td class="tg-7zrl">-0.13%</td>
+    <td class="tg-7zrl">666.99</td>
+    <td class="tg-7zrl">354.38</td>
+    <td class="tg-7zrl">1.88x</td>
+    <td class="tg-7zrl">qdq</td>
   </tr>
+</tbody>
+</table>
+
+### MXNet models with MXNet 1.7.0
+
+<table>
+<thead>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">bert_squad_model_zoo</td>
-    <td class="tg-7zrl">80.43</td>
-    <td class="tg-7zrl">80.67</td>
-    <td class="tg-7zrl">-0.29%</td>
-    <td class="tg-7zrl">115.78</td>
-    <td class="tg-7zrl">64.69</td>
-    <td class="tg-7zrl">1.79x</td>
+    <th rowspan="2">Model</th>
+    <th colspan="3">Accuracy</th>
+    <th colspan="3">Performance<br>throughput (samples/sec)<br></th>
   </tr>
   <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">mobilebert_squad_mlperf</td>
-    <td class="tg-7zrl">89.84</td>
-    <td class="tg-7zrl">90.02</td>
-    <td class="tg-7zrl">-0.20%</td>
-    <td class="tg-7zrl">102.82</td>
-    <td class="tg-7zrl">95.17</td>
-    <td class="tg-7zrl">1.08x</td>
+    <th>INT8</th>
+    <th>FP32</th>
+    <th>Accuracy Ratio[(INT8-FP32)/FP32]</th>
+    <th>INT8</th>
+    <th>FP32</th>
+    <th>Performance Ratio[INT8/FP32]</th>
   </tr>
-  <tr>
-    <td class="tg-7zrl">onnxrt-runtime</td>
-    <td class="tg-7zrl">1.10.0</td>
-    <td class="tg-7zrl">vgg16_model_zoo</td>
-    <td class="tg-7zrl">72.28%</td>
-    <td class="tg-7zrl">72.40%</td>
-    <td class="tg-7zrl">-0.17%</td>
-    <td class="tg-7zrl">447.28</td>
-    <td class="tg-7zrl">129.59</td>
-    <td class="tg-7zrl">3.45x</td>
+</thead>
+<tbody align="center">
+  <tr>
+    <td class="tg-za14">Inception V3</td>
+    <td class="tg-za14">77.80%</td>
+    <td class="tg-za14">77.65%</td>
+    <td class="tg-za14">0.20%</td>
+    <td class="tg-za14">920.74</td>
+    <td class="tg-za14">276.73</td>
+    <td class="tg-za14">3.33x</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">MobileNet V1</td>
+    <td class="tg-za14">71.60%</td>
+    <td class="tg-za14">72.23%</td>
+    <td class="tg-za14">-0.86%</td>
+    <td class="tg-za14">6585.19</td>
+    <td class="tg-za14">2529.21</td>
+    <td class="tg-za14">2.60x</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">MobileNet V2</td>
+    <td class="tg-za14">70.80%</td>
+    <td class="tg-za14">70.87%</td>
+    <td class="tg-za14">-0.10%</td>
+    <td class="tg-za14">5230.32</td>
+    <td class="tg-za14">1996.47</td>
+    <td class="tg-za14">2.62x</td>
+  </tr>
+  <tr>
+    <td class="tg-6oje">ResNet V1 152</td>
+    <td class="tg-za14">78.28%</td>
+    <td class="tg-za14">78.54%</td>
+    <td class="tg-za14">-0.33%</td>
+    <td class="tg-za14">574.85</td>
+    <td class="tg-za14">156.2</td>
+    <td class="tg-za14">3.68x</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">ResNet50 V1.0</td>
+    <td class="tg-za14">75.91%</td>
+    <td class="tg-za14">76.33%</td>
+    <td class="tg-za14">-0.55%</td>
+    <td class="tg-za14">1567.9</td>
+    <td class="tg-za14">427.99</td>
+    <td class="tg-za14">3.66x</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">SqueezeNet</td>
+    <td class="tg-za14">56.80%</td>
+    <td class="tg-za14">56.97%</td>
+    <td class="tg-za14">-0.28%</td>
+    <td class="tg-za14">4704.51</td>
+    <td class="tg-za14">1332.29</td>
+    <td class="tg-za14">3.53x</td>
+  </tr>
+  <tr>
+    <td class="tg-za14">SSD MobileNet V1</td>
+    <td class="tg-za14">74.94%</td>
+    <td class="tg-za14">75.54%</td>
+    <td class="tg-za14">-0.79%</td>
+    <td class="tg-za14">769.26</td>
+    <td class="tg-za14">193.03</td>
+    <td class="tg-za14">3.99x</td>
   </tr>
 </tbody>
 </table>
 
-### BACKUP
-<table>
-<tr><th>System Configuration</th><th>Intel Xeon Platinum 8380 Scalable processor</th></tr>
-<tr>
-<td>Test Date</td>
-<td>Sat 30 Apr 2022 UTC</td>
-</tr><tr>
-<td>Manufacturer</td>
-<td>Intel Corporation</td>
-</tr><tr>
-<td>Product Name</td>
-<td>M50CYP2SBSTD</td>
-</tr><tr>
-<td>BIOS Version</td>
-<td>SE5C6200.86B.0022.D64.2105220049</td>
-</tr><tr>
-<td>OS</td>
-<td>Ubuntu 20.04.1 LTS</td>
-</tr><tr>
-<td>Kernel</td>
-<td>5.4.0-42-generic</td>
-</tr><tr>
-<td>Microcode</td>
-<td>0xd0002b1</td>
-</tr><tr>
-<td>CPU Model</td>
-<td>Intel(R) Xeon(R) Platinum 8380 CPU @ 2.30GHz</td>
-</tr><tr>
-<td>Base Frequency</td>
-<td>2.3GHZ</td>
-</tr><tr>
-<td>Thread(s) per Core</td>
-<td>2</td>
-</tr><tr>
-<td>Core(s) per Socket</td>
-<td>40</td>
-</tr><tr>
-<td>Socket(s)</td>
-<td>2</td>
-</tr><tr>
-<td>Turbo</td>
-<td>Enabled</td>
-</tr><tr>
-<td>Power & Perf Policy</td>
-<td>Balanced</td>
-</tr><tr>
-<td>Installed</td>
-<td>256GB (16x16GB DDR4 3200MT/s [3200MT/s])</td>
-</tr><tr>
-<td>NIC Summary</td>
-<td>2x Ethernet Controller 10G X550T</td>
-</tr><tr>
-<td>Drive Summary</td>
-<td>1x INTEL_SSDSC2KW01 953.9G,
-1x CT1000MX500SSD1  931.5G,
-1x CT1000MX500SSD1  931.5G
-</td>
-</tr><tr>
-</table>
-
-## Validated Pruning Models
+## Validated Pruning Examples
 <table class="docutils">
 <thead>
   <tr>
     <th rowspan="2">Tasks</th>
-    <th rowspan="2">FWK</th>
+    <th rowspan="2">Framework</th>
     <th rowspan="2">Model</th>
-    <th rowspan="2">fp32 baseline</th>
-    <th colspan="3">gradient sensitivity with 20% sparsity</th>
-    <th colspan="3">+onnx dynamic quantization on pruned model</th>
+    <th rowspan="2">FP32 Baseline</th>
+    <th colspan="3">Gradient Sensitivity with 20% Sparsity</th>
+    <th colspan="3">+ONNX Dynamic Quantization on Pruned Model</th>
   </tr>
   <tr>
-    <td>accuracy%</td>
-    <td> drop%</td>
-    <td>perf gain (sample/s)</td>
-    <td>accuracy%</td>
-    <td> drop%</td>
-    <td>perf gain (sample/s)</td>
+    <td>Accuracy%</td>
+    <td>Drop</td>
+    <td>Perf Gain (sample/s)</td>
+    <td>Accuracy%</td>
+    <td>Drop</td>
+    <td>Perf Gain (sample/s)</td>
   </tr>
 </thead>
 <tbody>
   <tr>
     <td>SST-2</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>accuracy = 92.32</td>
     <td>accuracy = 91.97</td>
     <td>-0.38</td>
@@ -1715,8 +1520,8 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
   <tr>
     <td>QQP</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>[accuracy, f1] = [91.10, 88.05]</td>
     <td>[accuracy, f1] = [89.97, 86.54]</td>
     <td>[-1.24, -1.71]</td>
@@ -1732,24 +1537,24 @@ Intel technologies may require enabled hardware, software or service activation.
 <thead>
   <tr>
     <th rowspan="2">Tasks</th>
-    <th rowspan="2">FWK</th>
+    <th rowspan="2">Framework</th>
     <th rowspan="2">Model</th>
-    <th rowspan="2">fp32 baseline</th>
+    <th rowspan="2">FP32 Baseline</th>
     <th colspan="2">Pattern Lock on 70% Unstructured Sparsity</th>
     <th colspan="2">Pattern Lock on 50% 1:2 Structured Sparsity</th>
   </tr>
   <tr>
-    <td>accuracy%</td>
-    <td> drop%</td>
-    <td>accuracy%</td>
-    <td> drop%</td>
+    <td>Accuracy%</td>
+    <td>Drop</td>
+    <td>Accuracy%</td>
+    <td>Drop</td>
   </tr>
 </thead>
 <tbody>
   <tr>
     <td>MNLI</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>[m, mm] = [84.57, 84.79]</td>
     <td>[m, mm] = [82.45, 83.27]</td>
     <td>[-2.51, -1.80]</td>
@@ -1758,8 +1563,8 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
   <tr>
     <td>SST-2</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>accuracy = 92.32</td>
     <td>accuracy = 91.51</td>
     <td>-0.88</td>
@@ -1768,8 +1573,8 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
   <tr>
     <td>QQP</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>[accuracy, f1] = [91.10, 88.05]</td>
     <td>[accuracy, f1] = [90.48, 87.06]</td>
     <td>[-0.68, -1.12]</td>
@@ -1778,8 +1583,8 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
   <tr>
     <td>QNLI</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>accuracy = 91.54</td>
     <td>accuracy = 90.39</td>
     <td>-1.26</td>
@@ -1788,8 +1593,8 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
   <tr>
     <td>QnA</td>
-    <td>pytorch</td>
-    <td>bert-base</td>
+    <td>PyTorch</td>
+    <td>BERT base</td>
     <td>[em, f1] = [79.34, 87.10]</td>
     <td>[em, f1] = [77.27, 85.75]</td>
     <td>[-2.61, -1.54]</td>
@@ -1804,50 +1609,50 @@ Intel technologies may require enabled hardware, software or service activation.
   <tr>
     <th>Framework</th>
     <th>Model</th>
-    <th>fp32 baseline</th>
+    <th>FP32 Baseline</th>
     <th>Compression</th>
-    <th>dataset</th>
-    <th>acc(drop)%</th>
+    <th>Dataset</th>
+    <th>Accuracy% (Drop)</th>
   </tr>
 </thead>
 <tbody>
   <tr>
-    <td>Pytorch</td>
-    <td>resnet18</td>
+    <td>PyTorch</td>
+    <td>ResNet18</td>
     <td>69.76</td>
-    <td>30% sparsity on magnitude</td>
+    <td>30% Sparsity on Magnitude</td>
     <td>ImageNet</td>
     <td>69.47(-0.42)</td>
   </tr>
   <tr>
-    <td>Pytorch</td>
-    <td>resnet18</td>
+    <td>PyTorch</td>
+    <td>ResNet18</td>
     <td>69.76</td>
-    <td>30% sparsity on gradient sensitivity</td>
+    <td>30% Sparsity on Gradient Sensitivity</td>
     <td>ImageNet</td>
     <td>68.85(-1.30)</td>
   </tr>
   <tr>
-    <td>Pytorch</td>
-    <td>resnet50</td>
+    <td>PyTorch</td>
+    <td>ResNet50</td>
     <td>76.13</td>
-    <td>30% sparsity on magnitude</td>
+    <td>30% Sparsity on Magnitude</td>
     <td>ImageNet</td>
     <td>76.11(-0.03)</td>
   </tr>
   <tr>
-    <td>Pytorch</td>
-    <td>resnet50</td>
+    <td>PyTorch</td>
+    <td>ResNet50</td>
     <td>76.13</td>
-    <td>30% sparsity on magnitude and post training quantization</td>
+    <td>30% Sparsity on Magnitude and Post Training Quantization</td>
     <td>ImageNet</td>
     <td>76.01(-0.16)</td>
   </tr>
   <tr>
-    <td>Pytorch</td>
-    <td>resnet50</td>
+    <td>PyTorch</td>
+    <td>ResNet50</td>
     <td>76.13</td>
-    <td>30% sparsity on magnitude and quantization aware training</td>
+    <td>30% Sparsity on Magnitude and Quantization Aware Training</td>
     <td>ImageNet</td>
     <td>75.90(-0.30)</td>
   </tr>
@@ -1878,9 +1683,9 @@ Intel technologies may require enabled hardware, software or service activation.
   <tr>
   </tr>
   <tr>
-    <td rowspan="2">BlendCnn example</td>
+    <td rowspan="2">BlendCNN example</td>
     <td rowspan="2">MRPC</td>
-    <td rowspan="2">BlendCnn<br>(0.7034)</td>
+    <td rowspan="2">BlendCNN<br>(0.7034)</td>
     <td rowspan="2">BERT-Base<br>(0.8382)</td>
     <td rowspan="2">0.7034<br>(0)</td>
   </tr>
@@ -1897,3 +1702,5 @@ Intel technologies may require enabled hardware, software or service activation.
   </tr>
 </tbody>
 </table>
+
+
diff --git a/examples/README.md b/examples/README.md
new file mode 100644
index 00000000000..1f39b9731a4
--- /dev/null
+++ b/examples/README.md
@@ -0,0 +1,883 @@
+Examples 
+===
+Intel® Neural Compressor validated examples with multiple compression techniques, including quantization, pruning, knowledge distillation and orchestration. Part of the validated cases can be found in the example tables, and the release data is available [here](../docs/validated_model_list.md).
+
+# TensorFlow Examples
+## Quantization
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Approach</th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>ResNet50 V1.0</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50 V1.5</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>ResNet101</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V1</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/image_recognition/SavedModel/quantization/ptq">SavedModel</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a>  / <a href="./tensorflow/image_recognition/SavedModel/quantization/ptq">SavedModel</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V3</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Inception V1</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Inception V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Inception V3</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Inception V4</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Inception ResNet V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>VGG16</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/image_recognition/keras_models/vgg16/quantization/ptq">keras</a></td>
+  </tr>
+  <tr>
+    <td>VGG19</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/image_recognition/keras_models/vgg19/quantization/ptq">keras</a></td>
+  </tr>
+  <tr>
+    <td>ResNet V2 50</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>ResNet V2 101</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>ResNet V2 152</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>DenseNet121</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>DenseNet161</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>DenseNet169</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>EfficientNet B0</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/quantization/ptq">ckpt</a></td>
+  </tr>
+  <tr>
+    <td>MNIST </td>
+    <td>Image Recognition</td>
+    <td>Quantization-Aware Training</td>
+    <td><a href="./tensorflow/image_recognition/keras_models/mnist/quantization/qat">keras</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/keras_models/resnet50/quantization/ptq">keras</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50 Fashion</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/keras_models/resnet50_fashion/quantization/ptq">keras</a></td>
+  </tr>
+  <tr>
+    <td>ResNet V2</td>
+    <td>Image Recognition</td>
+    <td>Quantization-Aware Training</td>
+    <td><a href="./tensorflow/image_recognition/resnet_v2/quantization/qat">keras</a> </td>
+  </tr>
+  <tr>
+    <td>EfficientNet V2 B0</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/image_recognition/SavedModel/quantization/ptq">SavedModel</a></td>
+  </tr>
+  <tr>
+    <td>BERT base MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/Natural Language Processing/bert_base_mrpc/quantization/ptq">ckpt</a></td>
+  </tr>
+  <tr>
+    <td>BERT large SQuAD</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/Natural Language Processing/bert_large_squad/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Transformer LT</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/nlp/transformer_lt/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>SSD ResNet50 V1</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">ckpt</a></td>
+  </tr>
+  <tr>
+    <td>SSD MobileNet V1</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">ckpt</a></td>
+  </tr>
+  <tr>
+    <td>Faster R-CNN Inception ResNet V2</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">SavedModel</a></td>
+  </tr>
+  <tr>
+    <td>Faster R-CNN ResNet101</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">SavedModel</a></td>
+  </tr>
+  <tr>
+    <td>Mask R-CNN Inception V2</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a> / <a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">ckpt</a></td>
+  </tr>
+  <tr>
+    <td>SSD ResNet34</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/tensorflow_models/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>YOLOv3</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/object_detection/yolo_v3/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Wide & Deep</td>
+    <td>Recommendation</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/recommendation/wide_deep_large_ds/quantization/ptq">pb</a></td>
+  </tr>
+  <tr>
+    <td>Arbitrary Style Transfer</td>
+    <td>Style Transfer</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./tensorflow/style_transfer/arbitrary_style_transfer/quantization/ptq">ckpt</a></td>
+  </tr>
+</tbody>
+</table>
+
+## Pruning 
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Pruning Type </th>
+    <th>Approach </th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>Inception V3</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./tensorflow/image_recognition/inception_v3/pruning/magnitude">pb</a></td>
+  </tr>
+  <tr>
+    <td>ResNet V2</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./tensorflow/image_recognition/resnet_v2/pruning/magnitude">pb</a></td>
+  </tr>
+  <tr>
+    <td>ViT</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./tensorflow/image_recognition/ViT/pruning/magnitude">ckpt</a></td>
+  </tr>
+</tbody>
+</table>
+
+## Distillation
+<table>
+<thead>
+  <tr>
+    <th>Student Model</th>
+    <th>Teacher Model</th>
+    <th>Domain</th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>MobileNet</td>
+    <td>DenseNet201</td>
+    <td>Image Recognition</td>
+    <td><a href="./tensorflow/image_recognition/tensorflow_models/distillation">pb</a></td>
+  </tr>
+</tbody>
+</table>
+
+# PyTorch  Examples
+## Quantization 
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Approach </th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>ResNet18</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a> / <a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/fx">fx</a></td>
+  </tr>
+  <tr>
+    <td>ResNet18</td>
+    <td>Image Recognition</td>
+    <td>Quantization-Aware Training</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/qat/eager">eager</a> / <a href="./pytorch/image_recognition/torchvision_models/quantization/qat/fx">fx</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a> / <a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/ipex">ipex</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>Quantization-Aware Training</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/qat/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNeXt101_32x16d_wsl</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/ipex">ipex</a></td>
+  </tr>
+  <tr>
+    <td>ResNeXt101_32x8d</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>Se_ResNeXt50_32x4d</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>Inception V3</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/quantization/ptq/cpu/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>PeleeNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/peleenet/quantization/ptq/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNeSt50</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/resnest/quantization/ptq/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>3D-UNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/image_recognition/3d-unet/quantization/ptq/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>SSD ResNet34</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/object_detection/ssd_resnet34/quantization/ptq/fx">fx</a> / <a href="./pytorch/object_detection/ssd_resnet34/quantization/ptq/ipex">ipex</a></td>
+  </tr>
+  <tr>
+    <td>Mask R-CNN</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/object_detection/maskrcnn/quantization/ptq/fx">fx</a></td>
+  </tr>
+  <tr>
+    <td>YOLOv3</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/object_detection/yolo_v3/quantization/ptq/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>DLRM</td>
+    <td>Recommendation</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/recommendation/dlrm/quantization/ptq/eager">eager</a> / <a href="./pytorch/recommendation/dlrm/quantization/ptq/ipex">ipex</a> / <a href="./pytorch/recommendation/dlrm/quantization/ptq/fx">fx</a></td>
+  </tr>
+  <tr>
+    <td>RNN-T</td>
+    <td>Speech Recognition</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./pytorch/speech_recognition/rnnt/quantization/ptq_dynamic/eager">eager</a> / <a href="./pytorch/speech_recognition/rnnt/quantization/ptq_static/ipex">ipex</a></td>
+  </tr>
+  <tr>
+    <td>Wav2Vec2</td>
+    <td>Speech Recognition</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./pytorch/speech_recognition/torchaudio_models/quantization/ptq_dynamic/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>HuBERT</td>
+    <td>Speech Recognition</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./pytorch/speech_recognition/torchaudio_models/quantization/ptq_dynamic/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>BlendCNN</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/nlp/blendcnn/quantization/ptq/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>bert-large-uncased-whole-word-masking-finetuned-squad</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/quantization/ptq_static/fx">fx</a> / <a href="./pytorch/nlp/huggingface_models/question-answering/quantization/ptq_static/ipex">ipex</a></td>
+  </tr>
+  <tr>
+    <td>t5-small</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./pytorch/nlp/huggingface_models/translation/quantization/ptq_dynamic/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>Helsinki-NLP/opus-mt-en-ro</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./pytorch/nlp/huggingface_models/translation/quantization/ptq_dynamic/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>lvwerra/pegasus-samsum</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./pytorch/nlp/huggingface_models/summarization/quantization/ptq_dynamic/eager">eager</a></td>
+  </tr>
+</tbody>
+</table>
+
+## Pruning
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Pruning Type </th>
+    <th>Approach</th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>ResNet18</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/pruning/magnitude/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNet34</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/pruning/magnitude/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/pruning/magnitude/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNet101</td>
+    <td>Image Recognition</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/pruning/magnitude/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>BERT large</td>
+    <td>Natural Language Processing</td>
+    <td>Structured</td>
+    <td>Group Lasso</td>
+    <td><a href="./pytorch/nlp/huggingface_models/question-answering/pruning/group_lasso/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>Intel/bert-base-uncased-sparse-70-unstructured</td>
+    <td>Natural Language Processing (question-answering)</td>
+    <td>Unstructured</td>
+    <td>Pattern Lock</td>
+    <td><a href="./pytorch/nlp/huggingface_models/question-answering/pruning/pattern_lock/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>bert-base-uncased</td>
+    <td>Natural Language Processing</td>
+    <td>Structured</td>
+    <td>Gradient Sensitivity</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/pruning/gradient_sensitivity/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>DistilBERT</td>
+    <td>Natural Language Processing</td>
+    <td>Unstructured</td>
+    <td>Magnitude</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/pruning/magnitude/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>Intel/bert-base-uncased-sparse-70-unstructured</td>
+    <td>Natural Language Processing (text-classification)</td>
+    <td>Unstructured</td>
+    <td>Pattern Lock</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/pruning/pattern_lock/eager">eager</a></td>
+  </tr>
+</tbody>
+</table>
+
+## Distillation
+<table>
+<thead>
+  <tr>
+    <th>Student Model</th>
+    <th>Teacher Model</th>
+    <th>Domain</th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>CNN-2</td>
+    <td>CNN-10</td>
+    <td>Image Recognition</td>
+    <td><a href="./pytorch/image_recognition/CNN-2/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V2-0.35</td>
+    <td>WideResNet40-2</td>
+    <td>Image Recognition</td>
+    <td><a href="./pytorch/image_recognition/MobileNetV2-0.35/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>ResNet18|ResNet34|ResNet50|ResNet101</td>
+    <td>ResNet18|ResNet34|ResNet50|ResNet101</td>
+    <td>Image Recognition</td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>VGG-8</td>
+    <td>VGG-13</td>
+    <td>Image Recognition</td>
+    <td><a href="./pytorch/image_recognition/VGG-8/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>BlendCNN</td>
+    <td>BERT base</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/blendcnn/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>distilbert-base-uncased</td>
+    <td>csarron/bert-base-uncased-squad-v1</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/huggingface_models/question-answering/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>BiLSTM</td>
+    <td>textattack/roberta-base-SST-2</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>huawei-noah/TinyBERT_General_4L_312D</td>
+    <td>blackbird/bert-base-uncased-MNLI-v1</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>nreimers</td>
+    <td>textattack/bert-base-uncased-QQP</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/distillation/eager">eager</a></td>
+  </tr>
+  <tr>
+    <td>distilroberta-base</td>
+    <td>howey/roberta-large-cola</td>
+    <td>Natural Language Processing</td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/distillation/eager">eager</a></td>
+  </tr>
+</tbody>
+</table>
+
+## Orchestration
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Approach</th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>Multi-shot: Pruning and PTQ<br></td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/optimization_pipeline/prune_and_ptq/eager">link</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50</td>
+    <td>Image Recognition</td>
+    <td>One-shot: QAT during Pruning<br></td>
+    <td><a href="./pytorch/image_recognition/torchvision_models/optimization_pipeline/qat_during_prune/eager">link</a></td>
+  </tr>
+  <tr>
+    <td>Intel/bert-base-uncased-sparse-90-unstructured-pruneofa</td>
+    <td>Natural Language Processing (question-answering)</td>
+    <td>One-shot: Pruning, Distillation and QAT<br></td>
+    <td><a href="./pytorch/nlp/huggingface_models/question-answering/optimization_pipeline/prune_once_for_all/fx">link</a></td>
+  </tr>
+  <tr>
+    <td>Intel/bert-base-uncased-sparse-90-unstructured-pruneofa</td>
+    <td>Natural Language Processing (text-classification)</td>
+    <td>One-shot: Pruning, Distillation and QAT<br></td>
+    <td><a href="./pytorch/nlp/huggingface_models/text-classification/optimization_pipeline/prune_once_for_all/fx">link</a></td>
+  </tr>
+</tbody>
+</table>
+
+# ONNX Runtime Examples
+## Quantization
+
+<table>
+<thead>
+  <tr>
+    <th>Model</th>
+    <th>Domain</th>
+    <th>Approach </th>
+    <th>Examples</th>
+  </tr>
+</thead>
+<tbody>
+  <tr>
+    <td>ResNet50 V1.5</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/resnet50/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/resnet50/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50 V1.5 MLPerf</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/resnet50/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/resnet50/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>VGG16</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/vgg16/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/vgg16/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/mobilenet_v2/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/mobilenet_v2/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V3 MLPerf</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/mobilenet_v3/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/mobilenet_v3/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>AlexNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/alexnet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/alexnet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>CaffeNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/caffenet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/caffenet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>DenseNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/densenet/quantization/ptq">qlinearops</a></td>
+  </tr>
+  <tr>
+    <td>EfficientNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/efficientnet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/efficientnet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>FCN</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/fcn/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/fcn/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>GoogleNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/googlenet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/googlenet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>Inception V1</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/inception/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/inception/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>MNIST</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/mnist/quantization/ptq">qlinearops</a></td>
+  </tr>
+  <tr>
+    <td>MobileNet V2 (ONNX Model Zoo)</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/mobilenet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/mobilenet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>ResNet50 V1.5 (ONNX Model Zoo)</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/resnet50/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/resnet50/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>ShuffleNet V2</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/shufflenet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/shufflenet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>SqueezeNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/squeezenet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/squeezenet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>VGG16 (ONNX Model Zoo)</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/vgg16/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/vgg16/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>ZFNet</td>
+    <td>Image Recognition</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/image_recognition/onnx_model_zoo/zfnet/quantization/ptq">qlinearops</a> / <a href="./onnxrt/image_recognition/onnx_model_zoo/zfnet/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>BERT base MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/bert/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/bert/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>BERT base MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./onnxrt/language_translation/bert/quantization/ptq">integerops</a></td>
+  </tr>
+  <tr>
+    <td>DistilBERT base MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/distilbert/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/distilbert/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>Mobile bert MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/mobilebert/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/mobilebert/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>Roberta base MRPC</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/roberta/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/roberta/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>BERT SQuAD</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/bert-squad/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/bert-squad/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>GPT2 lm head WikiText</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic Quantization</td>
+    <td><a href="./onnxrt/language_translation/gpb2/quantization/ptq">integerops</a></td>
+  </tr>
+  <tr>
+    <td>MobileBERT SQuAD MLPerf</td>
+    <td>Natural Language Processing</td>
+    <td>Post-Training Dynamic / Static Quantization</td>
+    <td><a href="./onnxrt/language_translation/mobilebert/quantization/ptq">integerops</a> / <a href="./onnxrt/language_translation/mobilebert/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>SSD MobileNet V1</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/ssd_mobilenet_v1/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/ssd_mobilenet_v1/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>SSD MobileNet V2</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/ssd_mobilenet_v2/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/ssd_mobilenet_v2/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>SSD MobileNet V1 (ONNX Model Zoo)</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/ssd_mobilenet_v1/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/onnx_model_zoo/ssd_mobilenet_v1/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>DUC</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/DUC/quantization/ptq">qlinearops</a></td>
+  </tr>
+  <tr>
+    <td>Faster R-CNN</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/faster_rcnn/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/onnx_model_zoo/faster_rcnn/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>Mask R-CNN</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/mask_rcnn/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/onnx_model_zoo/mask_rcnn/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>SSD</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/ssd/quantization/ptq">qlinearops</a> / <a href="./onnxrt/object_detection/onnx_model_zoo/ssd/quantization/ptq">qdq</a></td>
+  </tr>
+  <tr>
+    <td>Tiny YOLOv3</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/tiny_yolov3/quantization/ptq">qlinearops</a></td>
+  </tr>
+  <tr>
+    <td>YOLOv3</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/yolov3/quantization/ptq">qlinearops</a></td>
+  </tr>
+  <tr>
+    <td>YOLOv4</td>
+    <td>Object Detection</td>
+    <td>Post-Training Static Quantization</td>
+    <td><a href="./onnxrt/object_detection/onnx_model_zoo/yolov4/quantization/ptq">qlinearops</a></td>
+  </tr>
+</tbody>
+</table>
\ No newline at end of file

Types	Quantization	Dataset Requirements	Framework	Backend
Post-Training Static Quantization (PTQ)	weights and activations	calibration	PyTorch	PyTorch Eager/PyTorch FX/IPEX
			TensorFlow	TensorFlow/Intel TensorFlow
			ONNX Runtime	QLinearops/QDQ
Post-Training Dynamic Quantization	weights	none	PyTorch	PyTorch eager mode/PyTorch fx mode/IPEX
Post-Training Dynamic Quantization	weights	none	ONNX Runtime	QIntegerops
Quantization-aware Training (QAT)	weights and activations	fine-tuning	PyTorch	PyTorch eager mode/PyTorch fx mode/IPEX
Quantization-aware Training (QAT)	weights and activations	fine-tuning	TensorFlow	TensorFlow/Intel TensorFlow
System Configuration	Intel Xeon Platinum 8380 Scalable processor
Manufacturer	Intel Corporation
Product Name	M50CYP2SBSTD
BIOS Version	SE5C6200.86B.0022.D64.2105220049
OS	Ubuntu 20.04.1 LTS
Kernel	5.4.0-42-generic
Microcode	0xd0002b1
CPU Model	Intel(R) Xeon(R) Platinum 8380 CPU @ 2.30GHz
Base Frequency	2.3GHZ
Thread(s) per Core	2
Core(s) per Socket	40
Socket(s)	2
Turbo	Enabled
Power & Perf Policy	Balanced
Installed	256GB (16x16GB DDR4 3200MT/s [3200MT/s])
NIC Summary	2x Ethernet Controller 10G X550T
Drive Summary	1x INTEL_SSDSC2KW01 953.9G, +1x CT1000MX500SSD1 931.5G, +1x CT1000MX500SSD1 931.5G +
Pruning Type	Pruning Granularity	Pruning Algorithm	Framework
Unstructured Pruning	Element-wise	Magnitude	PyTorch, TensorFlow
Unstructured Pruning	Element-wise	Pattern Lock	PyTorch
Structured Pruning	Filter/Channel-wise	Gradient Sensitivity	PyTorch
	Block-wise	Group Lasso	PyTorch
	Element-wise	Pattern Lock	PyTorch
Framework	version	model	Model	Accuracy			Performance 1s4c10ins1bs/throughput (samples/sec)			Performance throughput (samples/sec)			Example
Framework	version	model	Model	INT8	FP32	Acc Ratio[(INT8-FP32)/FP32]	Accuracy Ratio[(INT8-FP32)/FP32]	INT8	FP32	Performance Ratio[INT8/FP32]			Example
BERT large SQuAD	92.39	92.99	-0.64%	25.32	12.53	2.02x	pb
DenseNet121	73.57%	72.89%	0.93%	370.52	329.74	1.12x	pb
DenseNet161	76.24%	76.29%	-0.07%	219.46	180.75	1.21x	pb
DenseNet169	74.40%	74.65%	-0.33%	301.33	259.88	1.16x	pb
Faster R-CNN Inception ResNet V2	37.98%	38.33%	-0.91%	3.96	2.34	1.69x	pb
Faster R-CNN Inception ResNet V2	37.84%	38.33%	-1.28%	3.98	2.31	1.72x	SavedModel
Faster R-CNN ResNet101	30.28%	30.39%	-0.36%	70	19.98	3.50x	pb
Faster R-CNN ResNet101	30.37%	30.39%	-0.07%	70.26	16.98	4.14x	SavedModel
intel-tensorflow	2.7.0	resnet50v1.5	76.82%	76.46%	0.47%	1239.52	433.07	2.86x	Inception ResNet V2	80.44%	80.40%	0.05%	281.79	137.91	2.04x	pb
intel-tensorflow	2.7.0	resnet101	77.50%	76.45%	1.37%	874.41	352.91	2.48x	Inception V1	70.48%	69.74%	1.06%	2193.17	975.6	2.25x	pb
intel-tensorflow	2.7.0	inception_v2	Inception V2	74.36%	73.97%	0.53%	1840.78	853.52	2.16x	1835.35	838.82	2.19x	pb
intel-tensorflow	2.7.0	inception_v3	Inception V3	77.28%	76.75%	0.69%	954.63	391.35	2.44x	973.42	376.3	2.59x	pb
intel-tensorflow	2.7.0	inception_v4	Inception V4	80.40%	80.27%	0.16%	580.02	202.14	575.9	200.55	2.87x	pb
Mask R-CNN Inception V2	28.53%	28.73%	-0.70%	132.51	50.3	2.63x	pb
intel-tensorflow	2.7.0	mobilenetv1	Mask R-CNN Inception V2	28.53%	28.73%	-0.70%	132.89	50.97	2.61x	ckpt
MobileNet V1	71.79%	70.96%	1.17%	3587.79	1343.07	2.67x	3545.79	1191.94	2.97x	pb
intel-tensorflow	2.7.0	mobilenetv2	MobileNet V2	71.89%	71.76%	0.18%	2469.92	1434.87	1.72x	2431.66	1420.11	1.71x	pb
intel-tensorflow	2.7.0	ssd_resnet50_v1	37.86%	38.00%	-0.37%	70.35	26.34	2.67x	ResNet101	77.50%	76.45%	1.37%	877.91	355.49	2.47x	pb
intel-tensorflow	2.7.0	ssd_mobilenet_v1	22.97%	23.13%	-0.69%	852.80	460.33	ResNet50 Fashion	77.80%	78.12%	-0.41%	3977.5	2150.68	1.85x	pb
intel-tensorflow	2.7.0	faster_rcnn_inception_resnet_v2	37.99%	38.33%	-0.89%	4.06	2.33	1.74x
intel-tensorflow	2.7.0	faster_rcnn_resnet101_saved	30.37%	30.39%	-0.07%	69.69	17.71	3.94x
intel-tensorflow	2.7.0	mask_rcnn_inception_v2	28.54%	28.72%	-0.63%	123.97	53.23	2.33x	ResNet50 V1.0	74.11%	74.27%	-0.22%	1509.64	472.66	3.19x	pb
intel-tensorflow	2.7.0	wide_deep_large_ds	77.62%	77.67%	-0.07%	22704.16	21249.52	1.07x	ResNet50 V1.5	76.82%	76.46%	0.47%	1260.01	415.83	3.03x	pb
intel-tensorflow	2.7.0	vgg16	72.66%	70.89%	2.50%	669.62	178.75	3.75x	ResNet V2 101	72.67%	71.87%	1.11%	436.52	318.3	1.37x	pb
intel-tensorflow	2.7.0	vgg19	72.72%	71.01%	2.41%	558.43	148.19	3.77x	ResNet V2 152	73.03%	72.37%	0.91%	306.82	221.4	1.39x	pb
intel-tensorflow	2.7.0	resnetv2_50	ResNet V2 50	70.33%	69.64%	0.99%	765.73	580.54	1.32x
intel-tensorflow	2.7.0	densenet121	73.57%	72.89%	0.93%	366.59	296.63	1.24x
intel-tensorflow	2.7.0	densenet161	76.24%	76.29%	-0.07%	218.26	164.48	1.33x
intel-tensorflow	2.7.0	densenet169	74.40%	74.65%	-0.33%	294.82	253.35	1.16x	749.85	574.19	1.31x	pb
intel-tensorflow	2.7.0	ssd_resnet50_v1_ckpt	37.81%	38.00%	-0.50%	70.47	21.79	3.23x	SSD MobileNet V1	22.97%	23.13%	-0.69%	952.9	582.87	1.63x	pb
intel-tensorflow	2.7.0	ssd_mobilenet_v1_ckpt	SSD MobileNet V1	22.99%	23.13%	-0.61%	852.49	386.90	2.20x	954.92	413.24	2.31x	ckpt
intel-tensorflow	2.7.0	mask_rcnn_inception_v2_ckpt	28.54%	28.72%	-0.63%	131.43	51.09	2.57x
intel-tensorflow	2.7.0	resnet50v1.0	74.11%	74.27%	-0.22%	1543.95	501.61	3.08x
intel-tensorflow	2.7.0	ssd_resnet34	SSD ResNet34	21.69%	22.09%	-1.81%	43.71	11.78	3.71x	44.46	11.81	3.76x	pb
intel-tensorflow	2.7.0	inception_v1	70.48%	69.74%	1.06%	2227.69	1051.64	2.12x
intel-tensorflow	2.7.0	faster_rcnn_inception_resnet_v2_saved	37.90%	38.33%	-1.12%	4.05	2.33	1.74x
intel-tensorflow	2.7.0	faster_rcnn_resnet101	30.28%	30.39%	-0.36%	69.74	19.90	3.50x	SSD ResNet50 V1	37.86%	38.00%	-0.37%	69.5	26.04	2.67x	pb
intel-tensorflow	2.7.0	resnetv2_101	72.67%	71.87%	1.11%	444.06	329.70	1.35x	SSD ResNet50 V1	37.81%	38.00%	-0.50%	69.27	21.17	3.27x	ckpt
intel-tensorflow	2.7.0	inception_resnet_v2	80.44%	80.40%	0.05%	284.40	143.73	1.98x	VGG16	72.66%	70.89%	2.50%	660.46	177.85	3.71x	pb
intel-tensorflow	2.7.0	resnetv2_152	73.03%	72.37%	0.91%	319.08	223.37	1.43x	VGG19	72.72%	71.01%	2.41%	562.04	147.61	3.81x	pb
intel-tensorflow	2.7.0	resnet50_fashion	77.80%	78.12%	-0.41%	3953.56	2170.49	1.82x	Wide & Deep	77.62%	77.67%	-0.07%	21332.47	19714.08	1.08x	pb
pytorch	1.10.0+cpu	bert_large_cola	62.88%	62.57%	0.49%	87.88	36.93	2.38x	Model	Accuracy			Performance throughput (samples/sec)			Example
pytorch	1.10.0+cpu	bert_base_rte	69.31%	69.68%	-0.52%	244.20	125.71	1.94x	Model	INT8	FP32	Accuracy Ratio[(INT8-FP32)/FP32]	INT8	FP32	Performance Ratio[INT8/FP32]	Example
pytorch	1.10.0+cpu	bert_large_mrpc	89.93%	90.38%	-0.49%	87.44	36.71	2.38x	ResNet18	69.74%	69.76%	-0.03%	804.76	388.67	2.07x	eager
pytorch	1.10.0+cpu	bert_large_qnli	90.96%	91.82%	-0.94%	89.18	36.87	2.42x	ResNet18	69.73%	69.76%	-0.04%	806.44	386.59	2.09x	fx
pytorch	1.10.0+cpu	bert_large_rte	71.84%	72.56%	-1.00%	75.91	36.72	2.07x	BERT base MRPC QAT	89.60%	89.50%	0.11%	258.89	125.79	2.06x	fx
pytorch	1.10.0+cpu	mbart_wnli	56.34%	56.34%	0.00%	65.24	31.06	2.10x	ResNet50	76.04%	76.15%	-0.14%	490.64	203.49	2.41x	eager
onnxrt-runtime	1.10.0	bert_squad_model_zoo	80.43	80.67	-0.29%	115.78	64.69	1.79x	Model	Accuracy			Performance throughput (samples/sec)
onnxrt-runtime	1.10.0	mobilebert_squad_mlperf	89.84	90.02	-0.20%	102.82	95.17	1.08x	Model	INT8	FP32	Accuracy Ratio[(INT8-FP32)/FP32]	INT8	FP32	Performance Ratio[INT8/FP32]
onnxrt-runtime	1.10.0	vgg16_model_zoo	72.28%	72.40%	-0.17%	447.28	129.59	3.45x
Inception V3	77.80%	77.65%	0.20%	920.74	276.73	3.33x
MobileNet V1	71.60%	72.23%	-0.86%	6585.19	2529.21	2.60x
MobileNet V2	70.80%	70.87%	-0.10%	5230.32	1996.47	2.62x
ResNet V1 152	78.28%	78.54%	-0.33%	574.85	156.2	3.68x
ResNet50 V1.0	75.91%	76.33%	-0.55%	1567.9	427.99	3.66x
SqueezeNet	56.80%	56.97%	-0.28%	4704.51	1332.29	3.53x
SSD MobileNet V1	74.94%	75.54%	-0.79%	769.26	193.03	3.99x
System Configuration	Intel Xeon Platinum 8380 Scalable processor
Test Date	Sat 30 Apr 2022 UTC
Manufacturer	Intel Corporation
Product Name	M50CYP2SBSTD
BIOS Version	SE5C6200.86B.0022.D64.2105220049
OS	Ubuntu 20.04.1 LTS
Kernel	5.4.0-42-generic
Microcode	0xd0002b1
CPU Model	Intel(R) Xeon(R) Platinum 8380 CPU @ 2.30GHz
Base Frequency	2.3GHZ
Thread(s) per Core	2
Core(s) per Socket	40
Socket(s)	2
Turbo	Enabled
Power & Perf Policy	Balanced
Installed	256GB (16x16GB DDR4 3200MT/s [3200MT/s])
NIC Summary	2x Ethernet Controller 10G X550T
Drive Summary	1x INTEL_SSDSC2KW01 953.9G, -1x CT1000MX500SSD1 931.5G, -1x CT1000MX500SSD1 931.5G -
Tasks	FWK	Framework	Model	fp32 baseline	gradient sensitivity with 20% sparsity			+onnx dynamic quantization on pruned model			FP32 Baseline	Gradient Sensitivity with 20% Sparsity			+ONNX Dynamic Quantization on Pruned Model
Tasks	FWK	Framework	Model	fp32 baseline	accuracy%	drop%	perf gain (sample/s)	accuracy%	drop%	perf gain (sample/s)	FP32 Baseline	Accuracy%	Drop	Perf Gain (sample/s)	Accuracy%	Drop	Perf Gain (sample/s)
SST-2	pytorch	bert-base	PyTorch	BERT base	accuracy = 92.32	accuracy = 91.97	-0.38
QQP	pytorch	bert-base	PyTorch	BERT base	[accuracy, f1] = [91.10, 88.05]	[accuracy, f1] = [89.97, 86.54]	[-1.24, -1.71]
Tasks	FWK	Framework	Model	fp32 baseline	FP32 Baseline	Pattern Lock on 70% Unstructured Sparsity		Pattern Lock on 50% 1:2 Structured Sparsity
Tasks	FWK	Framework	Model	fp32 baseline	FP32 Baseline	accuracy%	drop%	accuracy%	drop%	Accuracy%	Drop	Accuracy%	Drop
MNLI	pytorch	bert-base	PyTorch	BERT base	[m, mm] = [84.57, 84.79]	[m, mm] = [82.45, 83.27]	[-2.51, -1.80]
SST-2	pytorch	bert-base	PyTorch	BERT base	accuracy = 92.32	accuracy = 91.51	-0.88
QQP	pytorch	bert-base	PyTorch	BERT base	[accuracy, f1] = [91.10, 88.05]	[accuracy, f1] = [90.48, 87.06]	[-0.68, -1.12]
QNLI	pytorch	bert-base	PyTorch	BERT base	accuracy = 91.54	accuracy = 90.39	-1.26
QnA	pytorch	bert-base	PyTorch	BERT base	[em, f1] = [79.34, 87.10]	[em, f1] = [77.27, 85.75]	[-2.61, -1.54]
Framework	Model	fp32 baseline	FP32 Baseline	Compression	dataset	acc(drop)%	Dataset	Accuracy% (Drop)
Pytorch	resnet18	PyTorch	ResNet18	69.76	30% sparsity on magnitude	30% Sparsity on Magnitude	ImageNet	69.47(-0.42)
Pytorch	resnet18	PyTorch	ResNet18	69.76	30% sparsity on gradient sensitivity	30% Sparsity on Gradient Sensitivity	ImageNet	68.85(-1.30)
Pytorch	resnet50	PyTorch	ResNet50	76.13	30% sparsity on magnitude	30% Sparsity on Magnitude	ImageNet	76.11(-0.03)
Pytorch	resnet50	PyTorch	ResNet50	76.13	30% sparsity on magnitude and post training quantization	30% Sparsity on Magnitude and Post Training Quantization	ImageNet	76.01(-0.16)
Pytorch	resnet50	PyTorch	ResNet50	76.13	30% sparsity on magnitude and quantization aware training	30% Sparsity on Magnitude and Quantization Aware Training	ImageNet	75.90(-0.30)
BlendCnn example	BlendCNN example	MRPC	BlendCnn (0.7034)	BlendCNN (0.7034)	BERT-Base (0.8382)	0.7034 (0)
Model	Domain	Approach	Examples
ResNet50 V1.0	Image Recognition	Post-Training Static Quantization	pb
ResNet50 V1.5	Image Recognition	Post-Training Static Quantization	pb
ResNet101	Image Recognition	Post-Training Static Quantization	pb
MobileNet V1	Image Recognition	Post-Training Static Quantization	pb / SavedModel
MobileNet V2	Image Recognition	Post-Training Static Quantization	pb / SavedModel
MobileNet V3	Image Recognition	Post-Training Static Quantization	pb
Inception V1	Image Recognition	Post-Training Static Quantization	pb
Inception V2	Image Recognition	Post-Training Static Quantization	pb
Inception V3	Image Recognition	Post-Training Static Quantization	pb
Inception V4	Image Recognition	Post-Training Static Quantization	pb
Inception ResNet V2	Image Recognition	Post-Training Static Quantization	pb
VGG16	Image Recognition	Post-Training Static Quantization	pb / keras
VGG19	Image Recognition	Post-Training Static Quantization	pb / keras
ResNet V2 50	Image Recognition	Post-Training Static Quantization	pb
ResNet V2 101	Image Recognition	Post-Training Static Quantization	pb
ResNet V2 152	Image Recognition	Post-Training Static Quantization	pb
DenseNet121	Image Recognition	Post-Training Static Quantization	pb
DenseNet161	Image Recognition	Post-Training Static Quantization	pb
DenseNet169	Image Recognition	Post-Training Static Quantization	pb
EfficientNet B0	Image Recognition	Post-Training Static Quantization	ckpt
MNIST	Image Recognition	Quantization-Aware Training	keras
ResNet50	Image Recognition	Post-Training Static Quantization	keras
ResNet50 Fashion	Image Recognition	Post-Training Static Quantization	keras
ResNet V2	Image Recognition	Quantization-Aware Training	keras
EfficientNet V2 B0	Image Recognition	Post-Training Static Quantization	SavedModel
BERT base MRPC	Natural Language Processing	Post-Training Static Quantization	ckpt
BERT large SQuAD	Natural Language Processing	Post-Training Static Quantization	pb
Transformer LT	Natural Language Processing	Post-Training Static Quantization	pb
SSD ResNet50 V1	Object Detection	Post-Training Static Quantization	pb / ckpt
SSD MobileNet V1	Object Detection	Post-Training Static Quantization	pb / ckpt
Faster R-CNN Inception ResNet V2	Object Detection	Post-Training Static Quantization	pb / SavedModel
Faster R-CNN ResNet101	Object Detection	Post-Training Static Quantization	pb / SavedModel
Mask R-CNN Inception V2	Object Detection	Post-Training Static Quantization	pb / ckpt
SSD ResNet34	Object Detection	Post-Training Static Quantization	pb
YOLOv3	Object Detection	Post-Training Static Quantization	pb
Wide & Deep	Recommendation	Post-Training Static Quantization	pb
Arbitrary Style Transfer	Style Transfer	Post-Training Static Quantization	ckpt
Model	Domain	Pruning Type	Approach	Examples
Inception V3	Image Recognition	Unstructured	Magnitude	pb
ResNet V2	Image Recognition	Unstructured	Magnitude	pb
ViT	Image Recognition	Unstructured	Magnitude	ckpt