tensorrt-insight/inferflow at main · lix19937/tensorrt-insight

readme.md

轻量级TRT推理见 https://github.com/lix19937/tensorrt-insight/tree/main/dynamic_shape/src

如何利用multi-cudagraph + stream + thread 设计一个多模型调度框架？ @ taskflow + tensorrt

zero copy + io-free reformat

基于 OpenVX 实现一个多模型调度框架
组合试验
- 隐藏同一时刻，选择合适的模型进行并行，利用overlab掩盖小模型（指低算力）latency，完全消弭小模型推理耗时
- 确定性任务编排
- multi-task模型head拆分并行
软件工程目录结构参考https://github.com/sogou/workflow

目录说明备注

benchmark

docs

src

test

tutorial

更多见设计