OpenXLSX-Sharp

C# binding library for OpenXLSX

为什么

NPOI 和 EPPlus（免费版本）加载配置表有一点慢，加载需要几百ms甚至秒级别的速度

效果

用例1：将excel中的数据打印成C#的string，效率提升了3_12倍左右（表越大，性能差越多）

怎么做

使用CppSharp生成OpenXLSX的绑定代码（需要做一些调整） （done）
编译OpenXLSX，导出动态库（dll）（done）
使用CppSharp运行时，为CLR导入dll符号。（done）
编写一些OpenXLSX在C#和C++两侧的一些适配代码 （done）
- 连续迭代
- 小修改，规避大量临时对象构建（内存申请）
- xxHash加速按字符串查询
- 紧凑的共享字符串的数据结构（hash）

怎么用

C#工程依赖的文件在ReleaseDir文件夹下，拷贝这些文件到C#工程中，并添加依赖
demo代码

参考unity工程

注意

OpenXLSX的cell随机读写的效率也不高，最高效的方式是使用迭代器顺序遍历cell格子（连续读写）。 OpenXLSX随机读写的效率不高和xml解析库定义的数据结构有关系（链式结构）如图。NPOI使用SortedList规避了这个问题
尽量不使用CppSharp为OpenXLSX生成的绑定代码，如果要使用，注意CppSharp生成的一些API的调用会在C#的非托管堆上构造C#对象，比如 XLCell XLWorksheet::cell 这个函数如果在C#侧被调用，注意使用using var cell = sheet.cell();让编译器生成Dispose的调用，否则内存泄露。
- CppSharp默认规则生成的代码是这样的。解决办法是，定制生成规则，给C#的绑定类型生成析构函数，在析构中自动调用Dispose。
C++侧的异常没有处理，所以软件鲁棒性比较烂。

最佳性能实践

核心思想是：

缓存友好
规避多次内存寻址

操作步骤

在C++侧使用迭代器顺序读取cell的数据（顺序迭代规避了链表随机访问延迟高的问题）
将数据放在一块连续内存中，字符串的u8转宽字符在C++侧完成
回调C#侧传过来的函数指针，通过参数将数据指针传递给C#侧
因为C#和C++测的使用内存布局相同的结构体，数据的拷贝使用memcpy，可以很快完成跨语言的数据传递、规避封送（Marshalling）的消耗

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
GenBinding		GenBinding
OpenXLSX @ e1be8c5		OpenXLSX @ e1be8c5
ReleaseDir		ReleaseDir
TestBinding/TestBinding		TestBinding/TestBinding
TestInUnity/ExcelReaderTest		TestInUnity/ExcelReaderTest
docImages		docImages
mimalloc @ 693f351		mimalloc @ 693f351
mio @ 8b6b7d8		mio @ 8b6b7d8
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
buildRelease.bat		buildRelease.bat
copy.bat		copy.bat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OpenXLSX-Sharp

为什么

效果

怎么做

怎么用

注意

最佳性能实践

操作步骤

About

Releases

Packages

Languages

License

zhiyangyou/OpenXLSX-Sharp

Folders and files

Latest commit

History

Repository files navigation

OpenXLSX-Sharp

为什么

效果

怎么做

怎么用

注意

最佳性能实践

操作步骤

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages