图片识别的函数接口 #10

1487879421888 · 2024-03-18T05:43:50Z

作者你好，我之前看到一个，使用3.5的key，然后进行函数调用，可以实现，你任意发一张图片，然后可以识别，返回结果。请问作者知道这个不？

devcxl · 2024-03-18T05:56:58Z

我去翻了下文档，这个功能可以做到。但是gpt-3.5-turbo是不具备视觉能力的，得用gpt-4-vision-preview模型

devcxl · 2024-03-21T09:48:56Z

目前为止，开源的image2text模型依赖比较多，需要transformers torch等框架的支持，依赖比较复杂庞大，为了保持项目的精简，使用开源模型进行识图的功能后期会新开一个项目为此项目提供相应可选的image2text-api。当前阶段后续会添加gpt-vision-preview的支持。
如果你能找到一些支持识图的api我也可以接入支持

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

图片识别的函数接口 #10

图片识别的函数接口 #10

1487879421888 commented Mar 18, 2024

devcxl commented Mar 18, 2024

devcxl commented Mar 21, 2024

图片识别的函数接口 #10

图片识别的函数接口 #10

Comments

1487879421888 commented Mar 18, 2024

devcxl commented Mar 18, 2024

devcxl commented Mar 21, 2024