这里有几个C/C++的大模型推理库,生产化比较高的:
- https://github.com/ggerganov/llama.cpp
- https://github.com/google/gemma.cpp
- https://github.com/QwenLM/qwen.cpp
还有几个更适合研究学习的:
另外大部分深度学习框架基本都是C++写的,都有C++的API接口,只不过各个框架对C++接口的API稳定性没有像Python API那么有保障,可能会出现函数签名的变动等,维护成本会比Python高一些,而且很多框架的官网会优先维护Python版本的文档,包括教程、示例等,这就给直接使用C++带来更大的学习成本。
不过确实,如果只是推理的话,使用Python会导致大模型功能难以集成到其他的非Python应用中,使用C++会更好一些,所以更好的选项是模型的训练,或者是大模型的微调之类的工作可以使用Python来做,推理使用C++库。
发布于 2024-05-03 19:28・IP 属地山东