OSS ChatGPT WebUI – 530个模型，MCP，工具，Gemini RAG，图像/音频生成

摘要： 本次重大版本更新主要聚焦于扩展性、扩展提供商支持以及用户体验增强。新增功能包括：

模型选择器：提供智能搜索、高级过滤、灵活排序和收藏系统，方便用户查找和使用模型。
扩展系统：支持添加功能、提供商和自定义UI，通过插件架构实现。
Gemini RAG：管理Gemini文件搜索存储，并支持文档上传和同步。
工具支持：提供Python函数调用、MCP支持等，方便LLM与本地环境交互。
计算器UI：提供美观的UI界面，方便用户进行数学计算。
运行代码UI：在CodeMirror编辑器中执行Python、JS、TypeScript和C#代码脚本。
图像生成：支持Google、OpenAI等图像生成模型。
音频生成：支持Gemini 2.5 Flash/Pro Preview模型的TTS功能。
媒体库：提供美观的UI界面，方便用户浏览和管理生成的图像和音频文件。
SQLite存储：将IndexedDB迁移到服务器SQLite，提高数据持久性和并发使用能力。
资产缓存：实现图像/文件缓存，并保留元数据。
系统提示支持：提供丰富的系统提示库，方便用户配置AI请求。

讨论： 该内容主要讨论了一个名为 OpenWebUI 的软件。用户们对其功能和许可表示了兴趣，并对其与 ChatGPT 和其他类似服务的比较提出了疑问。一些用户对软件的授权方式表示赞赏，而另一些用户则对其在多用户场景下的适用性和与其他工具（如 llm by simon willison）的比较提出了问题。此外，还有关于软件状态管理、MCP 集成和付费 API 密钥使用的讨论。

原文标题：OSS ChatGPT WebUI – 530 Models, MCP, Tools, Gemini RAG, Image/Audio Gen
原文链接：https://llmspy.org/docs/v3
讨论链接：https://news.ycombinator.com/item?id=46766432