OSS ChatGPT WebUI – 530个模型,MCP,工具,Gemini RAG,图像/音频生成

Jan 26, 2026     Author:mythz     HN Points:129     HN Comments:9
Share this

摘要: 本次重大版本更新主要聚焦于扩展性、扩展提供商支持以及用户体验增强。新增功能包括:

  1. 模型选择器:提供智能搜索、高级过滤、灵活排序和收藏系统,方便用户查找和使用模型。
  2. 扩展系统:支持添加功能、提供商和自定义UI,通过插件架构实现。
  3. Gemini RAG:管理Gemini文件搜索存储,并支持文档上传和同步。
  4. 工具支持:提供Python函数调用、MCP支持等,方便LLM与本地环境交互。
  5. 计算器UI:提供美观的UI界面,方便用户进行数学计算。
  6. 运行代码UI:在CodeMirror编辑器中执行Python、JS、TypeScript和C#代码脚本。
  7. 图像生成:支持Google、OpenAI等图像生成模型。
  8. 音频生成:支持Gemini 2.5 Flash/Pro Preview模型的TTS功能。
  9. 媒体库:提供美观的UI界面,方便用户浏览和管理生成的图像和音频文件。
  10. SQLite存储:将IndexedDB迁移到服务器SQLite,提高数据持久性和并发使用能力。
  11. 资产缓存:实现图像/文件缓存,并保留元数据。
  12. 系统提示支持:提供丰富的系统提示库,方便用户配置AI请求。

讨论: 该内容主要讨论了一个名为 OpenWebUI 的软件。用户们对其功能和许可表示了兴趣,并对其与 ChatGPT 和其他类似服务的比较提出了疑问。一些用户对软件的授权方式表示赞赏,而另一些用户则对其在多用户场景下的适用性和与其他工具(如 llm by simon willison)的比较提出了问题。此外,还有关于软件状态管理、MCP 集成和付费 API 密钥使用的讨论。

原文标题:OSS ChatGPT WebUI – 530 Models, MCP, Tools, Gemini RAG, Image/Audio Gen
原文链接:https://llmspy.org/docs/v3
讨论链接:https://news.ycombinator.com/item?id=46766432