AI开放服务/开源项目

ChainForge

ChainForge是面向LLM的评估工具,支持多模型查询、数据流提示工程及质量评估。

标签:

综合介绍

ChainForge是一款开源的可视化编程环境,专门用于对大型语言模型(LLM)的提示进行命中测试。它适用于对提示、聊天回复和响应质量进行早期、快速且混乱的探索,该探索超出了与个别LLM进行临时聊天的范畴。ChainForge能够一次性查询多个LLM,快速有效地测试提示思路和变体,比较提示排列、模型间以及模型设置间的响应质量,从而为您选用最佳的提示和模型。支持通过Rea​​ctFlow和Flask构建。

 

ChainForge

 

 

功能列表

提供一次性查询多个LLM的能力
可以比较不同提示排列、模型及模型设置间的响应质量
设置评估度量(评分功能),并立即将结果可视化
同时对模板参数和聊天模型持有多个对话
内置多个示例评估流程以及文档支持
支持本地安装或在Web上试用(有限功能)
支持包括OpenAI、HuggingFace等在内的多个模型提供商
提供开源协作和反馈机会

 

 

使用帮助

在本地安装ChainForge,需Python 3.8及以上版本,通过pip安装后使用
在符合条件的浏览器上打开localhost:8000访问
可以通过点击设置图标来设置API密钥,并支持从环境变量自动加载
查看具体安装和使用说明,请参阅安装文档

相关导航