返回聊天

ALong LLM Chat 使用指南

📋 目录
  1. 功能特点
  2. 快速上手
  3. 智能体详细使用指南
    1. 什么是智能体
    2. 创建与管理
    3. 基本设置
    4. 系统提示词
    5. 模型参数
    6. 工具配置
    7. 测试对话
    8. 导入与导出
    9. 在对话中使用智能体
    10. 配置示例
  4. 知识库 (RAG) 配置
  5. WebDAV 云同步
  6. MCP 工具服务器配置
    1. 什么是 MCP
    2. 添加 MCP 服务器
    3. 绑定工具到智能体
    4. 常见问题
  7. 使用技巧
  8. 常见问题

🚀 功能特点

📖 快速上手

  1. 基础配置:点击侧边栏"设置",在"API 设置"中添加厂商并填入 API Key。
  2. 配置知识库(可选):点击侧边栏"知识库",进入"参数配置"填写 Embedding 向量化接口地址和 Key。
  3. 构建知识库:点击"新建知识库"创建分类,拖拽或点击上传文档,列表会实时显示 (已处理/总切片) 进度。
  4. 开启 RAG:返回对话页,点击输入框工具栏的"书本"图标开启知识库,勾选对应知识库分类。
  5. 创建智能体(可选):点击侧边栏"智能体",新建并配置专属助手,设置提示词、绑定知识库和工具后保存。
  6. 接入 MCP 工具(可选):在设置的 MCP 服务器 Tab 中填写支持 MCP 协议的 HTTP 服务器地址并测试连接;然后打开目标智能体的"工具配置"Tab,在 MCP 工具 卡片中勾选需要赋予该智能体的工具并保存。对话时 AI 将按需自动调用(需所用模型支持 Function Calling)。
  7. 开始对话:发送消息,AI 回答中会显示引用来源 [1] [2],点击可展开查看原文段落;若触发了工具调用,气泡内还会展示 🔧 已调用:工具名 折叠块,可查看参数和返回结果。
  8. 云端同步:在"云同步"中配置 WebDAV,每次对话后自动增量上传,切换终端后打开页面自动下载变更。

🤖 智能体详细使用指南

1. 什么是智能体

智能体是你可以自由定制的 AI 助手角色。相比普通对话,智能体允许你预先设定:

每个对话可以绑定一个智能体,绑定后该对话的模型、提示词和工具将完全由智能体接管,无需每次手动切换。

使用场景举例:你可以创建"代码助手"绑定 DeepSeek 并开启 GitHub 知识库,创建"资讯助手"绑定 GPT-4o 并开启联网搜索,两者互不干扰,按需选用。

2. 创建与管理

点击主界面侧边栏中的 智能体 入口,进入智能体管理页面。

提示:智能体配置在保存后会自动通过 WebDAV 增量同步到云端,其他设备打开后即可使用相同的智能体。

3. 基本设置 Tab

在此 Tab 中配置智能体的外观和基础信息。

字段 说明
头像 点击头像区域展开 Emoji 选择面板,支持 30+ 种图标,选中后自动更新。
名称 必填 智能体的显示名称,会出现在聊天页的选择器和对话标题中。
描述 可选 简短说明该智能体的用途,显示在列表条目下方,便于区分多个智能体。
问候语 可选 选中该智能体并新建对话时,AI 自动发送的开场白消息。留空则不显示问候。

4. 提示词 Tab

系统提示词(System Prompt)是智能体的"灵魂",它在每次对话前作为 system 角色消息发送给模型,决定 AI 的行为方式、语气风格和任务边界。

写好系统提示词的建议

动态变量

提示词支持以下变量,每次对话时自动替换为当前实时值,无需手动更新:

变量替换内容示例
{{date}}当前日期(中文格式)2026年4月5日
{{time}}当前时间(24小时制)14:32
{{datetime}}当前完整日期时间2026/4/5 14:32:00
{{weekday}}当前星期星期日

点击编辑器中的变量标签可将其快速插入到光标位置。

实用场景:在提示词中加入 {{date}},AI 就会在回答时自动感知当前日期,适合"日历助手"、"任务提醒"等时间敏感场景,无需每次手动告知 AI 今天是几号。

5. 模型参数 Tab

在此 Tab 中可为智能体单独指定模型和推理参数,优先级高于全局设置。

参数说明
模型选择 从已配置的厂商模型中选择。留空则继承聊天页当前全局选中的模型,适合需要灵活切换模型的场景。
Temperature(温度) 控制回答的随机性,范围 0~2。
0 = 每次输出几乎相同,适合代码生成、数据提取等严谨任务;
0.7(默认)= 平衡创意与准确性;
1.5+ = 发散创意,适合头脑风暴、文学创作。
留空则继承全局设置。
Max Tokens(最大输出长度) 单次回复最多生成的 Token 数。翻译、摘要等需要长输出时可调大;快问快答场景可调小以加快响应。留空则继承全局设置。
说明:若智能体未指定模型,切换全局模型后该智能体会自动跟随变化。若指定了模型,则无论全局如何切换,该智能体始终使用其绑定的模型。

6. 工具配置 Tab

工具配置让智能体具备"主动获取信息"的能力,包括三类工具:

🌐 联网搜索

勾选后,使用该智能体发起对话时,联网搜索功能将自动开启,无需在聊天页手动点击"地球"图标。

📚 知识库绑定

为智能体固定绑定一个或多个知识库,对话时将仅在这些知识库中检索,不受聊天页知识库选择状态影响。

提示:如果页面中显示"暂无知识库",请先前往知识库页面创建并上传文档,再回来配置绑定。

🔌 HTTP 请求工具

这是一个面向进阶用户的功能,允许智能体通过 Function Calling 调用外部 HTTP 接口,从而获取实时数据或触发外部操作。

前提要求:使用 HTTP 工具功能,所选模型必须支持 Function Calling(工具调用),如 GPT-4o、DeepSeek-V3、Claude 3.5 等。请确认所用模型支持此特性再行配置。

开启方式:勾选"HTTP 请求工具"复选框,展开配置区域,点击"+ 添加 HTTP 工具"按钮。

HTTP 工具配置字段说明:

字段说明
工具名称 必填 英文命名,不含空格,如 get_weathersearch_stock。该名称会作为 Function Calling 的函数名传给模型。
功能描述 告知 LLM 何时应该调用该工具,描述越清晰,模型判断越准确。例如:"当用户询问某城市的实时天气时,调用此工具获取天气数据。"
请求方式 支持 GET、POST、PUT、DELETE 四种 HTTP 方法。
URL 目标接口地址,支持用 {{参数名}} 占位符标记 LLM 需要填充的动态参数。
例如:https://api.example.com/weather?city={{city}}&unit=celsius
请求头 JSON 格式,可选。常用于传入鉴权信息,例如:{"Authorization": "Bearer YOUR_TOKEN"}
请求体模板 POST 等方法时填写,同样支持 {{参数名}} 占位符,例如:{"city": "{{city}}", "unit": "celsius"}

占位符 {{参数名}} 的工作原理:模型在决定调用该工具时,会自动从用户的问题中提取对应参数值,并将其填入 URL 或请求体中的占位符位置,然后由本地代理发起实际的 HTTP 请求。

跨域说明:所有 HTTP 工具请求均通过本地 Node 代理(/agent-http 端点)转发,无需担心浏览器跨域限制。请确保应用以 npm run dev 启动,代理服务正常运行。

同一个智能体可以添加多个 HTTP 工具,已添加的工具列表支持编辑(✏️)和删除(🗑️)操作。

7. 测试对话 Tab

无需保存、无需回到主界面,即可在"测试对话"Tab 中直接验证当前配置效果。

工作流建议:先在"提示词"Tab 写好系统提示词,切换到"测试对话"Tab 用几条典型问题验证效果,满意后再切回"基本设置"点击保存。

8. 导入与导出

智能体配置可以 JSON 文件格式分享和备份。

注意:导出的 JSON 中不含 API Key 等敏感凭证,分享给他人使用时安全。知识库的向量数据不包含在导出文件中,对方需要在自己的设备上单独上传文档并向量化。

9. 在对话中使用智能体

  1. 返回聊天主界面,在对话输入区上方或对话列表顶部找到智能体选择器(显示当前智能体名称或"默认模式")。
  2. 点击选择器,从下拉列表中选中目标智能体。
  3. 点击"新建对话",如果该智能体配置了问候语,AI 会自动发送开场白。
  4. 开始对话——系统提示词、绑定模型、温度参数和工具配置将全程自动应用。

10. 配置示例

示例一:专业代码助手

// 基本设置 名称: 代码助手 头像: 🦾 描述: 专注代码生成、调试与代码评审 // 模型参数 模型: DeepSeek-V3(精确、成本低) 温度: 0.1(确保代码严谨) // 系统提示词 你是一名资深全栈工程师,擅长 Python、TypeScript 和 Go。 请用规范的代码风格给出可直接运行的示例。 回答中: - 始终提供完整代码,不省略关键部分 - 代码后简要解释核心逻辑 - 如发现潜在 Bug 或安全问题,主动指出

示例二:实时资讯助手

// 工具配置 联网搜索: ✅ 开启 // 系统提示词 你是一名资讯分析师,今天是 {{date}},现在是 {{time}}。 每次回答请: 1. 优先基于联网搜索结果 2. 标注信息来源和发布时间 3. 给出简短的背景分析

示例三:企业知识库客服

// 工具配置 知识库绑定: ✅ 产品手册、常见问题 // 系统提示词 你是"XX 产品"的官方客服助手。 - 所有回答必须基于知识库中的文档内容 - 无法找到相关信息时,回答:"抱歉,该问题超出我的知识范围, 请联系人工客服。" - 不得凭空捏造数据或承诺 - 语气亲切、专业,使用简体中文 // 问候语 您好!我是 XX 产品专属助手,请问有什么可以帮您?😊

示例四:带 HTTP 工具的天气助手

// HTTP 工具配置 工具名称: get_weather 功能描述: 当用户询问某城市天气时,调用此工具获取实时天气 请求方式: GET URL: https://api.weatherapi.com/v1/current.json?key=YOUR_KEY&q={{city}}&lang=zh // 系统提示词 你是天气助手,今天是 {{date}}。 当用户询问天气时,使用 get_weather 工具查询实时数据, 然后将结果以友好的方式告知用户,包括温度、天气状况和穿衣建议。

示例五:股票 / 基金查询助手

通过 HTTP 工具调用行情接口,让 AI 实时查询股票或基金的最新价格、涨跌幅等数据。

// HTTP 工具配置 工具名称: query_stock 功能描述: 当用户询问股票或基金的实时价格、涨跌幅时,调用此工具获取行情数据 请求方式: GET URL: https://api.example.com/stock/quote?symbol={{symbol}}&token=YOUR_TOKEN // {{symbol}} 由模型从用户输入中提取,如 "000001"(平安银行)或 "AAPL"(苹果) // 系统提示词 你是专业的投资助手,今天是 {{date}},现在是 {{time}}。 当用户询问某支股票或基金的价格时,使用 query_stock 工具查询, symbol 参数填写对应的股票代码或基金代码。 返回结果后,请同时给出简短的市场背景分析。 注意:以上信息仅供参考,不构成投资建议,请用户自行决策。

示例六:飞书 / 企业微信 Webhook 通知助手

通过 POST 请求向团队协作工具推送消息,适合"提醒助手"、"任务播报"等场景。

// HTTP 工具配置 工具名称: send_notification 功能描述: 当用户要求发送通知、提醒或播报消息到团队群时,调用此工具推送消息 请求方式: POST URL: https://open.feishu.cn/open-apis/bot/v2/hook/YOUR_WEBHOOK_TOKEN 请求头: {"Content-Type": "application/json"} 请求体模板: { "msg_type": "text", "content": { "text": "{{message}}" } } // {{message}} 由模型根据用户的描述自动生成通知内容并填入 // 系统提示词 你是团队通知助手,今天是 {{date}} {{weekday}}。 当用户说"发通知"、"群发消息"、"提醒大家"等指令时, 先根据用户意图整理好通知正文,再调用 send_notification 工具发送。 发送成功后告知用户"已发送至飞书群"。 如果用户没有提供足够信息,请先追问清楚再执行。

📚 知识库 (RAG) 配置

1. 参数配置

2. 支持的文件格式

支持 .txt.md.pdf.docx(Word)、.csv.html。PDF 采用流式解析,Word 文档通过 mammoth.js 提取纯文本,即使是长文档也能稳步处理。

也可点击"手动添加条目"直接输入知识文本,适合笔记、摘录等场景。

3. 知识库跨终端同步

4. 使用进阶技巧

☁️ WebDAV 云同步

坚果云配置方法

  1. 登录坚果云网页版,点击右上角头像 → 账户信息。
  2. 进入"安全选项"→"第三方应用管理"→ 添加应用密码(必须使用应用密码,而非登录密码)。
  3. 在本应用设置 → 云同步中,填入 WebDAV 地址(坚果云页面会显示)、账号和应用密码,保存。
  4. 如遇跨域错误或手机端弹出登录框,请勾选"使用本地 Node 代理"。

同步内容

常见问题排查

🔌 MCP 工具服务器配置

1. 什么是 MCP

MCP(Model Context Protocol) 是 Anthropic 发布的开放标准协议,允许大语言模型通过统一接口调用外部工具和数据源。简单来说,你可以为智能体接入任何兼容 MCP 的服务(如文件系统、数据库、代码执行、网络请求等),模型在对话中会自动决策何时调用、如何传参。

前提条件:所用 LLM 模型必须支持 Function Calling(如 GPT-4、DeepSeek、Claude 3 等),且 Node.js 本地代理(npm run dev)需正常运行。

2. 添加 MCP 服务器

打开主页面右上角 ⚙️ 设置,切换到 MCP 服务器 Tab:

  1. 点击 「+ 添加 MCP 服务器」,填写:
    • 名称:便于识别的显示名称,如"Brave Search"
    • 服务器地址:MCP 服务器的完整 HTTP/SSE URL,如 http://localhost:3100/mcp
    • 描述(可选):对该服务器功能的简要说明
  2. 点击 「测试连接」,验证服务器是否可达并预览可用工具列表。
  3. 确认无误后点击 「添加」,可用 启用/禁用 开关随时暂停某个服务器而不删除配置。
提示:MCP 服务器的工具列表会在智能体工具配置页加载时实时拉取,并缓存 5 分钟以减少网络请求。修改服务器后如工具列表未更新,可切换到其他 Tab 再切回来刷新。

3. 绑定工具到智能体

进入 智能体管理 → 选择目标智能体 → 切换到 工具配置 Tab → MCP 工具 卡片:

  1. 系统会自动从所有已启用的 MCP 服务器加载工具列表(按服务器分组显示)。
  2. 勾选需要绑定的具体工具。可跨多个服务器混合选择。
  3. 点击 「保存」,配置生效。

路由逻辑:

执行优先级:工具名先匹配 HTTP 工具(httpTools),再匹配 MCP 工具(mcpTools 或服务器全量)。工具名应全局唯一,避免跨服务器重名导致路由混乱。

4. 常见问题

Q: 工具配置页显示"无可用工具(服务器可能未运行)"?
A: 检查:① 服务器 URL 是否填写正确;② MCP 服务器是否已启动并可正常访问;③ 本地代理 npm run dev 是否已运行(代理层负责转发请求到 MCP 服务器)。

Q: 模型没有调用 MCP 工具?
A: ① 确认模型支持 Function Calling;② 检查工具描述是否清晰说明了触发条件;③ 在智能体"测试对话"Tab 中快速验证,查看气泡内是否出现"正在调用"提示;④ 检查浏览器控制台是否有工具加载失败的警告。

Q: 工具调用结果不符合预期?
A: 展开对话气泡中的 🔧 已调用:工具名 折叠块,可查看实际传入的参数和返回的原始结果,据此调整工具描述或系统提示词。

💡 使用技巧

高效对话

聊天记录管理

快捷键操作

联网搜索配置

🔧 常见问题解答

📡 HTTP 工具公共列表文件地址(点击复制链接,复制后填入设置-通用-HTTP 工具公共库 URL):
https://alongllmchat1-1257187206.cos.ap-chongqing.myqcloud.com/http-tools-library.json ✓ 已复制

关于智能体

Q: 选了智能体但感觉没有生效,回答风格没变化?
A: 请检查:① 是否在智能体管理页保存了最新配置;② 系统提示词是否为空;③ 该对话是否已有大量历史,模型受已有上下文影响较大。建议新建对话后再测试效果。

Q: HTTP 工具配置好了,但模型没有调用?
A: 请确认:① 所用模型支持 Function Calling;② 工具描述是否清晰说明了触发条件;③ 本地 Node 代理是否正常运行(npm run dev 状态);④ 可切换到"测试对话"Tab 验证是否触发。

Q: 能否在一次对话中临时切换智能体?
A: 可以。在聊天页的智能体选择器中随时切换,历史记录不受影响,切换后新发送的消息将使用新智能体的配置。

关于知识库

Q: 换了电脑/终端后,之前上传的文档还能用吗?
A: 文档的列表和元数据(文件名、切片数等)会通过 WebDAV 自动同步过来。向量数据支持按需下载:文档列表中带 ☁️ 云端就绪 标签的文档,点击操作栏 ☁️ 按钮即可下载,完成后立即可用于检索。若云端也没有,则需重新上传原文件进行向量化。

Q: 检索效果不理想怎么办?
A: 可从以下几个方向调整:① 切换到"混合检索"模式;② 适当降低相似度阈值(如从 0.5 降至 0.35);③ 增大 Top K 召回数量;④ 确保 Embedding 模型与向量化时使用的一致。

通用问题

Q: API Key 存储安全吗?
A: 所有敏感信息都在本地加密存储,WebDAV 同步时敏感字段也会加密处理,不会明文传输。

Q: 手机访问时弹出 WebDAV 登录框怎么办?
A: 在设置"云同步"中勾选"使用本地 Node 代理",代理层会自动处理认证,手机浏览器不再弹出登录框。

Q: WebDAV 同步失败怎么排查?
A: ① 确认填写的是应用密码(坚果云中单独生成),而非账号登录密码;② 检查 WebDAV 地址末尾是否有 /;③ 勾选本地代理后重试。