LLM-2 MCP
前言 注:文档太长了,太多了,如果想快速了解 MCP 是什么,可以利用 Claude Code,接入智谱或者 MiniMax2 的模型,让它来把代码 Clone 下来,然后对单个文件进行分析,每一步是怎么实现的,是怎么做的。通过合适的提问,来实现你想要了解的内容。 在使用 Cline、Claude Desktop、Cursor 这些应用的时候,只需要配置一个 mcp.json 文件,就可以让大模型使用各种工具,这种是否很神奇?例如下面的配置,我就能让 Cursor 或者 Cline 操作 Chrome 浏览器进行各种操作,例如访问某个网站,点击某个按钮。这一切,都很简单,如果你知道大模型本质是什么,可以跳过下面的 LLM 的内容,直接看背景介绍。 { "mcpServers": { "chrome-devtools": { "command": "npx", "args": ["chrome-devtools-mcp@latest"] } } } 下面的操作是不是看起来很神秘,只需要输入文字,就能打开网页,点击登录,输入账号。 其实这个做了这几件事情,在 D-Cline 的进程中, 使用 npx 命令启动一个了一个子进程,这个进行接受 stdio 输入一段内容; 将 MCP TOOL 的提示词填充进 D-Cline 的 system prompt 中; 用户输入然后 D-Cline 调用大模型,返回结构化的 XML 文本; Buffer 回复内容,解析 XML 调用相关的 Tool; 如果是 MCP,则会调用对应的 MCP 子进程的 Tool; 调用结果输出 stdio,D-Cline 收到输出的内容决定是否进行下一步操作; 如此循环,直到调用 FinalAnswer Tool 返回最终答案。 当然,我这里为了避免无限循环调用工具,加了硬编码的固定最大对话轮数限制。 ...