MCP不完全指北
在偶然的学习中接触到了近期炙手可热的MCP 于是在学习之后草率写一点自己的体会
笔者对AI学习了解主要停留在应用方面 这里也主要MCP在这上的作用和修改
When it comes to MCP 的概念,个人认为从AI工具的使用现状、其的作用和能带来的改善作为角度切入会更好理解.
那么
AI与MCP(?)
从21年的gpt3.5开始 ai技术不断进步 各种各样的效果评测 也能实打实得说明其无论是在计算 编码 搜索等领域上都有了很大的进步 但是相比之下 其本身集成速度(AI+)应用发展的很慢
3.5时代 我们的使用方法停留在文字对话 语句文字补全 仅chat对话和completion两模式
在以CloseAI为主的(那时还是Open的)独角兽厂商的推动下 人们通过他们提供的api 初步实现了多载体上使用api ide上 chrome插件上 在ds-r1横空出世之后 也是在国内掀起了一模一样的热潮
然后为了想让ai更好的完成任务 人们通过prompt 预训练 rag等方法 尝试通过加强某部分知识在ai“心目中的地位” 事实证明也确实起到了很好的效果 直至当前市场中 不少TOB的ai+任务 也都是通过这种模式来实现的
然后衍生出了AI Agent,function call,structure output等的概念 个人认为Agent本质上可以理解为是ai的一种抽象。原有的单chat模式是Agent的最原始任务,在用户将需求通过function call等方式传达给ai时 其认识并根据输入的信息进行任务的分类后 进行推理 而这个推理的过程本质上和回复是一致的 只是多了一个任务分类的过程
再之后 o1和深度思考以及联网素搜索的出现 首先是进一步增强了它的推理能力 在幻觉等指标上有大幅提升 另一方面也大大强化了Agent处理任务的能力
于是我们现在能发现在各家的ai中 ai生成ppt ai生成邮件回复内容 ai生成论文 ai进行cr 基本都已经随地可见了
但是
这些功能本质上都是相对独立的 想象一下 你可以通过ai在放上搜索最新的论文 然后根据这些论文结合你的主题 编写对应的code处理数据 根据获得的数据写一篇新的论文 为其配图配表格 写完之后甚至还能生成一个路演的ppt 最后将所获得的论文与ppt一并打包邮件发给导师
这么一看就很遥远了 因为在这个过程中会遇见各种各样的问题 eg 上下流协议不一致 模型不一致 上下文过短无法读取整体论文 模型任务不擅长等等
归根到底 出现这个问题的原因除了企业级之间的沟通合作外 技术方面的问题就是缺少一个开放的、通用的、有共识的协议标准
MCP就是这么一个角色 他推出了对应的开源组织和协议 企业测可以自行结合参与 或在这个基础上进行二次融合和合作
Agent与MCP
这里可能会有点混淆 主要是围绕着Agent和MCP的区别 Agent已经有了执行各个任务的能力 但是这个是相对自身而言的 一句话可以总结为 Agent基于单点任务开发 MCP是基于协议兼容开发
当我们多个Agent直接进行拼接 其实就可以达成多个任务流转的效果 但是这个过程是全员定制化的 每个任务之间的function call得到的效果可能都不一样 而且这个定制化一般是面对 单个企业或者多个合作中的企业而言的
而MCP作为标准协议 是面对整个编程界的 结合MCP使用 AI模型能够在不同厂商 不同的API和数据源之间的无缝流转 并且它的设计中 AI模型可以在不同的应用/服务间保持上下文 不仅起到了一种热插拔式的便捷修改 也提升了任务本身的执行效果
这里附上MCP的官方架构图
共识与MCP
所以 MCP本质上并不是什么高深莫测的东西 他只是集大成了目前ai所能做到的事 设计了一个具有共识的协议 各公司可以在此基础上维护一个良好的生态 但是大一统了任务结合的方式 不需要重复造轮子 对整个AI的发展历程 任务融合这一块是极好的
After
写的挺乱挺啰嗦
学习了佬的终极指南