OpenAI 引入 “Skills” 机制,强化 ChatGPT 与 Codex CLI 扩展能力
OpenAI 最近悄然在其核心产品 ChatGPT 和开源 Codex CLI 中集成了一项名为 Skills(技能) 的新机制,这标志着这家行业领先的人工智能公司正在推动其产品架构从单纯的对话与工具调用,迈向更加模块化、流程化的任务执行能力。
所谓 Skills,本质上是一个包含 Markdown 文件及可选资源与脚本的文件夹结构,允许大型语言模型(LLM)在访问文件系统的基础上调用这些模块来完成特定任务。与传统模型依赖单一提示或工具调用不同,Skills 提供了一种轻量、可组合的方式来分解复杂流程,例如处理电子表格、生成或解析 PDF 文档等操作。
在 ChatGPT 中,Skills 支持已出现在 Code Interpreter 的内部 /home/oai/skills 文件夹中,用户甚至可以通过简单提示生成该目录的压缩包并查看其中内容。现有服务展现的 Skills 范例涵盖了对电子表格(如 Excel/CSV)、Word 文档和 PDF 的处理能力,而处理文档时还采用了视觉模型先将页面渲染为图片再分析以保留版式信息的设计,这在信息理解的准确性与完整性上比单纯文字提取更可靠。
与此同时,Codex CLI 最新版本也已实验性支持 Skills,开发者只需将 Skill 文件夹放入本地指定路径并启用 Skills 支持,即可让 Codex 扩展其原本的代码生成与自动化能力,比如自动创建插件、编写特定功能代码等。
这一变化虽然尚未正式大规模宣传,但从技术趋势看,Skills 机制与此前由竞争对手 Anthropic 推出的模块化能力高度一致,也反映了 AI 平台从响应式生成向结构性执行与可重复流程支持的转型。业内观点认为,此类机制有望显著提升大模型在专业级任务、自动化流程与多步骤解决方案中的实用性,同时降低对传统 prompt engineering 的依赖。
OpenAI 目前尚未就 Skills 发布官方独立产品页面或用户文档,但在 ChatGPT 与 Codex 工具链内的实装已为开发者与高级用户提前揭示了这一方向的实用潜力与未来趋势。
