Mistral AI 推新服务和 SDK 让客户微调其模型
24-06-07
Mistral AI 今天宣布推出了新的 AI 模型定制选项,包括付费计划,以允许开发者和企业针对特定用例微调其生成模型。
首先,Mistral 发布了一个软件开发工具包(SDK),名为 Mistral-Finetune,用于在工作站、服务器和小数据中心节点上微调其模型。在 SDK 的 GitHub 仓库的自述文件中,Mistral 指出 SDK 针对多 GPU 设置进行了优化,可以扩展到单个 Nvidia A100 或 H100 GPU,用于微调像 Mistral 7B 这样的较小模型。
Mistral 表示,使用 Mistral-Finetune 在八个 H100 上对 UltraChat 数据集(包含与 ChatGPT 的 140 万次对话)进行微调大约需要半小时。对于那些更倾向于更受管理的解决方案的开发者和公司,Mistral 通过 API 提供了新推出的微调服务。
目前,这项服务与 Mistral 的两个模型兼容,即 Mistral Small 和前述的 Mistral 7B。Mistral 表示,微调服务将在接下来的几周内支持更多模型。另外,Mistral 还首次推出了定制训练服务,目前仅对选定的客户开放,使用他们的数据微调任何 Mistral 模型。公司在其官方博客上解释说:“这种方法可以创建高度专业化和优化的模型,以适应他们的特定领域。”