介绍Phi-3：重新定义SLM的可能性 | 开发者人工智能社区 --开发者开聊

developer.chat

25 April 2024

SEO Title

Introducing Phi-3: Redefining what’s possible with SLMs

小尺寸的突破性性能

在关键基准测试中，Phi-3模型显著优于相同大小和更大大小的语言模型（请参阅下面的基准测试数字，越高越好）。Phi-3-mini比其两倍大的型号做得更好，Phi-3-small和Phi-3-medium的表现要好得多，包括GPT-3.5T。
所有报告的数字都是用相同的管道生成的，以确保数字具有可比性。因此，由于评估方法略有不同，这些数字可能与其他公布的数字不同。我们的技术文件提供了有关基准的更多详细信息。
注：Phi-3模型在事实知识基准（如TriviaQA）上表现不佳，因为模型尺寸越小，保留事实的能力越低。

安全第一模式设计

Phi-3模型是根据微软负责任人工智能标准开发的，这是一套基于以下六个原则的全公司要求：问责制、透明度、公平性、可靠性和安全性、隐私性和安全性以及包容性。Phi-3型号经过了严格的安全测量和评估、红队、敏感使用审查以及遵守安全指南，以帮助确保这些型号按照微软的标准和最佳实践进行负责任的开发、测试和部署。

在我们之前使用Phi模型（“课本就是你所需要的一切”）的基础上，Phi-3模型也使用高质量的数据进行训练。通过广泛的安全岗位培训，包括从人类反馈中强化学习（RLHF）、数十种伤害类别的自动测试和评估，以及手动红队，它们得到了进一步改进。我们的技术文件中详细介绍了我们的安全培训和评估方法，并在模型卡中概述了推荐用途和限制。请参阅模型卡集合。

解锁新功能

微软运送副驾驶的经验，以及使客户能够使用Azure人工智能通过生成人工智能转变业务的经验，凸显了在不同任务的质量成本曲线上对不同尺寸模型的日益增长的需求。像Phi-3这样的小型语言模型尤其适用于：

资源受限的环境，包括设备上和离线推理场景。
有延迟限制的场景，其中快速响应时间至关重要。
成本受限的用例，尤其是那些任务更简单的用例。

有关小型语言模型的更多信息，请参阅我们的Microsoft源代码博客。

由于其较小的尺寸，Phi-3模型可以用于计算有限的推理环境。特别是Phi-3-mini，可以在设备上使用，尤其是当使用ONNX Runtime进行进一步优化以实现跨平台可用性时。Phi-3型号的更小尺寸也使微调或定制变得更容易、更实惠。此外，它们较低的计算需求使其成为一种成本较低、延迟更好的选择。较长的上下文窗口允许对大型文本内容（文档、网页、代码等）进行理解和推理。Phi-3-mini展示了强大的推理和逻辑能力，使其成为分析任务的良好候选者。

客户已经在使用Phi-3构建解决方案。Phi-3已经证明其价值的一个例子是在农业领域，那里的互联网可能不容易访问。强大的小型模型，如Phi-3和微软副驾驶模板，可在需要时提供给农民，并提供以更低成本运行的额外好处，使人工智能技术更容易获得。

总部位于印度的领先企业集团ITC正在利用Phi-3作为他们与微软继续合作的一部分，为Krishi Mitra开发副驾驶，这是一款面向农民的应用程序，覆盖了100多万农民。

“我们使用Krishi Mitra副驾驶的目标是提高效率，同时保持大型语言模型的准确性。我们很高兴能与微软合作，使用经过微调的Phi-3版本来实现我们的目标——效率和准确性！”

Saif Naik，ITCMARS技术主管

Phi模型起源于Microsoft Research，已被广泛使用，Phi-2下载次数超过200万次。Phi系列模型在战略数据管理和创新方面取得了显著成绩 缩放比例。从用于Python编码的模型Phi-1开始，到增强推理和理解的Phi-1.5，再到27亿参数模型Phi-2，在语言理解方面的表现超过了其25倍。1每次迭代都利用了高质量的训练数据和知识转移技术 挑战传统 缩放定律。

立即开始

要亲自体验Phi-3，请先在Azure AI游乐场上玩该模型。你也可以在拥抱聊天的操场上找到这个模型。使用 Azure AI工作室。加入我们，在特别活动中了解更多关于Phi-3的信息 AI秀的直播。 

登录发表评论

Search

category

小尺寸的突破性性能

安全第一模式设计

解锁新功能

立即开始