跳转到主要内容

category

我们很高兴介绍Phi-3,这是一个由微软开发的开放式人工智能模型家族。Phi-3模型是可用的功能最强大、成本效益最高的小型语言模型(SLM),在各种语言、推理、编码和数学基准测试中都优于相同大小和下一大小的模型。此版本为客户扩展了高质量模型的选择范围,在他们编写和构建生成型人工智能应用程序时提供了更实用的选择。

从今天开始,Phi-3-mini,一种3.8B语言模型,可在Microsoft Azure AI Studio、Hugging Face和Ollama上使用。

  • Phi-3-mini有两种上下文长度变体——4K和128K代币。它是同类中第一个支持高达128K令牌的上下文窗口的模型,对质量几乎没有影响。
  • 它是经过指令调整的,这意味着它被训练来遵循反映人们正常沟通方式的不同类型的指令。这样可以确保模型可以开箱即用。
  • 它可以在Azure AI上使用,以利用部署评估微调工具链,也可以在Ollama上使用,供开发人员在笔记本电脑上本地运行。
  • 它已针对ONNX Runtime进行了优化,支持Windows DirectML,并支持图形处理单元(GPU)、CPU甚至移动硬件的跨平台支持。
  • 它还可以作为NVIDIA NIM微服务提供,具有可部署在任何地方的标准API接口。并针对NVIDIA GPU进行了优化。
  • 在未来几周,Phi-3系列将增加更多型号,为客户提供更大的质量成本曲线灵活性。Phi-3-小型(7B)和Phi-3-中型(14B)不久将在Azure AI模型目录和其他模型花园中提供。   

微软继续在质量成本曲线上提供最好的型号,今天的Phi-3版本通过最先进的小型型号扩大了型号的选择范围。

小尺寸的突破性性能


在关键基准测试中,Phi-3模型显著优于相同大小和更大大小的语言模型(请参阅下面的基准测试数字,越高越好)。Phi-3-mini比其两倍大的型号做得更好,Phi-3-small和Phi-3-medium的表现要好得多,包括GPT-3.5T。
所有报告的数字都是用相同的管道生成的,以确保数字具有可比性。因此,由于评估方法略有不同,这些数字可能与其他公布的数字不同。我们的技术文件提供了有关基准的更多详细信息。
注:Phi-3模型在事实知识基准(如TriviaQA)上表现不佳,因为模型尺寸越小,保留事实的能力越低。

安全第一模式设计


Phi-3模型是根据微软负责任人工智能标准开发的,这是一套基于以下六个原则的全公司要求:问责制、透明度、公平性、可靠性和安全性、隐私性和安全性以及包容性。Phi-3型号经过了严格的安全测量和评估、红队、敏感使用审查以及遵守安全指南,以帮助确保这些型号按照微软的标准和最佳实践进行负责任的开发、测试和部署。

在我们之前使用Phi模型(“课本就是你所需要的一切”)的基础上,Phi-3模型也使用高质量的数据进行训练。通过广泛的安全岗位培训,包括从人类反馈中强化学习(RLHF)、数十种伤害类别的自动测试和评估,以及手动红队,它们得到了进一步改进。我们的技术文件中详细介绍了我们的安全培训和评估方法,并在模型卡中概述了推荐用途和限制。请参阅模型卡集合。

解锁新功能


微软运送副驾驶的经验,以及使客户能够使用Azure人工智能通过生成人工智能转变业务的经验,凸显了在不同任务的质量成本曲线上对不同尺寸模型的日益增长的需求。像Phi-3这样的小型语言模型尤其适用于:

  • 资源受限的环境,包括设备上和离线推理场景。
  • 有延迟限制的场景,其中快速响应时间至关重要。
  • 成本受限的用例,尤其是那些任务更简单的用例。


有关小型语言模型的更多信息,请参阅我们的Microsoft源代码博客。

由于其较小的尺寸,Phi-3模型可以用于计算有限的推理环境。特别是Phi-3-mini,可以在设备上使用,尤其是当使用ONNX Runtime进行进一步优化以实现跨平台可用性时。Phi-3型号的更小尺寸也使微调或定制变得更容易、更实惠。此外,它们较低的计算需求使其成为一种成本较低、延迟更好的选择。较长的上下文窗口允许对大型文本内容(文档、网页、代码等)进行理解和推理。Phi-3-mini展示了强大的推理和逻辑能力,使其成为分析任务的良好候选者。

客户已经在使用Phi-3构建解决方案。Phi-3已经证明其价值的一个例子是在农业领域,那里的互联网可能不容易访问。强大的小型模型,如Phi-3和微软副驾驶模板,可在需要时提供给农民,并提供以更低成本运行的额外好处,使人工智能技术更容易获得。

总部位于印度的领先企业集团ITC正在利用Phi-3作为他们与微软继续合作的一部分,为Krishi Mitra开发副驾驶,这是一款面向农民的应用程序,覆盖了100多万农民。

“我们使用Krishi Mitra副驾驶的目标是提高效率,同时保持大型语言模型的准确性。我们很高兴能与微软合作,使用经过微调的Phi-3版本来实现我们的目标——效率和准确性!”

Saif Naik,ITCMARS技术主管


Phi模型起源于Microsoft Research,已被广泛使用,Phi-2下载次数超过200万次。Phi系列模型在战略数据管理和创新方面取得了显著成绩 缩放比例。从用于Python编码的模型Phi-1开始,到增强推理和理解的Phi-1.5,再到27亿参数模型Phi-2,在语言理解方面的表现超过了其25倍。1每次迭代都利用了高质量的训练数据和知识转移技术 挑战传统 缩放定律。

立即开始


要亲自体验Phi-3,请先在Azure AI游乐场上玩该模型。你也可以在拥抱聊天的操场上找到这个模型。使用 Azure AI工作室。加入我们,在特别活动中了解更多关于Phi-3的信息 AI秀的直播。