OpenAI发布五项模型升级:价格还打五折修正GPT-4的“懒惰”问题

 尊龙人生就是博!下载     |      2024-02-20 11:12

  (郭晓静、郝博阳)北京时间1月26日凌晨,OpenAI一口气放出了五项模型升级的消息,发布新的API使用管理工具,并宣布即将降低GPT-3.5Turbo的价格。

  虽然大多数升级是对其已有模型的细微调整,但这次更新解决了ChatGPT近几个月来的一个核心痛点:“懒惰问题”——最近一段时间,很多用户和开发者都开始抱怨“GPT-4越来越频繁拒绝回答提示的问题”,很多人都猜测这与OpenAI越来越严格的对齐系统或训练集知识还停留在2021年9月有关。

  但不论原因如何,OpenAI总算出手了。在昨夜的更新中,OpenAI保证其新版本的GPT-4 Turbo会解决这一“懒惰问题”。

  OpenAI在官方网站发布的Blog表示,超过70%的通过其API使用GPT-4的用户已经转向GPT-4 Turbo,因为它的知识库更新得更多,这意味着绝大多数以GPT-4为底层的应用会收益于这一更新。虽然OpenAI App或页面版本中的GPT-4原版在这次并没有被升级。不过在声明中,OpenAI也保证了会在将来数月内全量释放GPT-4 Turbo。

  GPT3.5 Turbo也迎来了新一轮的更新,但更像是修bug。新的GPT-3.5 Turbo型号GPT-3.5-Turbo-0125提高了响应请求格式的准确性,并解决了与非英语函数调用相关的错误。下周发布。

  比起模型升级而言,GPT 3.5-Turbo的价格变化更引人注意,其输入价格下降了50%,输出下降了25%,这一价格又得让其他竞品睡不着觉了。

  除此以外,OpenAI还更新了两款嵌入模型text-embedding-3small和Text-embetting-3large。OpenAI将嵌入定义为“一系列数字,用来表示自然语言或代码等内容中的概念”。这有助于使用检索增强生成(一种从数据库中获取信息而不是生成答案的人工智能)的应用程序找出其访问的不同内容的关系。一款新版本的免费审核模型007,OpenAI称这是迄今为止最稳健的审核模型,能帮助开发人员识别潜在的有害文本。

  嵌入模型就像是内容的数字指纹,帮助机器学习模型理解自然语言或代码中的概念,让它们能够执行聚类、检索等任务。这些模型在ChatGPT和助手API中的应用非常广泛,也支持了许多开发者工具。

  新推出的text-embedding-3-small模型,性能比去年12月的text-embedding-ada-002模型有了显著提升。在多语言检索(MIRACL)的测试中,平均得分从31.4%飙升至44.0%,在英语任务(MTEB)的测试中,得分也从61.0%提高到了62.3%。而且,这个新模型的价格还降低了五倍,每1000个令牌的价格从0.0001美元降到了0.00002美元。

  至于text-embedding-3-large模型,它能够创建高达3072维的嵌入,性能更是出色。在MIRACL测试中,平均得分从31.4%提高到了54.9%,在MTEB测试中,得分也从61.0%提升到了64.6%。这个模型的价格是每1000个令牌0.00013美元。

  OpenAI 还提供了一种新功能,允许开发者根据需要调整嵌入的大小,这样即使在资源有限的情况下,也能保持模型的高效运行。比如,如果你的向量数据存储只支持1024维的嵌入,你可以使用text-embedding-3-large模型,并设置dimensions参数为1024,这样即使嵌入大小缩小,性能也不会受影响。

  在2023年全年中,GPT-3.5 Turbo的价格已经三次降价。OpenAI的说法是,更低的价格是为了帮助客户扩展规模。新模型的输入价格降低了50%至0.0005美元/千Token,输出价格降低了25%至0.0015美元/千Token。

  这个模型还将有各种改进,包括在请求格式中响应的准确性更高,以及修复了一个导致非英语语言功能调用文本编码问题的bug。

  新模型GPT-4-0125-preview在完成任务时更加彻底,减少了模型“偷懒”的情况。这个新模型还修复了非英语UTF-8生成的问题。

  根据OpenAI的说法,这是目前最强大的审核模型,可以帮助开发者识别潜在的有害文本。我们还提供了一些新的API密钥管理工具,让开发者能更清楚地了解自己的使用情况,并更好地控制API密钥。这些改进将帮助开发者在大型组织中更有效地管理API使用。

  首先,开发者现在可以从API密钥页面分配API密钥的权限。例如,可以为内部跟踪仪表板分配只读访问权限,或限制仅访问某些端点。

  其次,启用跟踪后,使用仪表板和使用导出功能现在可以在API密钥级别上暴露使用情况指标。这使得开发者可以通过为每个功能、团队、产品或项目设置单独的API密钥,简单地查看每个级别的使用情况。

  在未来几个月,OpenAI还计划进一步改进开发者查看API使用情况和管理API密钥的能力,特别是在大型组织中。