淘优惠

淘优惠

azure人工智能开发操作系统

双十一活动 0

你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 。

  • 项目

通过 【【微信】】 可使用很多不同模型,这些模型按系列和功能分组。 模型系列通常按其预期任务关联模型。 下表介绍了 【【微信】】 中当前可用的模型系列。 目前并非所有模型都可在所有区域中使用。 若需查看完整的细分情况,请参阅本文中的模型功能表。

模型系列 说明
GPT-3 可以理解和生成自然语言的模型系列。 这包括新的 ChatGPT 模型。
Codex 可以理解和生成代码(包括将自然语言翻译为代码)的模型系列。
嵌入 一组可以理解和使用嵌入的模型。 嵌入是一种特殊的数据表示格式,可由机器学习模型和算法轻松使用。 嵌入是一段文本的语义含义的信息密集表示。 目前,我们提供了三个系列的嵌入模型以实现不同的功能:相似性、文本搜索和代码搜索。

每个模型系列都有一系列模型,这些模型按功能进一步区分。 这些功能通常由名称标识,并且这些名称的字母顺序通常指示给定模型系列中该模型的相对功能和成本。 例如,GPT-3 模型使用 Ada、Babbage、Curie 和 Davinci 等名称来指示相对功能和成本。 Davinci 比 Curie 功能更强大(且成本更高),而 Curie 又比 Babbage 功能更强大(且成本更高),依此类推。

备注

功能较低的模型(如 Ada)可执行的任何任务都可以由功能较高的模型(如 Curie 或 Davinci)执行。

【【微信】】 的模型名称通常对应于以下标准命名约定:

元素 说明
模型的模型功能。 例如,GPT-3 模型使用 ,而 Codex 模型使用 。
模型的相关系列。 例如,GPT-3 模型包括 、、 和 。
(仅限嵌入模型)模型支持的嵌入的输入类型。 例如,文本搜索嵌入模型支持 和 。
模型的版本标识符。

例如,我们最强大的 GPT-3 模型称为 ,而我们最强大的 Codex 模型称为 。

名为 、、 和 的旧版 GPT-3 模型不遵循标准命名约定,它们主要用于微调。 有关详细信息,请参阅了解如何为应用程序自定义模型。

可以使用模型列表 API 获取 【【微信】】 资源可用于推理和微调的模型列表。

建议从模型系列中功能最强大的模型开始,以确认模型功能是否满足你的要求。 然后可以继续使用该模型,也可以迁移到功能和成本较低的模型,围绕此模型的功能进行优化。

GPT-3 模型可以理解和生成自然语言。 该服务提供四个模型功能,每个都有不同级别的能力以及适用于不同任务的速度。 Davinci 是功能最强大的模型,而 Ada 是速度最快的模型。 模型排序(按功能从高到低的顺序):

虽然 Davinci 能力最强,但其他模型提供了显着的速度优势。 我们的建议是让用户在试验时从 Davinci 开始,因为它能产生最佳结果并验证 【【微信】】 可以提供的价值。 原型正常工作后,就可以优化模型选择,为应用程序实现最佳延迟/性能平衡。

Davinci 是功能最强大的模型,可以执行其他模型能够执行的任何任务,并且所用的指令通常更少。 对于需要深入理解内容的应用程序(例如面向特定受众的摘要和创意内容的生成),Davinci 将产生最佳结果。 Davinci 提供的这些增加的功能需要更多计算资源,因此 Davinci 的成本更高,并且 Davinci 不如其他模型快。

Davinci 擅长的另一个领域是理解文本的意图。 Davinci 擅长解决多种逻辑问题并解释字符动机。 Davinci 已经能够解决一些涉及因果关系的最具挑战性的 AI 问题。

用途:复杂的意图、因果关系、受众摘要

Curie 功能强大,但速度很快。 虽然 Davinci 在分析复杂文本方面更强大,但 Curie 可以执行许多精细化的任务,例如情绪分类和摘要。 Curie 也善于回答问题和执行问答,适合用作常规服务聊天机器人。

用途:语言翻译、复杂分类、文本情绪、摘要

Babbage 可以执行简单的分类等简单任务。 在语义搜索方面,它的功能也很强大,可对文档与搜索查询的匹配程度进行排名。

用途:中等分类、语义搜索分类

Ada 通常是最快的模型,可以执行的任务有分析文本、地址更正和不需要太多细微差别的某些分类任务等等。 Ada 的性能通常可以通过提供更多上下文来改进。

用途:分析文本、简单分类、地址更正、关键字

ChatGPT 模型 (gpt-35-turbo) 是一种专为对话接口设计的语言模型,该模型的行为方式与以前的 GPT-3 模型不同。 以前的模型是文本输入和文本输出,这意味着它们接受了提示字符串并返回了一个会追加到提示的补全。 但是,ChatGPT 模型是对话传入和消息输出。模型需要摄入具体的类似聊天脚本形式的提示字符串,并返回作为聊天中模型编写的消息的补全。

ChatGPT 模型使用的补全API与你用于其他模型(如 text-da【【微信】】)的相同,但它需要独特的提示格式。 请务必使用新的提示格式来获得最佳结果。 如果没有正确的提示,模型往往会很详细,并且提供不太有用的回复。 若要了解详细信息,请查看我们的详尽操作说明。

Codex 模型是基模型 GPT-3 的子代,可以理解和生成代码。 它们的训练数据包含自然语言和来自 GitHub 的数十亿行公开代码。

它们最擅长 Python,并且精通十几种语言,包括 C#、Ja【【微信】】、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL 和 Shell。 Codex 模型排序(按功能从高到低的顺序):

类似于 GPT-3,Davinci 是功能最强大的 Codex 模型,可以执行其他模型能够执行的任何任务,并且所用的指令通常更少。 对于需要深入了解内容的应用程序,Davinci 会生成最佳结果。 更强的功能需要更多计算资源,因此 Davinci 的成本更高,并且不如其他模型快。

Cushman 功能强大,但速度很快。 虽然 Davinci 在分析复杂任务方面更强大,但 Cushman 是能够执行许多代码生成任务的模型。 Cushman 通常也比 Davinci 运行速度更快、成本更低。

目前,我们提供了三个系列的嵌入模型以实现不同的功能:

  • 相似度
  • 文本搜索
  • 代码搜索

每个系列都包含某一功能范围的模型。 以下列表根据模型功能指示服务返回的数字向量长度:

  • Ada:1024 个维度
  • Babbage:2048 个维度
  • Curie:4096 个维度
  • Davinci:12288 个维度

Davinci 功能最强,但比其他模型更慢更贵。 Ada 功能最弱,但速度更快且更成本更低。

此类模型擅长捕获两个或更多文本片段之间的语义相似性。

用例 模型
聚类分析、回归、异常情况检测、可视化

此类模型有助于度量长文档是否与短搜索查询相关。 此系列支持两种输入类型:(用于嵌入要检索的文档)和 (用于嵌入搜索查询)。

用例 模型
搜索、上下文相关性、信息检索

与文本搜索嵌入模型类似,此系列支持两种输入类型:(用于嵌入要检索的代码片段)和 (用于嵌入自然语言搜索查询)。

用例 模型
代码搜索和相关性

使用嵌入模型时,请注意其限制和风险。

<【【微信】】 <【【微信】】 <【【微信】】 <【【微信】】ne-0021
模型 ID 支持补全 支持嵌入 基本模型区域 微调区域 最大请求(令牌) 训练数据(上限)
ada 空值 美国东部2、美国中南部、欧洲西部 2,049 2019 年 10 月
美国东部2、美国中南部、欧洲西部 空值 2,049 2019 年 10 月
【【微信】】 空值 美国东部2、美国中南部、欧洲西部 2,049 2019 年 10 月
text-【【微信】】-001 美国东部2、美国中南部、欧洲西部 空值 2,049 2019 年 10 月
curie 空值 美国东部2、美国中南部、欧洲西部 2,049 2019 年 10 月
美国东部2、美国中南部、欧洲西部 空值 2,049 2019 年 10 月
davinci1 空值 美国东部2、美国中南部、欧洲西部 2,049 2019 年 10 月
text-【【微信】】 美国中南部、欧洲西部 空值
text-da【【微信】】 美国东部、美国中南部、欧洲西部 空值 4,097 2021 年 6 月
美国东部 空值 4,097 2021 年 6 月
空值 美国东部、西欧
gpt-35-turbo3 (ChatGPT) 空值 美国东部、美国中南部 4,096 2021 年 9 月

1 仅能通过请求获取该模型。 目前,我们不接受使用该模型的新请求。 2 由于需求高,美国东部区域的新用户目前无法进行微调。 请使用美国中南部区域进行位于美国的训练。 3 目前,此模型只有版本 可用。 此版模型将于 2023 年 8 月 1 日弃用,改用较新版本的 gpt-35-model。 有关更多详细信息,请参阅 ChatGPT 模型版本控制。

模型 ID 支持补全 支持嵌入 基本模型区域 微调区域 最大请求(令牌) 训练数据(上限)
code-cushman-0011 美国中南部、欧洲西部 美国东部2、美国中南部、欧洲西部 2,048
code-da【【微信】】 美国东部、西欧 空值 8,001 2021 年 6 月
code-davinci-fine-tune-0021 空值 美国东部2、西欧

1 仅能通过请求将该模型用于微调。 目前,我们不接受微调该模型的新请求。 2 由于需求高,美国东部区域的新用户目前无法进行微调。 请使用美国中南部区域进行位于美国的训练。

<【【微信】】001 <【【微信】】e-001 <【【微信】】001 <【【微信】】y-001、 <【【微信】】c-001 <【【微信】】ery-001 <【【微信】】doc-001 <【【微信】】query-001
模型 ID 支持补全 支持嵌入 基本模型区域 微调区域 最大请求(令牌) 训练数据(上限)
text-ada-embeddings-002 美国东部、美国中南部、欧洲西部 空值 8,191 2021 年 9 月
美国东部、美国中南部、欧洲西部 空值 2,046 2020 年 8 月
text-similarity-【【微信】】-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国东部、美国中南部、欧洲西部 空值 2046 2020 年 8 月
text-similarity-【【微信】】 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
text-search-【【微信】】-doc-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
text-search-【【微信】】-query-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
美国中南部、欧洲西部 空值 2,046 2020 年 8 月
【【微信】】-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
【【微信】】-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
code-search-【【微信】】-code-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月
code-search-【【微信】】-text-001 美国中南部、欧洲西部 空值 2,046 2020 年 8 月

详细了解 【【微信】】



Anthropic:出走OpenAI,Google站队,AGI是天使还是魔鬼?

《出走/escapade》,出走/escapade,出走escapade电影,出走escapade

来源:火讯财经

文章转载来源:看见Metaverse

作者:Armin 编辑:penny 排版:Lydia

来源:海外独角兽

图片来源:由

工具生成

在 GPT 4 发布的同时,被认为是 OpenAI 重要对手的 Anthropic 也在今天公开了 Claude,一个表现不亚于 ChatGPT 的产品。

在 AI 中,意图和结果的偏差被称为对齐问题(alignment problem)。对齐问题发生在现实生活中时,会带来严重的道德风险。比如亚马逊曾经使用 AI 帮助筛选简历,由于训练的数据多数都是男性的简历,当 AI 遇到女性的简历时就会给打低分。

对齐问题时刻发生在我们的日常生活中,比如当我们去面试、申请贷款、甚至体检时,我们都有可能在不知情的情况下受到 AI “偏见”的影响。因此让 AI 和人类价值观保持一致非常重要。

虽然大语言模型技术快速发展,但前 OpenAI 研究和安全副总裁 Dario Amodei 认为大模型里面仍有很多安全问题未得到解决,这促使他带领 GPT-2 和 GPT-3 的核心作者们离开 OpenAI 创立 Anthropic。

Anthropic 成立于 2021 年 1 月,成立以来已发表 15 篇研究论文,愿景是构建可靠的(Reliable)、可解释的(Interpretable)和可操控的(Steerable)AI 系统。Constitutional AI 是 Anthropic 最重要的研究成果之一,让人类为 AI 指定一套行为规范或原则,而不需要手工为每个有害输出打标签,就可以训练出无害的人工智能模型。2023 年 1 月,Anthropic 开始公开测试基于 Constitutional AI 技术的 Claude 的语言模型助手,经过多方面的对比,仍处测试阶段的 Claude 毫不逊色于 OpenAI 的 ChatGPT

成立至今,Anthropic 目前团队 80 人左右,融资额超过 13 亿美元,最新估值 41 亿美元。历史投资人包括 Skype 创始人 Jaan Tallinn、FTX 创始人 Sam Bankman-Fried 、Google、Spark Capital 和 Salesforce 【【微信】】。Anthropic 已经和 Google、Salesforce 达成了战略合作,使用 Google 提供的云服务,并且集成到 Slack 中。

Anthropic 团队豪华、愿景远大,与 OpenAI 和 DeepMind(Google)并列成为目前 AI 前沿模型领域排名前三的公司,并且是其中唯一没有与大厂深度绑定的创业公司。其大语言模型 Claude 是 OpenAI ChatGPT 最大的竞争对手。

以下为本文目录,建议结合要点进行针对性阅读。

举报/反馈