Codex-软件玩家 - 软件改变生活！

admin管理员组
文章数量:1444896

Codex

1.简介

本文根据2021年OpenAI的《Evaluating Large Language Models Trained on Code》翻译总结的。

主要是介绍Codex，其是在GPT语言模型基础上，用来自GitHub上的开源代码进行微调的。学习了编写python代码的能力。GitHub Copilot 就是采用了Codex的能力。以前类似的模型有CodeBERT、PyMT5等。

我们发现可以训练语言模型来通过自然语言文本描述生成代码。

文中提出了3个模型，一个是基于GPT-3在代码上微调来通过文本描述生成代码的Codex模型（非监督学习）；一个是进行监督训练，通过文本描述生成代码的Codex-S模型；一个是通过代码生成代码文本描述的Codex-D模型。

2.评价框架

BLEU等基于匹配的评价规则不适用于评价生成的代码，故此我们使用pass@k评价。
如下式，对每个任务，我们生成n个代码样本（n>=k），计算正确代码样本的数量c，其都通过了单元测试

上式采用排列组合阶乘，可能产生非常大的数值，导致数值不稳定。下面代码提高了一个稳定的简化版本，其逐项评估。

Np.prod:返回给定轴上的数组元素的乘积。

3.人类手写的评价数据集

我们手写了164个代码来评估进行pass@k评估。示例如下：

4.代码微调Codex

我们用包括12B参数的GPT-3在代码上微调来产生Codex。
代码是在2020年5月从github上搜集的，每个python文件是1MB以下的。最终我们的数据集是159GB。

5.监督预训练Codex-S

我们尝试了一个监督微调模型，叫Codex-S。

我们从一些流行的代码测试、面试准备网站上搜集了一些代码，搜集了1万个训练样本；另外，是从github 含有CI（continuous integration）的工程，搜集了4万个训练样本。

训练目标是最小化negative log-likelihood。

6.Docstring（代码描述）生成：Codex-D

通过代码生成代码的描述文字。也是通过最小化negative log-likelihood。该模型，我们叫为Codex-D。

7.模型的缺点

1）我们创建的模型Codex-12B其能力还很弱，不如一个入门的计算机学生。增大训练数据应该会提升效果。
2）Codex可能失败，或者产生反直觉的行为；
3）以文本为条件的模型在变量绑定上有问题，尤其出现多变量时，如下面的w没处理。

本文标签： Codex

版权声明：本文标题：Codex 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/biancheng/1701562899a436991.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

Codex

编程

2023-12-3

OpenAI 推出 Codex —— ChatGPT 内的“软件工程智能体”

编程

20小时前

OpenAI 正在不断提升 ChatGPT 对开发者的实用性。几天前，他们新增了连接 GitHub 仓库 Connecting GitHub to ChatGPT deep research | OpenAI He

OpenAI推出ChatGPT编程智能体 Codex

编程

20小时前

B站：啥都会一点的研究生公众号：啥都会一点的研究生最近一周AI科技圈又发生了啥新鲜事？ OpenAI 推出 ChatGPT 编程智能体 Codex OpenAI 在

编程频道|软件玩家 - 软件改变生活！

Codex

Codex

1.简介

2.评价框架

3.人类手写的评价数据集

4.代码微调Codex

5.监督预训练Codex-S

6.Docstring（代码描述）生成：Codex-D

7.模型的缺点

更多相关文章

Codex

OpenAI 推出 Codex —— ChatGPT 内的“软件工程智能体”

OpenAI推出ChatGPT编程智能体 Codex

发表评论

推荐文章

手把手教你安装Jupyter Notebook

Linux：软链接和硬链接的理解

13.4 大语言模型文生图能力评测

销售预测模型分层及维度选择介绍

【蓝桥杯每日一题】3.20

热门文章

2025年适用于linux用户的高级web浏览器推荐

Flowable面试题

bilibilimini

重生之MySQL 索引失效六大陷阱

接口设计，接口返回信息，当账号不存在时候，应该返回200还是500,是直接返回R.fail()还是throw exception

强化学习如何让游戏角色“活”起来？

马斯克“逼疯”DOGE 团队：限时数月内“闪电式”重构6000万行代码，老程序员和IT专家吓傻了！

C# 12 中的 Span&amp;lt;T&amp;gt; 和 Memory&amp;lt;T&amp;gt;：高级开发人员的性能助推器

国内大厂复刻一个Manus，开源

ChatGPT 联网搜索面向所有用户开放，新增 Chrome 插件

最新文章

OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略

NLTK vs LLM：GraphRAG实体提取方法深度大比

JVM之符号引用和直接引用

ai共同开发

小米15小米15Pro一键获取root权限工具使用教程另外有小米14proUltra小米13pro小米13Ultra小米平板6spro

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

外星人Alienware M15 ALW15M-D3729S参数报价

海尔S15 Pro-M5i716GB1TB参数报价

海尔S15 Pro-M5i58GB512GB参数报价

技械骑士HZ60 13代酷睿i716GB512GB4G独显参数报价

ThinkPad L13 11代酷睿 i7 1165G716GB512GB集显 参数报价

C# 12 中的 Span<T> 和 Memory<T>：高级开发人员的性能助推器

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow

ThinkPad L13 11代酷睿 i7 1165G716GB512GB集显参数报价