CodeGeeX:多语言代码生成模型

CodeGeeX的多语言代码生成能力

直达下载
返回上一页
描述
CodeGeeX是一个基于华为MindSpore框架开发的多语言代码生成模型,具备130亿参数。
介绍

CodeGeeX是华为MindSpore框架下的一个先进的多语言代码生成模型,具有130亿参数,能够支持生成和翻译多种主流编程语言的代码。这款模型在鹏城实验室的“鹏城云脑II”平台上得到训练,使用了1536个昇腾910 AI处理器。

核心特性与优势

高精度代码生成

CodeGeeX在多种编程语言如Python、C++、Java等的代码生成上展示了卓越的性能,其在HumanEval-X代码生成任务上的求解率达到了47%至60%,显著优于其他开源模型。

跨语言代码翻译

模型不仅支持代码生成,还能进行高效的跨语言代码翻译。在HumanEval-X代码翻译任务上,CodeGeeX的正确率超越了多个基线模型,有效支持开发者在不同编程语言间迁移和转换代码。

自动编程插件

CodeGeeX还提供了一个VSCode插件,通过这个插件,用户可以利用模型的少样本生成能力来自定义代码生成风格,从而更好地辅助代码编写。

模型跨平台支持

所有代码和模型权重都已开源,供研究使用。CodeGeeX支持在昇腾及英伟达平台上进行推理,确保了广泛的适用性和访问性。

HumanEval-X评测基准

HumanEval-X是一个全新的多语言、多任务代码生成与翻译评测基准。该基准包含820个高质量的代码生成题目和测试用例,覆盖了Python、C++、Java、JavaScript和Go等五种编程语言,是评估代码生成和翻译模型性能的重要工具。

home_open_CodeGeeX_1

VSCode插件极大地提升了我的编程效率和代码质量。我认为CodeGeeX不仅是技术的飞跃,也是提高开发效率的利器。期待CodeGeeX能够支持更多编程语言,并继续优化其算法,为全球开发者社区带来更多的便利和创新。

AI工具教程
免费领取AI学习资料 进AI副业交流群
礼物
AI工具教程
免费领取AI学习资料 进AI副业交流群