【人人都是程序员?英伟达发布AI编程模型】
这一新模型通过使用名为Stack v2的新代码数据集实现,比Stack v1大七倍。新的训练技术使得该模型能够更好地理解低资源编程语言如COBOL、数学和程序源代码讨论等。
StarCoder2经过619门编程语言培训后,可以执行诸如源代码生成、工作流生成和文本摘要等专业任务。开发人员可以利用它进行代码补全、高级代码总结和代码片段检索等操作,从而提高工作效率。
相较于初版StarCoder LLMs,新的30亿参数模型进一步精简和筛选了优质参数,并且其性能相当于150亿参数模型的初版StarCoder。此外,该系列产品的使用权采用BigCode Open RAIL-M许可证,允许免费访问和使用。