最近,由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral发布了首个用于编码的生成式人工智能模型,名为Codestral。
Codestral旨在帮助开发人员编写代码并与代码交互,支持包括Python、Java、C++和JavaScript在内的80多种编程语言。
据悉,Codestral有220亿参数,支持32K上下文窗口,使用了80多种编程语言数据集进行了预训练,例如,Python、Java、C、C++、JavaScript等。Codestral可提供代码生成、解释代码、编写注释文档、BUG调试、代码优化等,几乎所有与代码开发相关的任务。
在性能方面,Codestral凭借超大的32K上下文窗口,在HumanEval、MBPP、CruxEval-O、RepoBench等知名测试平台的结果,超过了CodeLlama 70B、DeepSeek Coder 33B和Llama 3 70B目前比较知名的纯代码模型。
在特定代码测试领域,Codestral的Python、C++、bash、Java和PHP的能力同样非常强,所以,这也算是当前最好的纯代码模型之一。
目前,Codestral只能用于学术研究和测试,无法实现商业化。