论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 58阅读
  • 0回复

[业界新闻]Mistral发布首个代码生成人工智能模型Codestral 但不可用于商业活动 [复制链接]

上一主题 下一主题
 

发帖
6188
今日发帖
最后登录
2024-09-19
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-05-30 10:13:11
  由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral发布了首个用于编码的生成式人工智能模型,名为Codestral。Codestral与其他代码生成模型一样,旨在帮助开发人员编写代码并与之交互。 O:=|b]t  
u}LX,B-n(  
  Mistral在一篇博文中解释说,它接受过80多种编程语言的训练,包括Python、Java、C++和JavaScript。Codestral可以完成编码功能、编写测试和"填充"部分代码,还能用英语回答有关代码库的问题。 ]v\egfW,W  
MAD}Tv\S7  
  Mistral将这种模式描述为"开放",但这还有待商榷,因为这家初创公司的许可证禁止将Codestral及其产出用于任何商业活动。虽然有"开发"的例外,但即使是"开发"也有注意事项:许可证明确禁止"员工在公司业务活动中的任何内部使用",究其原因可能是Codestral部分训练内容受版权保护。Mistral在博文中没有证实或否认这一点,但这并不奇怪;有证据表明,这家初创公司以前的训练数据集包含版权数据。 +=~%S)9F  
[aM'  
  无论如何,Codestral可能不值得这么麻烦。该模型有220亿个参数,需要一台强大的电脑才能运行。(参数基本上决定了人工智能模型处理问题的能力,比如分析和生成文本)。虽然根据一些基准测试(我们都知道,这些基准测试并不可靠),该模型击败了竞争对手,但这并不能说明它有多厉害。 oBNX8%5w  
11y .z^  
  虽然Codestral对大多数开发人员来说并不实用,而且在性能提升方面也是渐进式的,但它肯定会引发关于依赖代码生成模型作为编程助手是否明智的争论。 T<e7(=  
1.95 ^8  
  至少在某些编码任务中,开发人员肯定会使用生成式人工智能工具。在2023年6月的Stack Overflow民意调查中,44%的开发人员表示,他们现在在开发过程中使用人工智能工具,26%的开发人员计划不久后使用。然而,这些工具有明显的缺陷。 !MJe+.  
)x8;.@U  
  GitClear对过去几年中提交到项目仓库的超过1.5亿行代码进行了分析,发现生成式人工智能开发工具正在导致更多错误代码被推送到代码库中。普渡大学的一项研究显示,OpenAI的ChatGPT对编程问题给出的答案有一半以上是错误的。 71.\`'  
lHKf#|  
  但这并不能阻止Mistral等公司试图将其模式货币化(并获得心智份额)。今天上午,Mistral在其Le Chat对话式人工智能平台上推出了托管版Codestral以及付费API。Mistral表示,它还致力于将Codestral纳入LlamaIndex、LangChain、Continue.dev和Tabnine等应用框架和开发环境。 ta4JWllf