SWE-Lancer

SWE-Lancer

About

SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。

Categories

AI 编程开发模型国外精选编程研究基准测试软件工程模型评估经济影响

Tags

免费使用科学上网无需登录

Other

收录日期:2025/11/23 16:20:28

相关推荐

快捷AI导航

一站式AI工具导航网站,集纳市面领先AI工具,包括AI绘图、AI对话、AI编程、AI视频编辑、AI设计与AI音频处理等,提供最新、最全的AI资源。

Contacts

备案号:

粤ICP备2024207953号

© Copyright 2024 - 2025 www.quicknavig.com. All rights reserved.