当前位置: 首页 > news >正文

马克·扎克伯格解释为何开源AI对开发者有利

Meta 今天发布了 Llama 3.1 系列人工智能模型,在人工智能领域取得了重大进展,其性能可与领先的闭源模型相媲美。值得一提的是,在多项人工智能基准测试中,Llama 3.1 405B 模型的性能超过了 OpenAI 的 GPT-4o 和 Claude 3.5 Sonnet。

除了性能,Llama 3.1 的突出特点还在于其开源性。完整的 Llama 3.1 模型(包括权重)现在可供下载,Meta 甚至更新了许可证,允许在 Llama 3.1 模型输出上进行训练。

Meta 创始人兼首席执行官马克-扎克伯格(Mark Zuckerberg)在另一篇博文中表达了他对开放式人工智能生态系统的愿景。他认为 Llama 有潜力成为"人工智能的 Linux"。正如 Linux 通过其开源特性已成为云计算和移动操作系统的行业标准一样,扎克伯格设想开源人工智能也能实现类似的普及。

他强调说,开源的 Llama 3.1 已经可以与最先进的模型竞争,在某些情况下甚至超过了它们。展望未来,他预测未来的 Llama 模型将引领行业发展。

扎克伯格阐述了开源人工智能为何有利于开发者和行业的理由,详情如下。

我们需要训练、微调和提炼自己的模型。每个组织都有不同的需求,而满足这些需求的最佳方法就是使用不同规模的模型,并根据特定数据进行训练或微调。设备上的任务和分类任务需要小型模型,而更复杂的任务则需要大型模型。现在,您可以使用最先进的 Llama 模型,继续使用自己的数据对其进行训练,然后将其提炼为最适合您的模型,而我们或其他任何人都不会看到您的数据。

我们需要掌握自己的命运,而不是被锁定在一个封闭的供应商中。许多组织不希望依赖于自己无法运行和控制的模式。他们不希望封闭模式的供应商能够改变其模式、更改使用条款,甚至完全停止为他们提供服务。他们也不希望被锁定在对模型拥有独占权的单一云中。开放源代码可以为公司提供一个广泛的生态系统,这些公司拥有兼容的工具链,您可以在它们之间轻松切换。

我们需要保护数据。许多组织需要处理敏感数据,这些数据需要安全保护,但又不能通过云 API 发送给封闭模型。其他组织则根本不信任封闭模型提供商,不信任他们的数据。开放源代码可以解决这些问题,让您在任何地方运行模型。众所周知,开源软件往往更加安全,因为其开发过程更加透明。

我们需要一个运行高效且经济实惠的模型。开发人员可以在自己的基础架构上运行 Llama 3.1 405B 的推理,其成本大约是使用 GPT-4o 等封闭模型的 50%,既可用于面向用户的推理,也可用于离线推理任务。

我们希望投资于将成为长期标准的生态系统。很多人都看到,开放源代码的发展速度比封闭模式更快,因此他们希望在能长期为他们带来最大优势的架构上构建自己的系统。

扎克伯格还解释了为什么开源人工智能对 Meta 有利。Meta不需要完全依赖封闭的人工智能系统公司及其政策,而是可以不受任何限制地进行真正的创新。此外,Meta 过去在开源项目(如 Open Compute Project 和 PyTorch)上的成功记录,也进一步强化了这种方法对长期发展和创新的益处。

您可以点击这里阅读马克-扎克伯格的博客文章全文。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

http://www.lryc.cn/news/405555.html

相关文章:

  • 游戏外挂的技术实现与五年脚本开发经验分享
  • 认识神经网络【多层感知器数学原理】
  • MySQL入门学习-SQL高级技巧.CTE和递归查询
  • 键盘是如何使用中断机制的?当打印一串字符到显示屏上时发生了什么???
  • Spring Boot 接口访问频率限制的实现详解
  • 前端页面:用户交互持续时间跟踪(duration)user-interaction-tracker
  • 中文分词库 jieba 详细使用方法与案例演示
  • EXO-helper解释
  • Qt开发网络嗅探器01
  • mysql面试(三)
  • 阿里云公共DNS免费版自9月30日开始限速 企业或商业场景需使用付费版
  • 捷配生产笔记-一文搞懂阻焊层基本知识
  • html 常用css样式及排布问题
  • 【SpingCloud】客户端与服务端负载均衡机制,微服务负载均衡NacosLoadBalancer, 拓展:OSI七层网络模型
  • 【Elasticsearch】Elasticsearch 中的节点角色
  • pip install与apt install区别
  • 分表分库是一种数据库架构的优化策略,用于处理大规模数据和高并发请求,提高数据库的性能和可扩展性。
  • 【ffmpeg命令入门】获取音视频信息
  • 【IoTDB 线上小课 05】时序数据文件 TsFile 三问“解密”!
  • python-爬虫实例(4):获取b站的章若楠的视频
  • C# yaml 配置文件的用法(一)
  • 人工智能与机器学习原理精解【4】
  • Go channel实现原理详解(源码解读)
  • 数据结构-C语言-排序(4)
  • 灰色关联分析【系统分析+综合评价】
  • linux 部署flask项目
  • ES6 数值的扩展(十八)
  • 面试知识储备-redis和redission
  • 【5本可选】保证知网检索,现在投稿可在8月见刊,对文科领域友好
  • SpringBoot入门:如何新建SpringBoot项目(保姆级教程)