当前位置: 首页 > news >正文

生成式人工智能展望报告-欧盟-01-引言

在这里插入图片描述

原文地址

摘要

这份由欧盟委员会联合研究中心(JRC)编写的展望报告研究了生成人工智能(GenAI)的变革作用。它强调了GenAI在创新、生产力和社会变革方面的潜力。GenAI是一项颠覆性技术,因为它能够以前所未有的规模生产类似人类的内容。因此,它为各个部门的发展提供了多种机会,包括医疗保健,教育,科学和创意产业。与此同时,GenAI也带来了重大挑战,包括可能放大错误信息、偏见、劳动力中断和隐私问题。所有这些问题都是跨领域的,因此,GenAI的快速发展需要多学科方法来充分理解其影响。在这种背景下,展望报告首先概述了GenAI的技术方面,详细介绍了它们目前的能力,并概述了新兴趋势。然后,它侧重于经济影响,研究GenAI如何改变行业动态,并需要调整技能和战略。GenAI的社会影响也得到了解决,重点是包容性的机会以及偏见和过度依赖的风险。考虑到这些挑战,监管框架部分概述了欧盟目前的立法框架,如人工智能法案和横向数据立法,以促进可信和透明的人工智能实践。最后,针对特定行业的“深度挖掘”研究了GenAI带来的机遇和挑战。本节强调需要谨慎的管理和战略政策干预,以最大限度地发挥其潜在效益,同时降低风险。该报告的结论是,GenAI有可能在欧盟带来重大的社会和经济影响,需要采取全面和细致入微的政策方法来应对挑战和机遇,同时确保技术发展与民主价值观和欧盟法律的框架完全一致。

文章目录

  • 摘要
  • Introduction – Section 1
  • Technological Aspects – Section 2
  • Economic Implications – Section 3
  • Societal Impact and Challenges – Section 4
  • Regulatory Framework – Section 5
  • Sectoral examples of benefits and challenges brought by GenAI – Section 6
  • Conclusions – Section 7
  • GENAI带来的机遇和挑战的部门实例
    • 教育
    • 网络安全
    • 创意产业
    • 科学
    • 健康
    • 公共部门
  • Introduction
    • 1.1生成式人工智能的出现:从研究到广泛采用
      • 生成式人工智能的定义和范围
      • 历史角度
      • KEY TECHNOLOGICAL ENABLERS
      • 研究与创新景观
      • 采用和影响
      • 挑战
    • 1.2技术关键参与者的现状
      • Genai玩家的全球分布
      • 欧盟在创新格局中的地位:研究与创新
      • 筹资和投资方面的挑战
      • 增长和创新的机会
    • 1.3 GenAI的基础:数据结构、数据和模型
      • 数据在GENAI中的作用
      • 数据量、互操作性和可访问性
      • 数据隐私和安全问题
      • 容量、网络和连接性考虑因素
      • 模型复杂性和尺寸
      • 开源模式与专有模式
    • 1.4为什么对欧盟政策制定者重要
      • GENAI的战略重要性
      • 欧盟的政策和监管格局
      • 科学与政策界面的挑战和机遇

生成人工智能(GenAI)的潜力正在重塑我们的社会技术经济格局。这份“展望报告”旨在指导政策制定者了解GenAI的多方面影响。它旨在对这种变革性技术带来的当前趋势、未来情景和政策讨论进行前瞻性分析。通过借鉴联合研究中心(JRC)的最新科学知识和专家见解,该报告为各个政策领域的政策制定者提供了资源,包括数字技术,就业,竞争,环境,卫生,教育,工业,司法和基本权利等。虽然该报告并不声称是一个权威的研究分析,但它提供了对当前趋势的前瞻性研究见解,可以帮助决策者探索更广泛的专题领域。这种方法可以确保即使技术发展迅速,政策制定者也能获得跨多个领域的全面概述。

Introduction – Section 1

GenAI不仅仅是一项技术进步,因为它代表了数字技术如何交叉和塑造我们的社会和经济的根本转变。GenAI的出现,从其学术研究的根源到目前作为一种变革性技术的地位,都是由关键的技术推动因素推动的。能够处理和学习大型数据集的AI算法的开发,以及高性能计算的可用性,再加上深度学习架构的进步,都有助于GenAI所体现的新兴范式转变。这种新技术的自适应特性允许跨不同领域的应用程序;通用模型可以用于下游用例,而无需重新训练,用于各种任务。欧洲具有独特的优势,可以利用其强大的研究环境,以学术机构和私人创新者网络为特征,推动进步并促进GenAI的有效采用。然而,欧洲GenAI初创企业面临的竞争压力凸显了战略投资支持其增长的必要性。

Technological Aspects – Section 2

GenAI的技术格局正在不断发展,已经看到了新兴的能力趋势,如人工智能,多模式人工智能和高级人工智能推理。这些进步有可能提高生产力,显著增强决策和跨部门的多功能性,但也带来了与问责制,治理和偏见有关的挑战。开发标准化的评估方法对于建立对GenAI模型的信任至关重要,因为我们将继续探索这些新系统的功能并增加我们对局限性的理解。政策制定者必须反思这些进步,以确保道德监督,并在人工智能系统中执行透明度和可解释性标准,以帮助解决人工智能开发的道德界限,并促进GenAI技术的可持续整合。

Economic Implications – Section 3

GenAI可以通过推动行业转型和新业务模式的出现来影响经济结构。预计它将在各部门大幅提高生产率,并促进创造就业机会。数字化成熟度对于GenAI的采用至关重要,尤其是对于需要开发数字化技能、业务流程和基础设施的中小企业。就业政策必须考虑到GenAI引起的劳动力市场动态,包括对收入不平等、职业结构调整和技能需求变化的影响。鼓励劳动力的复原力、适应力和培训将有助于满足这些不断变化的需求。

Societal Impact and Challenges – Section 4

GenAI为社会进步提供了机遇和挑战。从积极的方面来看,GenAI可以推动更包容和公平地获得资源和机会,提高创造性技能,或使更广泛的受众能够获得复杂的分析和知识。然而,它也提出了重要的考虑因素,例如过度依赖和偏见人工智能生成的内容。政策制定者必须关注这些挑战,以确保负责任的部署,特别要注意虚假信息、心理健康问题、深度伪造以及通过人工智能输出延续的社会偏见的风险。GenAI的迅速采用也凸显了潜在的重大技能差距,需要企业、教育机构和政策制定者协调努力,对劳动力进行培训、技能提升和技能再培训。通过采取专注于培养人工智能素养的综合战略,社会可以更好地为劳动力和公民做好准备,以有效地利用GenAI的潜力。

Regulatory Framework – Section 5

欧盟的监管格局在GenAI的开发和使用方面担当着重要角色。《人工智能法》和《一般数据保护条例》(GDPR)是这一努力的核心,它们在促进创新的同时确保透明度、信任以及安全和基本权利的保护。《人工智能法》通过法律的要求协调GenAI系统的发展,使人工智能系统更加透明和可信。《数字服务法》(DSA)要求对超大型在线平台和搜索引擎(包括使用GenAI产生的系统性风险)造成的系统性风险进行适当评估和缓解。这些法规还旨在促进与可信人工智能特别相关领域的技术创新,如水印和指纹技术。政策制定者必须继续研究这些框架的应用细节,以应对GenAI应用带来的新挑战,例如在知识产权和数据保护领域。

Sectoral examples of benefits and challenges brought by GenAI – Section 6

报告中的深入分析揭示了GenAI在特定领域的变革潜力,同时需要谨慎管理相关风险和道德因素。

Conclusions – Section 7

报告最后强调了GenAI在欧盟带来重大社会和经济影响的潜力,并指出需要采取全面和细致入微的政策方法来应对挑战和机遇,同时确保技术发展与民主价值观和欧盟法律的框架完全一致。

GENAI带来的机遇和挑战的部门实例

教育

  • 机会:GenAI有可能重新定义教学和学习。这项技术可以帮助提供更个性化的学习体验,根据学生的表现和兴趣调整任务的难度和性质。同样,它可以使个人辅导民主化,并使解决问题,批判性思维和创造力的新方式成为可能。
  • 挑战:存在过度依赖人工智能完成任务和提高生产力的风险,而不是更深入的概念探索和学习。这可能会破坏批判性思维,解决问题和教育工作者的作用。此外,还需要进行更多的研究,以更好地了解使用GenAI可以在多大程度上有效地增强教学和学习。确保人工智能工具用于补充传统教学方法,而不是取代它们至关重要。此外,有必要防止欺骗性操纵,偏见,并确保在教育环境中道德地使用人工智能。

网络安全

  • 机会:GenAI有可能增强威胁检测和响应能力。GenAIis的使用可以带来更强大和更积极的网络安全措施,使专家和普通用户都受益。
  • 挑战:GenAI带来了复杂的网络安全挑战,包括传统威胁和AI特有的漏洞,如数据和模型中毒、对抗性攻击和即时注入。随着人工智能系统越来越多地嵌入到网络安全中,确保它们被负责任地使用并且不会引入新的漏洞至关重要。

创意产业

  • 机会:GenAI正在彻底改变内容创作,使艺术家和设计师能够通过分析观众偏好和趋势来创作创新作品。这项技术允许创建人工智能生成的音乐,视频和艺术,促进专注于数字体验的新商业模式。
  • 挑战:一个主要的挑战是风格同质化的可能性,因为人工智能模型通常依赖于现有的趋势,而不是创造全新的趋势。人们对知识产权产生了重大担忧,因为人工智能生成的作品可能会侵犯原创艺术家的创作。

科学

  • 机会:GenAI正在通过提供前所未有的效率和创造力来重塑科学过程,并允许开发新的方法来支持科学工作。它通过使科学工具的使用民主化和促进跨学科合作,从而加速研究和创新,促进进步。
  • 挑战:人工智能在科学中的整合带来了潜在的偏见和强化主导叙事等风险。确保人工智能工具用于补充人类专业知识,而不是掩盖它,保持科学完整性将至关重要。

健康

  • 机会:GenAI通过分析大型数据集来检测模式并预测疾病进展,提高诊断准确性并个性化患者护理。它支持早期诊断和治疗计划,提高医疗效率并赋予患者权力。
  • 挑战:数据隐私和道德使用需要谨慎关注。也有人担心数据偏差、卫生不公平现象的传播以及临床医生的潜在技能下降。应对这些挑战需要在医疗保健工作流程中负责任地使用,并在IT基础设施方面进行重大投资。

公共部门

  • 机会:GenAI有潜力通过提高效率、透明度和响应能力来改变公共部门的管理和服务提供。人工智能驱动的解决方案可以增强决策过程,提高公民参与度,优化资源分配,从而提供更好的公共服务。
  • 挑战:GenAI有潜力通过提高效率、透明度和响应能力来改变公共部门的管理和服务提供。人工智能驱动的解决方案可以增强决策过程,提高公民参与度,优化资源分配,从而提供更好的公共服务。

Introduction

本章提供了对生成AI(GenAI)的基本理解,探索了它从研究到广泛采用的演变。它首先研究了GenAI的出现,突出了关键的技术推动因素及其对各个部门的影响。本章然后过渡到当前的技术状态,确定主要参与者和技术进步,定义其今天的景观。关注的是支撑GenAI的基础设施、数据和模型,这对GenAI的可扩展性和有效性至关重要,同时将安全和负责任的使用作为优先事项。最后,本章强调了GenAI对欧盟政策制定者的战略重要性,讨论了其增强欧盟数字主权和竞争力的潜力。讨论的关键问题包括监管的挑战,道德考虑以及GenAI的社会经济影响。

1.1生成式人工智能的出现:从研究到广泛采用

关键信息

  • GenAI的出现代表了人工智能领域的范式转变,其特征是使用生成模型来创建文本、图像或其他类型的内容。
  • 从学术研究的根源到目前的变革性技术,GenAI在技术进步和强大的研究生态系统的推动下继续快速发展。
  • 随着欧盟和其他全球参与者驾驭GenAI带来的机遇和挑战,战略和道德方法对于充分发挥其社会和经济效益的潜力至关重要。

生成式人工智能的定义和范围

GenAI指的是一类专注于创建新内容的人工智能,无论是文本、图像、视频、音乐还是代码。与传统的描述性或预测性AI模型不同,GenAI模型从大量数据集中学习,以生成模仿人类创造力的原始输出。这一能力使GenAI成为一项变革性技术,其应用范围从医疗保健到科学研究等(见缩略语和定义列表)。

历史角度

GenAI的发展可以追溯到机器学习和神经网络的基础研究。最初,人工智能专注于基于规则的系统和狭窄的应用程序。然而,计算能力和算法设计的进步使大型深度神经网络模型能够过渡到实际应用。这种演变反映了人工智能作为一种具有广泛商业和社会影响的技术的更广泛转变。推动GenAI的技术革命的开创性性质仅由其商业发展的惊人速度证明(参见第4.3节,从媒体中提取的时间轴的扩展版本)。主流新闻来源关于媒体报道的主要主题的时间轴峰值使用EMM 1围绕主要GenAI主题聚集(第4.3节报告了进一步分析,其中还讨论和分析了随着时间的推移的媒体数量)。

在这里插入图片描述
在这里插入图片描述

KEY TECHNOLOGICAL ENABLERS

在GenAI的崛起过程中,几项技术进步发挥了关键作用。其中的核心是开发能够有效处理和学习大型数据集的人工智能算法。大型计算密集型深度学习架构(例如Transformer)1的引入,使模型能够理解上下文并生成连贯的内容,这有助于增强GenAI的能力。GPU(图形处理单元)和TPU(张量处理单元)等基础设施元件也非常关键。这些硬件组件有助于训练和运行大规模GenAI模型所需的密集型计算,使其成为该技术成功不可或缺的部分。此外,海量数据集的可用性为GenAI模型的训练提供了原始材料。结合5G连接、高性能计算的进步以及支持真实自然语言交流的大型语言模型(LLM)的开发,这些数据集允许更大规模地开发和训练GenAI模型,确保该技术能够满足多样化应用的需求。

研究与创新景观

GenAI研究领域的特点是学术机构和私营部门创新者的网络。中国在与该技术相关的学术出版物总数方面处于领先地位,欧盟排名第二,但与其他参与者相比,中国面临着影响创新潜力的资金缺口(见第3.1节)。这种研究环境得到了大学,研究机构和合作项目网络的支持,这些项目推动了创新和知识共享。

欧盟强调道德人工智能和数据隐私,旨在从研究到广泛采用的安全过渡。这一重点确保GenAI应用程序符合欧洲价值观,促进利益相关者之间的信任和接受,同时也支持竞争力。这使得欧盟的做法与其他全球参与者相比与众不同。

采用和影响

GenAI的广泛采用在各个领域都很明显,包括公共管理,教育,医疗保健和工业。在教育领域,GenAI工具在与适当的教学方法相结合时,有可能改变教学和学习过程。例如,在医疗保健领域,GenAI有助于医学成像和药物发现,为诊断和治疗提供新的可能性,支持患者赋权和个性化医疗。第6节对此进行了分析。GenAI的影响超出了具体应用,影响了更广泛的社会和经济动态。作为创新的驱动力,GenAI为经济增长和创造就业机会提供了机会,同时也带来了与第3节所讨论的技能差距和劳动力流失有关的挑战。

挑战

尽管GenAI具有潜力,但它的出现并非没有挑战。道德考量,如人工智能生成内容的偏见和人工智能决策的透明度需求,仍然是确保负责任部署必须解决的关键问题。此外,监管环境在GenAI的开发和使用中发挥关键作用。政策制定者必须处理与市场动态、环境影响、数据保护、知识产权、错误信息和虚假信息以及第3-5节中详述的人工智能应用的道德影响相关的复杂问题。

1.2技术关键参与者的现状

关键信息:

  • 欧盟强大的研究环境,在GenAI出版物中排名全球第二,结合对道德AI的关注,提供了竞争优势。然而,融资和投资挑战可能会影响增长潜力,与美国相比,欧盟GenAI初创企业面临着巨大的风险资本资金缺口。
  • 通过利用其优势并应对这些挑战,欧盟可以继续在GenAI技术的开发和部署中发挥主导作用。

Genai玩家的全球分布

GenAI活动在数字生态系统中的比重越来越大,超过72,000名玩家2参与了超过149,000项活动。这方面的活动是指研究出版物、创新(专利)以及商业和投资活动。图1说明了GenAI格局的竞争性质以及处于其发展前沿的地区。关于玩家和活动的数量,中国以玩家和活动的最高份额领先,其次是美国。欧盟GenAI参与者大致分为商业(37%),创新(33%)和研究(31%)活动,与全球份额相比,研究活动的比例更高。如图1所示,欧盟占全球参与者的7%,仅次于中国(60%)和美国(12%)。韩国紧随欧盟之后,占全球玩家的6%。根据JRC DGTES数据集,英国和日本各占全球玩家的2%。值得注意的是,虽然中国在GenAI参与者的数量上处于领先地位,但美国仍然是全球商业创新和部署的中心,OpenAI、Anthropic、谷歌DeepMind和微软等公司都部署了GPT-4、Claude 3.5和Gemini Ultra。

在这里插入图片描述

欧盟在创新格局中的地位:研究与创新

欧盟在GenAI中保持着强大的地位,特别是在研究和创新方面。它在GenAI的学术出版物方面排名全球第二,突出了其强大的研究环境(见图2)。这些发现补充了Renda等人(2025)3的研究结果,表明欧洲在科学出版物方面领先于美国,仅次于中国。

近年来,欧盟对人工智能的研究和创新活动加速,2019年至2021年期间平均每年增长32%。在过去十年中,GenAI的专利呈指数级增长,到2024年累计申请专利超过12万项。然而,如图3所示,欧盟专利申请仍仅占全球专利申请的2%,这表明需要持续投资开发GenAI创新专利生态系统。欧盟在创新方面的地位落后于韩国和美国,这两个国家分别申请了全球7%和6%的专利。在欧盟范围内,33%从事专利活动的企业位于德国,其次是法国(12%)、荷兰和西班牙(9%)。请注意,出于分析的目的,我们重点关注优先权专利申请,即为创新提交的第一份专利申请。优先权专利申请确定了优先权日期,即可以要求发明的新奇和独创性的官方日期。优先权专利申请的使用被认为是说明创新活动的最有效方式之一,因为它们代表了为发明寻求保护的第一步,避免了在为不同市场寻求发明保护时过度计算的风险,并且跟踪它的延迟比授予专利更少。

在这里插入图片描述
在这里插入图片描述

筹资和投资方面的挑战

欧洲GenAI初创企业在获得资金方面面临挑战,美国公司的风险资本(VC)投资要高得多。这种差异凸显了欧盟初创企业面临的竞争压力,以及支持其增长的战略投资需求。虽然随着时间的推移,德国和法国已经吸引了大量的风险投资(见图4),但需要更强劲的投资来培育和进一步发展充满活力的欧盟GenAI生态系统。
平衡这些考虑因素与创新和竞争力的需求,以及全球范围内风险资本投资与其他领域的差距,是欧洲GenAI参与者面临的一个关键挑战。
在这里插入图片描述

增长和创新的机会

各行业对人工智能驱动的解决方案的需求不断增长,为GenAI带来了重大机遇。随着各行业寻求利用人工智能的力量来提高效率、生产力和创造力,GenAI参与者有能力利用这些趋势并提供创新的解决方案。跨境合作和伙伴关系提供了更多的增长途径。通过利用欧盟各地的各种专业知识和资源,GenAI参与者可以提高他们的能力,扩大他们在全球市场的影响力。

1.3 GenAI的基础:数据结构、数据和模型

关键信息:

  • 必须共同考虑与每个领域的数据、基础设施和模型相关的挑战和机遇,以促进人工智能的平衡发展。人工智能工厂与欧洲共同数据空间一起作为旗舰计划,可以以协调和值得信赖的方式整合这些关键组件,同时将分散的数据基础设施相互连接,并建立基于欧盟价值观和现有法律的框架的治理方法。
  • 随着GenAI的不断发展,解决与数据治理、互操作性、隐私和计算能力相关的挑战至关重要,以释放其全部潜力。此外,开源模型应该优先考虑,以增强创新、透明度和可解释性。
  • 加强对AI就绪数据的理解和进展至关重要。此外,投资于数据访问方法,涉及移动算法而不是数据,可以帮助减轻交换大型数据集造成的网络压力。
  • 不断增长的能源需求和网络安全是GenAI模型在不久的将来面临的最关键挑战之一。研究人工智能的能源效率,特别是通过开发较小的模型和使用专用硬件,对于解决这些问题至关重要。

数据在GENAI中的作用

数据是GenAI的生命线,是训练、优化和验证AI模型的主要输入。GenAI生成新内容的能力取决于其从大量数据集中学习的能力,这些数据集提供了多样化和丰富的信息,如文本,音频和图像,因此需要开发多模式基础模型。因此,获取高质量、多样化的数据集是GenAI应用程序有效性和竞争力的关键决定因素。数据量之大提出了关于数据可用性、可访问性和管理的重要问题。虽然完全消除偏见和定义代表性可能具有挑战性,但意识到偏见并制定衡量偏见的方法是提高数据质量和相关性的重要步骤。

数据量、互操作性和可访问性

第一代GenAI的快速发展,特别是大型语言模型(LLM),主要是由互联网上大量用户生成内容的培训驱动的。然而,许多现有的基于网络的公共领域数据已经被用于当前的模型中,人工智能生成的内容正在迅速传播到各个领域。这是有问题的,因为越来越多的证据(例如,Shumailov等人,2024)5表明,如果在人工智能生成的数据上反复训练,模型可能会崩溃,或者其性能会迅速恶化。虽然在这些数据上进行训练本身并没有问题,但真实的问题是由此产生的渐进分布偏移,因为它降低了模型准确预测低概率事件的能力。反过来,这些对于解决与少数群体或边缘化群体有关的问题至关重要,对于LLM工业应用所需的复杂系统预测也至关重要。随着人工智能生成的内容越来越多地充斥互联网,一个紧迫的挑战是如何识别GenAI生成的数据,并防止它们污染训练循环,或者至少以避免中毒的方式管理它们的集成。最后,解决与数据来源相关的问题将对多种人工智能应用产生积极影响。这具有重要的社会意义,例如,确保数据来源可以帮助减少虚假信息的传播。

所有这些加在一起,凸显了探索可以集成到即将推出的GenAI应用程序中的新“看不见”数据集的必要性。这种访问将使新应用程序的开发成为可能,并最终为利用这一机会的企业和国家提供竞争优势。与此同时,欧洲的数据格局非常分散,这对数据的互操作性和可访问性带来了进一步的挑战,需要通过共同的互操作性标准、技术构件和治理办法加以解决。调整数据共享实践以遵守公平原则,6即确保数据可查找,可扩展,可互操作和可重用,在分散的数字生态系统中变得更加突出。为应对这些挑战,正在即将出台的欧洲数据联盟战略的更广泛背景下开发欧洲共同数据空间,旨在解决与大规模共享异构数据有关的技术和组织问题。

数据隐私和安全问题

随着GenAI的应用越来越广泛,个人和敏感数据的处理需要强大的保障措施来保护个人隐私并防止未经授权的访问。欧盟对数据隐私的重视,例如GDPR等法规,突出了在GenAI背景下解决这些问题的重要性(见第5节)。隐私保护技术,如差分隐私和联邦学习,提供了潜在的解决方案,以减轻隐私风险,同时允许在模型训练中有效地使用数据。这些方法能够在不损害个人隐私的情况下从数据中提取见解。或者,GenAI可用于生成可用于训练和改进模型的合成数据。创建这些数据是为了模仿原始数据的重要统计属性,同时确保保护用户隐私,使其成为训练模型的有用工具,同时保护用户隐私。虽然合成数据的生成和使用需要谨慎的预防措施,以避免获取机密信息,并尽量减少对原始数据的任何歪曲,但使用合成数据肯定有其优势和潜力。

容量、网络和连接性考虑因素

GenAI的计算需求是巨大的,需要能够支持AI模型训练和部署的先进基础设施。可扩展的计算环境、高速连接和高效的数据存储解决方案都是GenAI基础设施的关键组成部分。GenAI的成功依赖于强大硬件的可用性,如GPU和TPU,这有助于模型训练所需的密集计算。因此,数据中心基础设施的扩展和优化对于支持GenAI的增长至关重要。另一方面,考虑到所需的大量能源,对计算能力的日益增长的需求引起了强烈的环境问题(见第4.5节)。

最近公布的500强人工智能超级计算机名单显示,欧盟拥有约50台此类机器,而美国拥有134台,中国拥有200多台。他们占总数的80%。然而,美国最近部署的超级计算机在计算性能方面占据主导地位,其中最先进的xAI Colossus仅集成了多达20万个AI芯片,超过了整个欧盟的总和(同一来源报告的只有122,000个)。同一来源提供了部署这些超级计算机运行所需硬件的估计成本。性能和成本之间存在密切关系,这表明如果欧盟希望缩小与美国和中国在计算性能方面的差距,将需要大量投资。

除了计算能力,高速、低延迟的网络对于实时AI交互和分布式系统之间的无缝数据交换至关重要。下一代接入(NGA)–一种基于光纤的高速宽带基础设施,特别是5G和即将到来的6G网络–的部署增强了GenAI应用在不同环境中高效运行的能力。GÉANT网络是高带宽网络互连研究和教育网络以支持人工智能开发等方面的领先例子。最后,各系统之间的数据移动和共享可能是资源密集型的,因此需要对数据管理采取战略性办法。边缘计算和数据压缩技术等选项可以帮助降低与数据传输相关的成本和效率低下,从而更有效地利用网络资源。

模型复杂性和尺寸

GenAI模型以令人印象深刻的计算强度为代价显示出令人印象深刻的能力。能力或模型复杂性可以被描述为学习和表示数据中日益复杂的关系的潜力,通常随着模型所具有的(超)参数的数量而增长。参数(或模型大小)的数量每六个月翻一番(标度律),遵循指数轨迹。如今,可用模型的大小在大模型的情况下是数百万亿的参数,并且对于较小的模型是数十亿。GenAI模型的性能并不完全取决于其大小。它的架构、训练技术以及训练数据的数量和质量也起着重要作用。这就是为什么欧盟正在投资高性能计算(HPC)和千兆工厂,以支持在中心开发人工智能模型,这些模型可以提供足够的计算能力和访问目前正在形成的欧洲共同数据空间所支持的数据。

欧盟正在投资数据实验室,以确保来自不同来源的高质量数据可用于人工智能培训。能够最大限度地减少训练所需的数据量是一个关键目标,数据集浓缩代表了一类用于从大数据集生成小合成训练集的技术。压缩的优点是保留了原始数据的机密性,因为合成数据被生成为输出。然而,凝聚在计算方面极具挑战性,限制了其目前在非常大的数据集上的适用性。作为对压缩的补充,值得强调的是,数据访问的范式有可能最大限度地减少对大量数据传输的需求-这也可能需要用于培训目的-因为,移动的不是数据,而是算法。

作为替代方案,小型模型吸引了大量关注,因为它们具有需要更少计算资源的优势,这对于在边缘运行模型非常重要。11与大型云服务器相比,边缘设备的内存和计算能力有限,因此小型模型有可能进一步推广GenAI模型的采用和使用。蒸馏是一种技术,用于使用大型模型(教师)作为参考来微调(教授)小型模型(学生),以便任务-通常相当具体-可以以低得多的成本进行。

开源模式与专有模式

开源和专有模型之间的选择是GenAI的一个重要考虑因素。就其本质而言,开源模型是可定制和可适应的,允许开发人员在现有框架上构建并根据特定需求定制模型。对底层代码的开放访问确保了透明度和可解释性,从而促进了道德、问责制和可重复性,同时最大限度地减少了识别和缓解安全风险所需的时间。此外,通过消除许可成本(开源通常是这种情况),开源GenAI模型是高度可访问的(例如个人,研究机构和中小企业),并避免供应商锁定。开源的这些核心特征与欧盟的价值观产生了很好的共鸣,例如民主,协作,包容性和包容性。12毫不奇怪,开源在欧盟推动人工智能模型开发的潜力,有助于其开放创新的品牌,在最近的人工智能大陆行动计划中得到了强调。在战略自主权和确保开放源代码业务能够像专有业务一样迅速扩展的必要性方面,有一些重要因素需要考虑。这些因素突出表明需要谨慎的管理和战略规划,以应对开源增长的独特挑战和动态。

在GenAI的背景下,开放性的概念相当不明确。从技术上讲,当所有组件(用于训练和运行模型的源代码、模型权重、模型架构和数据使用信息)14都发布时,GenAI模型可以被定义为开源;训练数据也可以共享,但由于法律的和版权限制,这并不总是可能的。这导致了关于什么构成开源模型的几次讨论,但也导致了对开放性的普遍高估(一种被称为开放式清洗的做法),因为在许多情况下,模型权重是唯一可用的组成部分。这些模型通常被称为开放权重模型。15除其他外,辩论涉及法国Mistral AI(https://mistral.ai)、来自中国DeepSeek模型(https://www.deepseek.com/en)和一些美国模型,如来自Google AI的BERT(https:github.com/google-research/ bert)和Gemma(https://ai.google.dev/gemma)。然而,其中一些也发布了一些最小的训练代码和相关文档,但不提供对训练数据的访问。由于其许可证引入的限制,Meta的LlaMa模型(https://www.llama.com)不能被视为开源。完全开源的GenAI模型的一个例子是来自艾伦AI(https://www.example.com olmo)的Olmo模型系列,其中底层模型代码、权重、架构、文档和数据使用信息与训练数据一起提供。allenai.org/关于后者,在https://playground.allenai.org的playground环境中,用户可以看到并访问用于生成模型回复的确切文档。GenAI模型的这种不同程度的开放性(在代码、权重、文档、训练数据、硬件架构、说明书、许可证等方面)可以通过欧洲开源AI指数进行评估

相比之下,专有的GenAI模型不提供其开源替代品的好处,但它们可以通过独特的功能和能力提供多样化的竞争优势。这些包括专门的商业支持和维护、增强的性能、知识产权保护、用户友好的界面以及非技术用户的访问/交互工具。流行的例子包括所有一体的通用模型,如OpenAI的GPT系列(https:openai.com)和Google的Gemini(https:gemini.google.com)。

平衡这些考虑因素涉及评估创新,控制和可访问性之间的权衡。模型的选择(开源还是专有)取决于开发人员和用户的特定目标和需求。混合方法也是可能的,例如,开源模型与支持特定应用程序的专有算法进行了微调,并在安全的私有云上进行部署和扩展,以便敏感数据保持在组织的控制范围内,而不会暴露给第三方供应商。

1.4为什么对欧盟政策制定者重要

关键信息:

  • GenAI作为欧盟的战略资产具有巨大的潜力,为经济增长、创新和社会进步提供了机会。
  • 对于欧盟政策制定者来说,当前的任务是驾驭GenAI格局的复杂性,解决与监管、道德和技能相关的挑战,同时利用增长和竞争力的机会。
  • GenAI的快速发展为政策制定者提出了挑战,以跟上最新的发展,并确保法规是有效的和最新的,需要持续研究政策合作,以确保政策的预期证据。

GenAI是一项技术突破,对欧盟来说可能是一项战略资产。为了确保欧盟利用这种变革性技术的好处,同时与欧洲价值观保持一致,它需要关注一些关键领域,包括了解GenAI的社会经济和道德层面。

GENAI的战略重要性

GenAI代表了一项关键的技术进步,有可能推动各行业的经济增长和创新,同时保护欧盟公民和企业的权利。对于欧盟决策者来说,GenAI是一个与数字主权和竞争力相关的战略工具。通过领导GenAI的开发和部署,欧盟可以维护其作为全球技术领导者的地位,影响管理人工智能技术、模型和系统的国际标准和规范。这在医疗保健、机器人和辅助技术等领域尤为重要,GenAI可以在这些领域带来重大变革。GenAI在改变行业和公共部门(包括医疗保健、教育和公共管理)方面的潜力凸显了其战略重要性。政策制定者可以利用GenAI来应对紧迫的社会挑战,改善公共服务,并促进支持社会经济弹性和创造就业机会的创新生态系统。此外,半导体技术的创新,如神经形态芯片和边缘人工智能芯片,可以为更可持续的人工智能部署提供一条道路,这对于欧盟平衡气候中立目标与保持人工智能的全球竞争力至关重要。

欧盟的政策和监管格局

欧盟为人工智能(包括GenAI)建立了全面的政策和监管格局,重点是促进创新、信任和保护基本权利。人工智能法案18建立了一种基于风险的方法,对高风险人工智能系统提出了更严格的要求,包括用于关键基础设施、医疗保健和执法的系统(见第5.1节,了解对GenAI的具体影响)。此外,欧盟委员会还设立了欧洲人工智能办公室,以监督该法规的实施,提供指导,并支持欧盟人工智能的发展和采用。欧盟委员会宣布投资近7亿欧元,用于地平线欧洲和数字欧洲计划的呼叫,作为GenAI4EU发展倡议的一部分,20此外,欧盟正在投资人工智能工厂,这将加强欧洲人工智能领域的合作,推动人工智能应用的发展。作为同一计划的一部分,欧洲数字创新中心(见第3.2节)还将支持中小企业、中型企业、初创企业和公共部门组织的工人继续学习。欧盟还通过多项举措支持人工智能科学(见第6.3节扩大相关影响),包括欧洲人工智能研究理事会,也被称为欧洲人工智能科学资源(RAISE),该委员会将汇集资源,推动人工智能的技术边界,促进科学突破。

欧盟的人工智能监管框架还包括适用于人工智能系统中个人数据处理的《通用数据保护条例》(GDPR),以及监管在线平台和服务(包括使用人工智能的平台和服务)的《数字服务法》(DSA)。第5.2节和第5.3节进一步分析了GenAI的影响。欧盟还通过了横向数据立法(第5.5条),以促进有竞争力和值得信赖的数据经济。对于GenAI开发人员来说,该框架提供了访问多样化,高质量数据集的机制,同时确保遵守数据权利,实现跨部门和跨境数据共享,以支持AI培训和创新。它包括《数据治理法》,旨在加强对自愿数据共享的信任;21《数据法》,明确了数据访问权并促进企业对企业的数据共享; 22和《高价值数据集(HVD)实施条例》,以促进高价值数据集的再利用。23战略经济部门和公共利益领域的具体欧洲共同数据空间,以及欧洲健康数据空间条例。

科学与政策界面的挑战和机遇

随着GenAI的不断发展,欧盟政策制定者面临着一些必须解决的挑战,以最大限度地发挥其效益。主要挑战之一是需要全面了解GenAI的技术-社会-经济方面,这是一种前瞻性方法,需要建立一个持续的技术展望进程,以扫描变化信号,分析趋势,并通过多利益攸关方和多专业知识合作了解新出现的发展及其影响。这样一个预期因素将有助于为政策建议提供信息,指导融资战略,并促进欧洲机构和国际合作伙伴之间的协调。这种积极主动的姿态确保欧盟保持适应性,准备好应对GenAI带来的机遇和风险。

政策制定者,包括私人和公共决策者,必须继续投资于教育和培训计划,使个人具备与人工智能系统一起工作所需的技能,并利用其潜力。随着人工智能生成的内容激增,在教育、艺术和公共话语中过度依赖和依赖此类技术的风险引发了新的社会和伦理问题。虽然人工智能,特别是GenAI,可以增强人类的创造力和生产力,实现更快的工作流程和替代教育体验,但它也可以抑制批判性思维,细致入微的理解和人类技能的发展,同时破坏我们在这种系统不可用的情况下采取行动的能力。生产力提高和认知侵蚀之间的这种紧张关系要求政策制定者鼓励明智地采用人工智能,特别是在教育和医疗保健等敏感领域。人工智能应该是增强人类能力的工具,而不是取代它们。

以上内容全部使用机器翻译,如果存在错误,请在评论区留言。欢迎一起学习交流!

郑重声明:

  • 本文内容为个人对相关文献的分析和解读,难免存在疏漏或偏差,欢迎批评指正;
  • 本人尊重并致敬论文作者、编辑和审稿人的所有劳动成果,若感兴趣,请阅读原文并以原文信息为准;
  • 本文仅供学术探讨和学习交流使用,不适也不宜作为任何权威结论的依据。
  • 如有侵权,请联系我删除。xingyezn@163.com
http://www.lryc.cn/news/596736.html

相关文章:

  • Vue开发常用
  • 2025 年最新 AI 技术:全景洞察与深度解析​
  • 操作系统:系统调用(System Calls)
  • 深入理解程序链接机制:静态链接、ELF加载与动态库实现原理
  • 计算机底层入门 05 汇编学习环境通用寄存器内存
  • [LLM]Synthetic Visual Genome
  • gflags使用
  • 【锁】MySQL中有哪几种锁?
  • 【C语言进阶】动态内存管理(1)
  • Claude Code Kimi K2 环境配置指南 (Windows/macOS/Ubuntu)
  • NumPy库使用教学,简单详细。
  • 一些Avalonia与WPF内容的对应关系和不同用法
  • numpy的详细知识点,简单易懂
  • 【Linux系统】基础IO
  • HTTP 协议常见字段(请求头/响应头)
  • 【初识数据结构】CS61B 中的堆以及堆排序算法
  • 数据库设计mysql篇
  • 第六章 工具调用
  • linux辅助知识(Shell 脚本编程)
  • 基于LangGraph的Open Deep Research架构全解析:从多Agent协作到企业级落地
  • 元宇宙游戏与VR的关联性及发展分析(截至2025年7月)
  • 工业互联网时代,如何通过混合SD-WAN提升煤炭行业智能化网络安全
  • 【上市公司变量测量】Python+FactSet Revere全球供应链数据库,测度供应链断裂与重构变量——丁浩员等(2024)《经济研究》复现
  • Spring之【Bean工厂后置处理器】
  • 从重复劳动到自动化:火语言 RPA 的实践与思考
  • 《计算机“十万个为什么”》之 MQ
  • Java从入门到精通!第十一天(Java常见的数据结构)
  • .net 警告【代码 CS1998】此异步方法缺少 “await“ 运算符,将以同步方式运行。
  • Qt字符串处理与正则表达式应用
  • SSL VPN技术