当前位置: 首页 > news >正文

Talk | EMNLP 2023 最佳长论文:以标签为锚-从信息流动的视角分析上下文学习

本期为TechBeat人工智能社区561线上Talk。

北京时间1月4(周四)20:00,北京大学博士生王乐安的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 以标签为锚-从信息流动的视角分析上下文学习,介绍了他的团队在上下文学习相关的分析工作所做的研究。

Talk·信息

主题:以标签为锚-从信息流动的视角分析上下文学习

嘉宾:北京大学博士生 王乐安

时间:北京时间 1月4日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=840

Talk·介绍

上下文学习无需参数更新,直观易用,非常契合大语言模型时代的需求。近来,已经有许多工作从不同角度分析了上下文学习。我们的工作从信息流动的角度审视了上下文学习,提出并验证了“标签词在上下文学习中起锚点作用”的假设。进一步地,基于这一假设,我们提出了三个应用,展示了我们的分析结论的应用潜力。

Talk大纲

1、背景 - 上下文学习相关的分析工作

2、猜想 - 上下文学习中存在”以标签为锚”的信息流动

3、猜想验证与应用 - 介绍我们如何验证这一猜想以及这一猜想存在什么应用

4、进一步讨论 - 我们的工作和其他同期的机制可解释性工作的相似性与关联

Talk·预习资料

Image

论文链接:https://arxiv.org/abs/2305.14160

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Image

王乐安

北京大学博士生

王乐安,北大博士生,由孙栩老师指导。他目前的研究兴趣主要在于大模型的可解释性与机理。他在EMNLP 2023上发表的工作Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning获得了最佳长论文奖。在此之前,他在北大图灵班(智能方向)获得了学士学位。

个人主页: https://www.techbeat.net/grzytrkj?id=36706


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

http://www.lryc.cn/news/276896.html

相关文章:

  • 2024年中国电子学会青少年编程等级考试安排的通知
  • [足式机器人]Part3 机构运动学与动力学分析与建模 Ch00-2(2) 质量刚体的在坐标系下运动
  • 【亚马逊云科技】自家的AI助手 - Amazon Q
  • 网络安全—SSL安全访问应用
  • Qt5.14.2实现将html文件转换为pdf文件
  • Minecraft教程:使用MCSM面板搭建我的世界私服并实现远程联机
  • springboot学生成绩管理系统源码和论文
  • w20webshell之文件上传
  • 【Redis】非关系型数据库之Redis的主从复制、哨兵和集群高可用
  • 从私有Git仓库的搭建到命令的使用及部署再到分支管理
  • mysql基础-常用函数汇总
  • COCO数据格式的json文件内容
  • AI-数学-高中-3.二次函数的根的分布问题的解题方法
  • golang中gorm使用
  • centoss7安装mysql详细教程
  • SpringBoot-拓展
  • 用于查询性能预测的计划结构深度神经网络模型--大数据计算基础大作业
  • MySQL5.7用于控制副本服务器的 SQL 语句
  • stable diffusion 人物高级提示词(四)朝向、画面范围、远近、焦距、机位、拍摄角度
  • C#.Net学习笔记——设计模式六大原则
  • go 修改postgresql的配置参数
  • 解决word图片格式错乱、回车图片不跟着换行的问题
  • 密码学(二)
  • mysql进阶-视图
  • 力扣-34. 在排序数组中查找元素的第一个和最后一个位置
  • Cesium笔记 初始化 使用Vue-Cesium 组件
  • QTday2作业
  • scVI与MultiVI
  • java Servlet体育馆运营管理系统myeclipse开发mysql数据库网页mvc模式java编程计算机网页设计
  • 2、UML类图