当前位置: 首页 > news >正文

带你读论文第三期:微软研究员、北大博士陈琪,荣获NeurIPS杰出论文奖

 Datawhale干货 

来源:WhalePaper,负责人:芙蕖

WhalePaper简介

由Datawhale团队成员发起,对目前学术论文中比较成熟的 Topic 和开源方案进行分享,通过一起阅读、分享论文学习的方式帮助大家更好地“高效+全面+自律”学习,让大家都有所收获和提升!方向包括自然语言处理(NLP)、计算机视觉(CV)、推荐(Res)等相关方向的论文解读和分享,后续将融入更多的方向。

开源地址:https://datawhalechina.github.io/whale-paper

WhalePaper | Github

本期活动

460087d2efffe67513f21d88aefc4e41.jpeg

分享时间:2023年7月29日(本六日) 20:00

分享方向:向量检索

分享工具:#腾讯会议:815-856-759

paper议程:分享45分钟,提问环节不限时。

分享大纲:

  1. 向量检索算法介绍与最新进展

  2. 向量数据库的算法与系统设计

嘉宾&论文概况


3073fb594dfafae61468141f5400e458.png

嘉宾简介:陈琪,微软亚洲研究院系统研究组的首席研究员。她于2010年和2016年在北京大学获得计算机科学学士学位和博士学位,在那里与导师肖臻教授一起从事分布式系统、云计算和并行计算的研究。2013年至2014年,她作为访问学生在纽约大学的系统组中,在李金扬教授的指导下从事分布式数组框架的研究。她在顶级会议和期刊上发表了20多篇论文,其中一些论文获得了重要奖项,如OSDI最佳论文奖和NeurIPS杰出论文奖。她目前的研究兴趣包括分布式系统、云计算和深度学习算法和框架。

专题题目:Vector Search and Vector Database

专题简介:近年来深度学习的最新进展使得各种类型的数据都能被映射为高维向量。目前最先进的向量搜索库主要关注如何在内存中进行快速高召回率的搜索。然而,在极大规模的向量搜索场景中存在一些挑战。例如,数百亿个向量与有限的内存结合在一起会导致容量问题。同时,扩展性也是一个问题,增加服务机器的数量会增加查询延迟和计算成本。此外,高维向量索引不具备单调性,而单调性是传统索引的一个关键属性。缺乏单调性使得现有的向量系统不得不依赖于保持单调性的临时索引,用于目标向量的TopK最近邻,以便实现近似相似性搜索和关系运算的复杂查询。这导致了性能的下降,因为很难预测最优的K值。

在本次演讲中,我们介绍了SPANN,一个分布式基于磁盘的ANNS系统,已经集成到Bing中,可以实现数百亿规模的向量搜索,并以毫秒级的响应时间。此外,我们还介绍了VBASE,一个向量数据库系统,它能有效处理基于一种称为放松单调性的共同属性的复杂查询。这种方法将两个看似不兼容的系统统一起来,提供了比现有最先进的向量系统高出三个数量级的性能。

参与方式

扫码加入WhalePaper群

9fa9f295e8f547bd4726d7b8aaa38666.jpeg

若群满请在公众号后台回复“paper”

WhalePaper负责人联系方式:

芙蕖(微信号:MePhyllis)

华挥(微信号:BuShouY)

15619b6885e0d89a1b46656f2363d22c.png

http://www.lryc.cn/news/99938.html

相关文章:

  • 农业中的计算机视觉 2023
  • 掌握三个基础平面构成法则 优漫动游
  • 叶工好容5-日志与监控
  • Dubbo 指定调用固定ip+port dubbo调用指定服务 dubbo调用不随机 dubbo自定义调用服务 dubbo点对点通信 dubbo指定ip
  • BCNet论文精读
  • PHP8的注释-PHP8知识详解
  • 优化企业集成架构:iPaaS集成平台助力数字化转型
  • 前端存储之sessionStorage和localStorage
  • 上海亚商投顾:沪指放量大涨1.84% 证券股掀涨停潮
  • 微服务划分的原则
  • 作业 - 3
  • MTK联发科安卓核心板MT8385(Genio 500)规格参数资料_性能介绍
  • ChatGPT付费创作系统小程序端开发工具提示打开显示无法打开页面解决办法
  • CVPR2023新作:pix2pix3D
  • Django自定义用户错误记录
  • Abaqus 导出单元刚度矩阵和全局刚度矩阵
  • Pytorch(一)
  • 图数据库Neo4j学习三——cypher语法总结
  • 2023杭电多校第一场部分题解
  • 算法38:反转链表【O(n)方案】
  • redis基本架构:一个键值数据库包含什么?(这篇文章主要是一个引导的作用)
  • HIS信息管理系统 HIS源码
  • 微信小程序之富文本那些事
  • kaggle新赛:RSNA 2023 腹部创伤检测大赛赛题解析(CV)
  • 【JavaEE初阶】Servlet (二) Servlet中常用的API
  • redis 存储原理与数据模型
  • 初识mysql数据库之事务的隔离性
  • 今天学学消息队列RocketMQ:消息类型
  • 小程序附件下载并预览功能
  • 数据库缓存服务——NoSQL之Redis配置与优化