小红书-社区搜索部 (NLP、CV算法实习生) 一面面经
😄 整个流程按如下问题展开,用时60min左右面试官人挺好,前半部分问问题,后半部分coding一道题。
各位有什么问题可以直接评论区留言,24小时内必回信息,放心~
文章目录
- 1、自我介绍
- 2、介绍下项目:微信-多模态小视频分类
- 2.1、看你用了cross-att来融合多模态信息,cross-att是怎么做的?
- 2.2、如何处理文本,ocr,asr输入模型?
- 3、resnet和vit区别在哪?
- 4、swin-trm相比vit做了什么改进?
- 5、有无对ocr,asr里的噪音进行处理?
- 6、有无关注类别里的长尾问题?如何处理的?
- 7、focal-loss原理?