当前位置: 首页 > news >正文

ModelScope 垂类检测系列模型介绍

文章目录

  • ModelScope介绍
  • 垂类模型介绍
  • 调用方式
    • 1 Demo Service
    • 2 Notebook
    • 3 本地使用
    • * 二次开发
  • 总结

ModelScope介绍

ModelScope 是阿里达摩院推出的 中文版模型即服务(MaaS, Model as a Service)共享平台。该平台在2022年的云栖大会上发布,之前也有大量的PR文章进行介绍和推广(如:官方介绍,CSDN文章 等),这里就不再赘述。

作为其中的一个贡献者,刚开始接触ModelScope,给我的第一感觉就是,这不就是一个中文版的Hugging Face 嘛,还有必要再搞一个这个东西吗?我从心理是抗拒的。但是后(gong)来(zuo)想(suo)想(po),之前的淘宝,QQ,百度等,也是效仿而来,虽然不像ChatGPT, AlphaGo这样的开创性工作一样令人震撼,但至少也是针对国内使用者做了一些改良。当然,我从心底里佩服能够做出ChatGPT, AlphaGo这样工作的人,也希望国内能有一些这样重量级的工作出现。

话说回来,仔细想想,ModelScope相比Hugging Face做了哪些适合“国情”的改良呢?我能够想到的有下面几点:

  • 首先是中文,虽然说对于专业的开发者,查找和阅读英文文档是一个必备的技能,但是有一个中文的平台作为参考和对比,当然也没什么坏处,另外,在AI这个领域,还有还有大量的初级入门者和非专业的开发者,这样的中文平台对他们而言更加友好;
  • 其次是模型种类,Hugging Face本身是从NLP的Transformer“发家”,一些做CV的朋友甚至都不知道它的存在。而ModelScope除了在NLP,在CV, Audio, Multimodal等领域也有不少的模型,没有对NLP明显的侧重;
  • 再者是机器资源,目前处在推广阶段,每位开发者都可以使用阿里云上免费的CPU/GPU机器进行开发,可以从每个模型主页右上角的Notebook选项中进入,是薅羊毛的不二之选;
  • 最后是网络流畅度,相比Hugging Face,ModelScope在网页浏览、模型下载、数据集下载等方面,显然是更加顺畅的。

ModelScope也存在一些明显的不足:

  • 贡献者欠缺,作为一个社区,当然需要更多开发者的贡献,虽然目前也有一些生态伙伴在上面进行模型贡献,但是大部分的模型还是达摩院自研/搬运的模型,如何能够使开源者在github开源的同时也上线到ModelScope,是一个值得考虑的问题;
  • 模型影响力欠缺,作为一个中文的模型即服务平台,ModelScope上还欠缺有影响力的模型,很多国内的优秀工作也没有上线到这里;
  • 代码一致性保障困难,ModelScope是一个“all in one”的仓库,内部和外部的人均能贡献,同一领域的代码风格统一以及模型结构复用等都是很有挑战的。

垂类模型介绍

我们在ModelScope上贡献的垂类模型(垂直领域的热门检测模型)包括:人体部位(人体、人手、人头)和垂类物体(口罩、安全帽、香烟、手机、交通标识等)检测模型,从某种程度上来说,也算是和Hugging Face的一个差异点(Hugging Face 物体检测相关的模型更多是通用的物体检测模型,没有垂类模型)。垂类模型的入口如下图所示:
垂类模型入口
目前,ModelScope上已经有的垂类模型如下表所示,我们也还在逐渐丰富模型中。

序号模型名称序号模型名称
1实时人体检测模型6实时香烟检测模型
2实时人头检测模型7实时手机检测模型
3实时手部检测模型8实时交通标识检测模型
4实时口罩检测模型9Coming soon
5实时安全帽检测模型

调用方式

1 Demo Service

在每个模型主页的右侧,有demo service的区域,可以上传本地的图片,对模型进行测试,如下图所示:

demo-service

2 Notebook

使用免费的线上机器资源,开启薅羊毛模式,如下图所示。启动对应的实例之后,可以在机器实例中,进行范例代码的运行,也可以搭建自己的服务。
notebook

3 本地使用

如果有本地的机器资源的话,也可以直接pip安装modelscope库,就能够在本地进行使用了。具体可以参考安装教程。

* 二次开发

如果需要对现有的模型进行微调(finetune),可以参考每个模型的<微调代码范例>部分,准备好用于微调的数据之后即可对模型进行微调。

总结

垂类检测系列模型是我们在ModelScope上一个初步的尝试,也是针对与Hugging Face差异化做出的一点探索,欢迎大家适用并提出一些建议。我们会继续丰富和完善上面的模型。

http://www.lryc.cn/news/3963.html

相关文章:

  • Linux | Linux卸载和安装MySQL(Ubuntu版)
  • 【C1】数据类型,常量变量,输入输出,运算符,if/switch/循环,/数组,指针,/结构体,文件操作,/编译预处理,gdb,makefile,线程
  • 【深度学习】pytorch的基础操作
  • MWORKS--同元软控MWORKS介绍、安装与使用
  • Python 解决dilb和face_recognition第三方包安装失败
  • Mac系统Mysql的8.0.22版本安装笔记和密码重置修改密码等问题方法
  • 驱动 | Linux | NVMe 不完全总结
  • 一个测试人员,在现阶段的环境下如何在测试行业发展和自我价值。
  • pwn手记录题2
  • CSS ~ 从入门到入坑。
  • 成都哪家机构的Java培训比较好,求一个不坑的?
  • 《爆肝整理》保姆级系列教程python接口自动化(十二)--https请求(SSL)(详解)
  • 离线数据仓库
  • 【前端】Vue项目:旅游App-(23)detail:房东介绍、热门评论、预定须知组件
  • JUC并发编程与源码分析
  • Spark09: Spark之checkpoint
  • 《剑指offer》:数组部分
  • 基于微信小程序图书馆座位预约管理系统
  • 剑指 Offer Day1——栈与队列(简单)
  • 详解Python正则表达式中group与groups的用法
  • Spring面试重点(三)——AOP循环依赖
  • 计算机网络之HTTP04ECDHE握手解析
  • 【MySQL数据库】主从复制原理和应用
  • 复现随记~
  • 【计组】设计大型DMP系统--《深入浅出计算机组成原理》(十四)
  • 66 使用注意力机制的seq2seq【动手学深度学习v2】
  • NextJS(ReactSSR)
  • JointBERT代码复现详解【上】
  • 进程间通信(上)
  • 【Unity3D】Unity 3D 连接 MySQL 数据库