当前位置: 首页 > news >正文

20240630 每日AI必读资讯

📚全美TOP 5机器学习博士发帖吐槽:实验室H100数量为0!

- 普林斯顿、哈佛「GPU豪门」,手上的H100至少三四百块,然而绝大多数ML博士一块H100都用不上

- 年轻的研究者们纷纷自曝自己所在学校或公司的GPU情况:1张2080Ti+1张3090,已是全部

🔗 全美TOP 5机器学习博士:痛心,实验室H100数量为0!-CSDN博客

 💻GPTPDF:是一个使用GPT-4o将 PDF 解析为 Markdown 的工具

- 仅293行代码,它可以几乎完美地解析任何 PDF 文件,包括排版、数学公式、表格、图片和图表等内容,平均每页成本为 $0.013。

- 工作原理:

使用 PyMuPDF 库,首先对 PDF 进行解析出所有非文本区域,并做好标记

然后使用 GPT-4o进行解析,得到 markdown 文件。

🔗GitHub:https://github.com/CosmosShadow/gptpdf

- 案例展示

🔗原始PDF:
https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md

🔗解析后的PDF:
https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md

🌐Character AI推出新功能 让你可以与AI角色进行通电话

- 支持多种语言,包括英语、西班牙语、葡萄牙语、俄语、韩语、日语和中文。

- 可以选择不同的声音、音调、口音和个性,定制化自己的AI角色声音。

- 可以在通话和短信之间无缝切换,通过“点击打断”选项随时停止AI讲话。

🔗访问尝试:https://character.ai

🔗 https://blink.csdn.net/details/1745092 

🤖微软文本转语音虚拟数字人上线 支持GPT-4o的集成

- 可以创建实时互动的数字人 ,但是目前语音使用的还是微软自己的

- 可以接入大语言模型直接和自己的服务集成

- 提供实时互动的数字人服务,比如在线客服、导游、讲解员等。

1.自然声音视频:将文本转换为自然声音说话的数字人视频。

2. 预生成虚拟形象:提供预生成虚拟形象的集合,用户可选择使用。

3.多种语言支持:支持与文本转语音相同的多种语言和声音,包括英语、中文、西班牙语等。

4. 批量和实时合成:支持1920×1080分辦率、每秒25帧的视频合成,批量合成支持h264/h265/vp9编解码器,实时合成支持h264编解码器。

5.自定义虚拟形象:用户可以创建自定义的文本转语音虚拟形象,只需录制10分钟的视频,并可选择自定义神经网络声音。

6.实时互动:在Speech Studio中提供的实时聊天虚拟形象工具,可以实现实时虚拟形象对话。

7.高质量视频输出:支持高清分辨率和多种编解码器,用户可以配置视频比特率以满足不同需求。

8.无代码创建工具:Speech Studio提供内容创建工具,无需编码即可创建视频内容。

🔗  https://blink.csdn.net/details/1745088

http://www.lryc.cn/news/387677.html

相关文章:

  • 第十一章 Qt的模型视图
  • 力扣 单词规律
  • 10款好用不火的PC软件,真的超好用!
  • Windows怎么实现虚拟IP
  • 【计算机网络】HTTP——基于HTTP的功能追加协议(个人笔记)
  • 【多媒体】Java实现MP4视频播放器【JavaFX】【音视频播放】
  • 2024 Parallels Desktop for Mac 功能介绍
  • 颍川韩氏,来自战国七雄韩国的豪族
  • Spring boot中如何使用Thymeleaf模板
  • 单片机学习(14)--DS18B20温度传感器
  • ue 材质贴图Tiling repeat
  • 【图像超分辨率】一个简单的总结
  • WEB与低代码:B/S架构在开发中的应用与优势
  • 内容营销专家刘鑫炜揭秘:姜萍一夜暴红背后的品牌传播密码
  • 安装VEX外部编辑器
  • ISO 19110全局要求类/req/global/bound-association-role要求的详细解释
  • 武汉凯迪正大等简述电缆电容检测:原理、应用与重要性
  • python调用阿里云OSS对象存储
  • 530、二叉搜索树的最小绝对差
  • docker配置redis主从复制
  • IPython调试秘籍:pdb调试器深度解析与实战
  • MySQL 死锁处理
  • scatterlist的相关概念与实例分析
  • leetCode.97. 交错字符串
  • 算力时代,算能(SOPHGO)的算力芯片/智算板卡/服务器选型
  • ManageEngine连续荣登Gartner 2024年安全信息和事件管理魔力象限
  • 51单片机第11步_在C语言中插入汇编语言
  • 【Qt+opencv】图片与视频的操作
  • Kubernetes面试整理-PersistentVolumes和PersistentVolumeClaims的使用和配置
  • C++学习全教程(Day2)