当前位置: 首页 > news >正文

Google Gemini 体验

文章中代码仓库

gemini

谷歌推出的 AI 只能模型

  • Gemini官网
  • Gemini Chat
  • Gemini开发者文档
  • Gemini SDK

所有模型

模型变体输入输出优化目标
Gemini 2.5 Pro gemini-2.5-pro音频、图片、视频、文本和 PDF文本增强的思考和推理能力、多模态理解能力、高级编码能力等
Gemini 2.5 Flash gemini-2.5-flash音频、图片、视频和文本文本适应性思维,成本效益
Gemini 2.5 Flash-Lite 预览版 gemini-2.5-flash-lite-preview-06-17文本、图片、视频、音频文本最具成本效益且支持高吞吐量的模型
Gemini 2.5 Flash 原生音频 gemini-2.5-flash-preview-native-audio-dialog & gemini-2.5-flash-exp-native-audio-thinking-dialog音频、视频和文本文本和音频,交错显示高质量、自然的对话式音频输出,无论是否经过思考
Gemini 2.5 Flash 预览版 TTS gemini-2.5-flash-preview-tts文本音频低延迟、可控的单语音和多语音文字转语音音频生成
Gemini 2.5 Pro 预览版 TTS gemini-2.5-pro-preview-tts文本音频低延迟、可控的单语音和多语音文字转语音音频生成
Gemini 2.0 Flash gemini-2.0-flash音频、图片、视频和文本文本新一代功能、速度和实时流式传输。
Gemini 2.0 Flash 预览版图片生成 gemini-2.0-flash-preview-image-generation音频、图片、视频和文本文字、图片对话式图片生成和编辑
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite音频、图片、视频和文本文本成本效益和低延迟
Gemini 1.5 Flash gemini-1.5-flash音频、图片、视频和文本文本在各种任务中提供快速而多样的性能 已弃用
Gemini 1.5 Flash-8B gemini-1.5-flash-8b音频、图片、视频和文本文本量大且智能程度较低的任务 已弃用
Gemini 1.5 Pro gemini-1.5-pro音频、图片、视频和文本文本需要更高智能的复杂推理任务 已弃用
Gemini Embedding gemini-embedding-001文本文本嵌入衡量文本字符串的相关性
Imagen 4 imagen-4.0-generate-preview-06-06 imagen-4.0-ultra-generate-preview-06-06文本图片我们最新的图片生成模型
Imagen 3 imagen-3.0-generate-002文本图片高质量图片生成模型
Veo 3 预览版 veo-3.0-generate-preview文本带音频的视频生成包含音效、环境噪音和对话的高品质视频
Veo 2 veo-2.0-generate-001文字、图片视频高质量视频生成
Gemini 2.5 Flash Live gemini-live-2.5-flash-preview音频、视频和文本文字、音频低延迟的双向语音和视频互动
Gemini 2.0 Flash Live gemini-2.0-flash-live-001音频、视频和文本文字、音频低延迟的双向语音和视频互动

引入SDK

go get google.golang.org/genai

设置GEMINI API KEY 环境变量

export GEMINI_API_KEY="your-api-key"

示例

文本生成

  1. 单个文本输入
  2. 思考功能
  3. 系统指令来引导 Gemini 模型的行为
  4. 借助 GenerateContentConfig 对象, 替换默认生成参数
  5. 多模态输入,将文本与媒体文件组合使用
  6. 流式响应
  7. 多轮对话
  8. 流式响应多轮对话

图片生成

  1. 文本生成图片
  2. 图片编辑
  3. 使用 Imagen 模型生成图片 (需要付费)

生成视频

  1. 使用 Veo 3 生成视频 (要使用此模式,请确保您的帐户具有活动的GCP计费)
  2. 根据图片生成视频 (需要付费)

结构化输出

  1. 结构化输出

文档理解

  1. 传递内嵌 PDF 数据
  2. 使用 File API 上传 PDF

图片理解

  1. 传递内嵌图片数据
  2. 使用 File API 上传图片

视频理解

  1. YouTuBe

代码执行

  1. 生成代码, 并执行代码
  2. 在对话中使用代码执行
func main() {// 文本生成text.TexGen()text.TexGenThinking()text.TexGenCli()text.TexGenDefaultConfig()text.TexGenMultiModal()text.TexGenStream()text.TexMultipleRoundsOfDialogue()text.TexGenStreamMultipleRoundsOfDialogue()// 图片生成photo.PhoGen()photo.PhoEdit()photo.ImaGen40GeneratePreview0606()// 生成视频voe3.VeoGen()voe3.ImageGenVideo()// 结构化输出format.FormatToJson()// 代码执行coding.EnableCodingExec()coding.DialogCodingExec()// 文档理解docs.InnerDoc()docs.UploadFileApi()// 图片理解photo.PhoInnerRead()photo.PhoFileApi()// 视频理解video.YouTuBe()
}
http://www.lryc.cn/news/596405.html

相关文章:

  • 深入解析Hadoop中的推测执行:原理、算法与策略
  • kafka查看消息的具体内容 kafka-dump-log.sh
  • SDC命令详解:使用set_min_library命令进行约束
  • Unity笔记——事件中心
  • HTB赛季8靶场 - Mirage
  • 风险识别清单:构建动态化的风险管理体系
  • Java函数式编程深度解析:从基础到高阶应用
  • 技能系统详解(4)——运动表现
  • 哔哩哔哩视觉算法面试30问全景精解
  • 钢铁逆行者:Deepoc具身智能如何重塑消防机器人的“火场直觉”
  • 【中文翻译】SmolVLA:面向低成本高效机器人的视觉-语言-动作模型
  • Vue 3 响应式系统中的 effectScope、watchEffect、effect 和 watch 详解
  • 如何将iPad中的视频传输到电脑(6种简单方法)
  • 单片机学习笔记.单总线one-wire协议(这里以普中开发板DS18B20为例)
  • rabbitmq 03
  • uniapp 报错 Not found ... at view.umd.min.js:1的问题
  • LWIP学习记录2——MAC内核
  • Linux系统安装Bash自动补全(bash-completion)
  • 基于SpringBoot+Uniapp的非遗文化宣传小程序(AI问答、协同过滤算法、Echarts图形化分析)
  • uniapp请求封装上传
  • 最新植物大战僵尸杂交版最新版本2.5.1版,内置触屏+加速+全屏,附PC+安卓+iOS最全安装教程!
  • C#文件操作(创建、读取、修改)
  • Java学习-------事务失效
  • 从“点状用例”到“质量生态”:现代软件测试的演进、困局与破局
  • Vue3 学习教程,从入门到精通,Vue3 循环语句(`v-for`)语法知识点与案例详解(13)
  • C# 属性
  • XSS(跨站脚本)
  • CPU 密集型 和 I/O 密集型 任务
  • 达梦数据库表字段增加时报错[-2106]:无效的表或视图名,[-2116]:列[IS_REPEAT]已存在
  • 【C++】第十八节—一文万字详解 | map和set的使用