ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成

全新功能与高级应用,开启智能对话与多媒体处理新纪元

直达下载
返回上一页
描述
ComfyUI-Gemini,在 ComfyUI 中使用 Gemini 1.5 Pro 进行高级对话管理和多模态交互,体验前所未有的智能对话与数据处理能力。
介绍

Gemini 1.5 Pro 已成功集成到 ComfyUI 中,这意味着用户现在不仅可以使用该模型生成提示词、描述图像,还能享受与其深入交流的乐趣。自2024年5月2日起,Gemini API 将开始收费,用户需在官方网站申请API密钥以继续使用服务。

home_open_ComfyUI_Gemini_1

主要功能

  1. 高级对话管理:支持系统指令设置,允许用户精细控制对话流程,实现更加智能的交互体验。
  2. 多模态交互能力:集成文本、图像以及文件读取功能,支持多种媒体类型的输入,包括视频和音频,上限为20GB。
  3. 扩展的输入限制:支持的输入token数量达到1048576,为用户提供了极大的灵活性。
  4. 严格的速率限制:每分钟最多两次请求,每日最多1000次,确保服务的稳定与高效。

新增功能

home_open_ComfyUI_Gemini_2

  • 文件上传支持:现支持单个文件上传,包括图片、文本文件、PDF和音频文件,未来将扩展到多文件上传。
  • 全面的训练和测试流程:提供了从预处理到自动打标,再到训练和测试的一条龙服务,特别适用于LoRa设备的数据处理。

使用方式

用户需要首先在 Gemini API 官网 申请自己的 API 密钥。Gemini 1.5 Pro的使用分为隐式和显式两种API Key方式,推荐使用隐式API Key以增强安全性。用户也可以选择显式输入API Key,但需要注意不要将包含密钥的工作流共享。

安装指南

推荐通过 ComfyUI Manager 进行安装,也可以手动安装。手动安装步骤如下:

  1. 克隆存储库到本地。
  2. 进入项目目录,安装必要的依赖。
  3. 重启 ComfyUI 以应用安装。
AI工具教程
免费领取AI学习资料 进AI副业交流群
礼物
AI工具教程
免费领取AI学习资料 进AI副业交流群