ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成
全新功能与高级应用,开启智能对话与多媒体处理新纪元
直达下载
返回上一页
描述
ComfyUI-Gemini,在 ComfyUI 中使用 Gemini 1.5 Pro 进行高级对话管理和多模态交互,体验前所未有的智能对话与数据处理能力。
介绍
Gemini 1.5 Pro 已成功集成到 ComfyUI 中,这意味着用户现在不仅可以使用该模型生成提示词、描述图像,还能享受与其深入交流的乐趣。自2024年5月2日起,Gemini API 将开始收费,用户需在官方网站申请API密钥以继续使用服务。
主要功能
- 高级对话管理:支持系统指令设置,允许用户精细控制对话流程,实现更加智能的交互体验。
- 多模态交互能力:集成文本、图像以及文件读取功能,支持多种媒体类型的输入,包括视频和音频,上限为20GB。
- 扩展的输入限制:支持的输入token数量达到1048576,为用户提供了极大的灵活性。
- 严格的速率限制:每分钟最多两次请求,每日最多1000次,确保服务的稳定与高效。
新增功能
- 文件上传支持:现支持单个文件上传,包括图片、文本文件、PDF和音频文件,未来将扩展到多文件上传。
- 全面的训练和测试流程:提供了从预处理到自动打标,再到训练和测试的一条龙服务,特别适用于LoRa设备的数据处理。
使用方式
用户需要首先在 Gemini API 官网 申请自己的 API 密钥。Gemini 1.5 Pro的使用分为隐式和显式两种API Key方式,推荐使用隐式API Key以增强安全性。用户也可以选择显式输入API Key,但需要注意不要将包含密钥的工作流共享。
安装指南
推荐通过 ComfyUI Manager 进行安装,也可以手动安装。手动安装步骤如下:
- 克隆存储库到本地。
- 进入项目目录,安装必要的依赖。
- 重启 ComfyUI 以应用安装。
×
直达下载
×
初次访问:反爬虫,人机识别