Google推生成式AI工具 ImageFX，以关键字简化用户输入

2024-11-12 6:22

Google 近日推出全新的图像生成式 AI 工具 — ImageFX，提供用户使用关键字快速产生图像。另外也针对音乐与文本生成的 AI 工具 MusicFX、TextFX 进行了优化。不过目前三项服务仍未开放给中国民众使用。

全新推出 ImageFX：关键字生成高品质画面

ImageFX 是 Google 近期全新推出的工具，可让用户透过简单的文字提示来建立图像，如同使用 ChatGPT。

ImageFX 背后由 Imagen 2 模型所支援，Imagen 2 是 Google DeepMind 的文字转图像模型，团队表示其支援渲染的技术可以减少现有生成式图片常见的奇怪阴影与组合，可以借此让图像更加真实。

有别于 ChatGPT 的 prompt 输入需要尽量多段完整文字以更精准的描述需求；ImageFX 则使用表达晶片 (expressive chips) 提供用户使用关键字描述图片的功能，并提供关键字建议与更换选项，让用户可以更快速生成与实验图片。

MusicFX 是去年发布的文本转音乐生成式 AI，可以借由简单的 prompt 输入，创作长度最多达 70 秒的乐曲，或是可循环播放的音乐。

自推出以来，全球用户已经使用该工具创建了超过 1,000 万首曲目，借由这些反馈数据，团队表示正在将 MusicLM 模型改进，实现更高品质的音讯和更快速的音乐生成。

所有使用 ImageFX 产生的影像以及使用 MusicFX 产生的歌曲，均有 SynthID 标记，可将数位浮水印直接添加到内容中，可提供其他系统侦测以进行识别，而不会影响内容本身 (外表看不出来)，确保内容的著作权。

另外，团队也强化了与 Lupe Fiasco 合作开发的文案生成工具 TextFX，改善用户体验与使用流程介面，供作家、编剧更方便地使用。

其实现在生成式 AI 的一大商业面问题是「用户并不容易使用」，prompt 的输入充满学问，看看市面上有多少 AI 使用教学就知道，对于许多用户造成不少认知负担降低使用意愿。

Google 将 AI 使用变得更加简单，借此作为定位接触更大的受众。

以 ImageFX 举例，有别于 ChatGPT 需要完整段落的全文字输入，或是图像生成工具 Midjourney 充满许多复杂的使用指令，ImageFX 可以让用户仅输入关键字完成图像生成，让用户可以更简易的完成作业。