每天一个AI模型,让思维提前和未来同步。
如果你不会绘画,不懂设计,但是你有很多天马行空的想法,怎么样才能把这些想法具象出来给大家展示?
以前是不可能的,但是现在,AI数字艺术家来了。
今天的介绍的stable diffusion就是这样一种文本生成图片的AI模型,可以真正的使你“梦想成真”。
stable diffusion官网介绍:让梦想成真
描述→生成,非常简单的使用体验
想要使用和体验Stable Diffusion非常简单,官方提供了名为游乐场Playground的体验地址(需要科学上网),只要输入你想要表达的内容文本,就可以生成对应的极具艺术家气息的图片。比如,我输入city in forest,AI模型很快就会生成四张图片,但是Demo体验版只能生成512×512 像素的图片。
city in forest:在森林中的城市
Prompt: In a cyberpunk city, a police car is on the street, raining, light effect
如果你想要更为灵活和定制,你需要DreamStudio Beta,这是官方的公测版本,需要注册账号登录,在公测版本中可以调整的参数非常多,长、宽、相关度等等。但是,每次生成你想要的土拍你需要消耗一定的积分,积分用完后需要购买。
DreamStudio Beta界面
如果还想要进阶,那么你就需要使用到Google Colab 版本,如果你对机器学习/深度学习有所了解,你一定不会陌生,Colab类似于JupyterNotebook.
Colab介绍
使用Colab你可以更加深入的定制“想象力”参数来帮助你生成想要的艺术图片。
类似Stable Diffusion的AI模型还有很多,像DALL-E和Midjourney,到那时Stable Diffusion的代码和模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行。而以前的专有文生图模型(如DALL-E和Midjourney(英语))只能通过云计算服务访问。
提示词越“漂亮”,图片“越美丽”
由于AI模型都是根据文本提示来生成图片,所以触发图片生成提示词——Prompts——决定了生成图片的质量。您必须完善您的提示才能从 Stable Diffusion AI 获得不错的结果。 您提供的提示级别将直接影响图稿的细节级别和质量。
亚洲老武士首领肖像照片
Prompt: portrait photo of a asia old warrior chief, tribal panther make up, blue on red, side profile, looking away, serious eyes, 50mm portrait photography, hard rim lighting photography–beta –ar 2:3 –beta –upbeta –upbeta
亚洲老武士首领肖像照片,部落黑豹妆,红底蓝,侧脸,望向别处,严肃的眼睛,50mm 人像摄影,硬边照明摄影–beta –ar 2:3 –beta –upbeta –upbeta
基努·里维斯的亚洲老战士首领肖像照
Prompt: Keanu Reeves portrait photo of a asia old warrior chief, tribal panther make up, blue on red, side profile, looking away, serious eyes, 50mm portrait photography, hard rim lighting photography–beta –ar 2:3 –beta –upbeta –beta –upbeta –beta –upbeta
提示:基努·里维斯的亚洲老战士首领肖像照,部落黑豹妆,蓝底红,侧面,看向其他地方,严肃的眼神,50mm肖像摄影,硬边缘照明摄影
华丽的年轻的瑞士女孩坐在窗户上戴着耳机
gorgeous young Swiss girl sitting by window with headphones on, wearing white bra with translucent shirt over, soft lips, beach blonde hair, octane render, unreal engine, photograph, realistic skin texture, photorealistic, hyper realism, highly detailed, 85mm portrait photography, award winning, hard rim lighting photography–beta –ar 9:16 –s 5000 –testp –upbeta –upbeta –upbeta
华丽的年轻的瑞士女孩坐在窗户上戴着耳机,穿着白色胸罩半透明的衬衫,柔软的嘴唇,沙滩金发,xintane渲染,不真实的引擎,照片,逼真的皮肤纹理,逼真的,超现实主义,高度详细,85毫米人像摄影
一位华丽的年轻女子
photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy, shy, alluring, evocative, stunning, award winning, realistic, sharp focus, 8 k high definition, 3 5 mm film photography, photo realistic, insanely detailed, intricate, elegant, art by stanley lau and artgerm
照片的一个华丽的年轻女子在斯蒂芬科斯蒂克和大卫拉夏贝尔的风格,腼腆,害羞,诱人,唤起,令人惊叹,获奖,现实,锐利的焦点,8 k高清,3 5毫米胶片摄影,照片现实,疯狂的细节,复杂,优雅
复杂概念生成艺术图片
提示词:古印度尼西亚,印度尼西亚村民,punakawan战士和牧师,电影,详细,大气,史诗,概念艺术,磨砂画,背景山,轴照明,雾,,照片现实,概念艺术,,体积光,电影构图,超详细,现实,超现实,体积照明
还有很多,比如下面这些图片,大家可以反向猜一下都是用了怎么样的提示词才能达到的效果
未来家庭旅馆
蝙蝠蜘蛛侠?
这是AI生成的,还是真实的照片?
任何人都可以使用AI 艺术生成器——这就是风险所在
和Stable Diffusion不同,对于像DALL-E这样的模型,免费的、公共的访问是需要等待的,而且输出的图片也会经过过滤,所以避免了生成一些不适合在公众中传播的图像,并且多次使用需要支付费用。
但是Stable Diffusion是完全开源并且免费的,设置可以使用Calob版本来达到无限制次数的使用。
免费 简单,使得Stable Diffusion减少了用户生成内容的障碍。 但是,这使得接下来会发生什么变得难以预测。
不论是一些危险的、不适当的词语会被用来生成图片,而且一些个人的肖像权也无法得到有效的保护,会有人通过一些关键词来创建出虚假的照片去进行伤害别人的行为。
但是Stability AI,发布的Stable Diffusion的公司给出的答案是:
技术是中立的,建造总比不建造好。
that technology is neutral, and that building things is better than not.
AI的创造力带来的助力,还是破坏
关于这一点,我无法阐述太多,不如引用投资人Mostaque的原话,他为创建 Stable Diffusion 提供了一笔不详(但看似数额巨大)的资金。
“我认为公司和组织是缓慢、愚蠢的人工智能,”他说。 “当我们谈论如果人工智能变得太聪明就会被它杀死时,我们每天都在被真正折磨我们的官僚机构杀死。” 在他看来,将 Stable Diffusion 作为一个开源项目发布是战胜这些笨拙机构的一种方式。 “每个人都在将 [这些 AI 模型] 设为私有,直到第一个人将它们公开。 从博弈论的角度来看,当有人将它们公开时会发生什么? 每个人都公开。 OpenAI 和每个人都必须加入我们的社区和生态系统。”
这是一个宏伟的目标,但不亚于他将 Stable Diffusion 描述为“将创造力之神的火焰带到世界上”。
现在,世界需要弄清楚,我们需要弄清楚的是如何不被创造力的火焰烧毁。