全球新资讯:岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

2022-09-14 15:59:28   来源:商业新知网

磐创AI分享

转自 | 新智元

编辑 | David


(资料图片)

【导读】 特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创作新时代。
近日,由Emad Mostaque创立和资助的Stability.ai公司宣布公开发布AI创造的艺术作品。

你可能认为这只是AI在艺术领域的另一次尝试,但实际上远不止如此。

有两个原因。

首先,与DALL-E 2不同的是,Stable Diffusion是开源的。这意味着任何人都可以利用它的骨干,免费建立针对特定文本到图像创作任务的应用程序。

另外,Midjourney的开发者实施了一项功能,允许用户将其与Stable Diffusion结合起来,这导致了一些惊人的结果。

试想一下,在接下来的几个月里会出现什么。

第二,与DALL-E mini和Disco Diffusion不同,Stable Diffusion可以创造出惊人的逼真和艺术作品,对OpenAI或谷歌的模型没有什么可羡慕的。人们甚至声称它是「生成式搜索引擎」中新的SOTA。

(除非另有说明,本文所有图片都是通过Stable Diffusion创作的)。

Stable Diffusion 体现了人工智能艺术世界的最佳特征:它可以说是现有最好的人工智能艺术模型,而且是开源的。这简直是闻所未闻,将产生巨大的影响。

更有趣的是,关于这些服务的消息可能会通过最意想不到的来源到达你的手中。你的父母、你的孩子、你的伴侣、你的朋友或你的同事。

这些人往往是人工智能领域发生的事情的局外人,他们即将发现这个领域的最新趋势。艺术可能成为AI最终敲开那些对未来视而不见的人的大门的方式。这不是很有诗意吗?

不只是开源的DALL·E 2

Stability.ai的诞生是为 了创造「开放的AI工具,让我们发挥潜能」。 不仅仅是从未进入大多数人手中的研究模型,而是具有现实世界应用的工具,开放给我和你来使用和探索。

这是与其他科技公司不同的地方,比如OpenAI,它嫉妒地守护着它最好的系统(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至从未打算将自己的(PaLM、LaMDA、Imagen或Parti)作为私人测试版发布。

Stability.ai的这次公开发布不仅分享了模型权重和代码——虽然这对科学和技术的健康发展很关键,但大多数人并不关心它们。而且还为我们这些不想或不知道如何编码的人提供了一个无代码的即用型网站。

网站名叫DreamStudio Lite,可以免费使用,最多可生成200张图片。像DALL-E 2一样,它采用付费订阅模式,可以用10英镑获得1千张图片(OpenAI每月补充15个积分,但要获得更多的积分,你必须以15美元购买115个包)。

DALL-E的成本为0.03美元/图,而Stable Diffusion的成本为0.01英镑/图。

此外,还可以通过API大规模地使用Stable Diffusion(成本呈线性增长,所以你可以用1000英镑获得100K代)。除了图像生成,Stability.ai很快将宣布DreamStudio Pro(音频/视频)和Enterprise(工作室)。

DreamStudio可能很快会实现的另一个功能是,可以从其他图像生成图像,而不是通常的文本到图像的设置。就像下面这样:

在网站上,还有一个关于提示工程的资源,如果你是这方面的新手,你可能会用得上。 另外,与DALL-E 2不同,你可以控制参数来影响结果,并对其保留更多的代理权。

Stability.ai已经做了一切来促进人们对模型的访问。OpenAI是第一个,必须走得更慢,以评估模型固有的潜在风险和偏见,但他们不需要将模型保持在封闭测试阶段这么久,也不需要建立这样一个限制创造力的商业模式。

Midjourney和Stable Diffusion都已经证明了这一点。

安全+开源 > 隐私和控制

开源技术有其自身的局限性。 开放性应该走在隐私和严格控制之前,但不应该走在安全之前。

正如该公司在公告中解释的那样,它是「一个允许商业和非商业使用的许可」,重点是模型的开放和负责任的下游使用。它还强制要求衍生作品至少要受到同样的基于用户的限制。

开源模型本身是很好的模式,但如果我们不希望这项技术最终伤害人们,或以错误信息的形式为互联网增加更多的傲慢,建立合理的护栏也同样重要。

「由于这些模型是在广泛的互联网搜刮的图像-文本对上训练出来的,模型可能会重现一些社会偏见,产生不安全的内容,所以开放的缓解策略以及对这些偏见的公开讨论可以让大家参与到这个对话中来。」

在任何情况下,开放性+安全性>隐私和控制。

开源力量改变世界

凭借道德价值和开放性的坚实基础,Stable Diffusion承诺在现实世界的影响方面超越其竞争对手。

对于那些想下载它并在他们的电脑上运行它的人来说,你应该知道它需要6.9Gb的VRAM--这适合于高端消费级GPU,使它比DALL-E 2要轻,但对大多数用户来说仍然是遥不可及的。其余的人,像我一样,可以马上开始使用Dream Studio。

Stable Diffusion 被普遍认为是目前最好的AI艺术模型,它将成为无数应用程序、网络和服务的基础,重新定义我们如何创造和与艺术互动。

但现在,专门为不同使用情况设计的应用程序将从头开始建立,供所有人使用。人们正在增强儿童画,用外画+内画制作拼贴画,设计杂志封面,画漫画,创造变形和动画视频,从图像中生成图像,等等。

其中一些应用在DALL-E和Midjourney中已经成为可能,但Stable Diffusion可以推动当前的创意革命进入下一个阶段。用前特斯拉AI总监、李飞飞高徒Andrej Karpathy的话说,就是让「艺术创作进入了人类+AI合作的新时代。」

像Stable Diffusion这样的AI艺术模型涉及到一类新工具,应该用我们所处的新现实的新思维框架来理解。我们不能简单地与其他时代进行类比或平行对比,并期望能够准确地解释或预测未来。

有些事情会相似,有些则不会。我们必须把这个即将到来的未来当作未知的领域。

写在最后

毫无疑问,Stable Diffusion的公开发布是人工智能艺术模型领域有史以来最重要和最有影响的事件,而这只是一个开始。

作者之一的Emad Mostaque在Twitter上说:"随着我们发布更快、更好和具体的模型,预计质量将继续全面上升。不仅仅是图像,下个月是音频,然后转向3D、视频。语言、代码,以及更多训练。

我们正处于一场为期数年的革命的边缘,在我们互动、联系和理解艺术,特别是一般的创造力的方式。而且不仅仅是在哲学、知识领域,而是作为现在每个人都分享和体验的东西。

创意世界将永远改变,我们必须进行开放和尊重的对话,为所有人创造一个更好的未来。只有负责任地使用开源技术,才能创造我们希望看到的变化。

关键词: 人工智能 应用程序

上一篇:
下一篇:
精彩阅读

全球新资讯:岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

热点

特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创作新时代。

全球快讯:百度输入法上线新功能,虚拟奶狗和御姐比人类更会共情

热点

在没有互联网之前,简直就是异想天开,但是现在我彻底改变了之前的看法。

消息!输入法三足鼎立,百度凭什么一骑绝尘

热点

在输入法市场我们都知道是百度、搜狗和讯飞三足鼎立,那么三大输入法几乎占据了整个书法市场95%以上的市场份额。

今日聚焦!所算即所得,数据中心从可量化到可视化的价值革命

热点

作为行业数字化转型的“底座”,数据中心在指数级增长的同时,也消耗着越来越多的电力资源。

环球即时:使用 Web3 重新思考参与度和客户留存

热点

伟大的Web3成功案例,如RAC,始于信任的受众或社区,所以如果你还没有这些,那么你可以从这里开始。

当前短讯!卧槽!微信可以改彩色昵称了!!!

热点

今天给大家分享个超级好玩的微信小技巧,真可谓是装逼必备神器!

今日讯!数字国奇葩事——PR就是贴满LOGO | 戏说数字化

热点

2032年,元宇宙企鹅圈已经成为供方展示自我的必备平台,数字国众多数字化供应商纷纷将自己标杆客户虚拟形象上传。

全球热资讯!知乎暴跌、小红书“拔草”难:社区型平台为何难“变现”?

热点

成也社区,败也社区。从豆瓣到虎扑,社区型平台一直备受商业化困扰。

全球要闻:Ins被罚4亿美元,未成年人隐私和言论自由哪个重要?

热点

泄露隐私、罚款,放在互联网时代,似乎也算不上什么“新鲜事。

财富

当前关注:融资丨「极狐GitLab」完成数千万A3轮融资,天堂硅谷投资

资讯

融资丨「极狐GitLab」完成数千万A3轮融资,天堂硅谷投资,本轮融资将进一步加强“自主可控3 0”、独立创新方面的投入。

当前短讯!融资丨「云起无垠」完成数千万天使轮融资,绿洲资本独投

资讯

融资丨「云起无垠」完成数千万天使轮融资,绿洲资本独投,此轮融资将用于技术研发和产品打磨,定义开发安全新范式。

实时:融资丨香氛品牌「DOCUMENTS闻献」完成数千万元A+轮融资

资讯

融资丨香氛品牌「DOCUMENTS闻献」完成数千万元A+轮融资,投资方为美次方投资、凯辉基金。

【天天新视野】融资丨「中盛溯源」完成数亿元A轮融资,招商健康与君联资本共同领投

资讯

融资丨「中盛溯源」完成数亿元A轮融资,招商健康与君联资本共同领投,广发信德等机构共同参与投资。

天天简讯:融资丨「百明信康」完成近四亿元B轮融资,专注过敏免疫治疗与自身免疫治疗

资讯

融资丨「百明信康」完成近四亿元B轮融资,专注过敏免疫治疗与自身免疫治疗,资金将主要用于核心产品的临床开发和团队建设。

世界时讯:消费者,“不爱”预制菜?

资讯

消费者,“不爱”预制菜?,因为我们热爱厨房

热推荐:万亿储能投资大跃进,风险与机遇

资讯

万亿储能投资大跃进,风险与机遇,2022年头7个月获得批复的储能项目,投资额超过了建国以来建成和在建储能项目的投资总额

每日热门:“充电5分钟、续航200公里”的背后,车企押宝800V高压超充靠谱吗?

资讯

“充电5分钟、续航200公里”的背后,车企押宝800V高压超充靠谱吗?,“上车”高压充电平台的隐忧

焦点滚动:张一鸣管不住俞敏洪

资讯

张一鸣管不住俞敏洪,抖快淘一体化,将会是品牌店播下半场的答案。

聚焦:腾讯B站快看,复兴国漫?

资讯

腾讯B站快看,复兴国漫?,“当时为了柯南金田一冲了挺多钱,感觉挺贵的,后面就去盗版网站找资源了”

全球快讯:百度输入法上线新功能,虚拟奶狗和御姐比人类更会共情

在没有互联网之前,简直就是异想天开,但是现在我彻底改变了之前的看法。

消息!输入法三足鼎立,百度凭什么一骑绝尘

在输入法市场我们都知道是百度、搜狗和讯飞三足鼎立,那么三大输入法几乎占据了整个书法市场95%以上的市场份额。

今日聚焦!所算即所得,数据中心从可量化到可视化的价值革命

作为行业数字化转型的“底座”,数据中心在指数级增长的同时,也消耗着越来越多的电力资源。

环球即时:使用 Web3 重新思考参与度和客户留存

伟大的Web3成功案例,如RAC,始于信任的受众或社区,所以如果你还没有这些,那么你可以从这里开始。

环球关注:“互联网+”商业革新稳步推进——商业新知发布2022年8月IT科技产业指数&TOP5优质内容

2022年8月份关注IT科技产业资讯内容的产业经理人达到101 78万人。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个