Stable Diffusion 3来啦！提示文本理解更好，图像质量更强

来源:全天候科技 • 2024-02-23 上午9:08 • 科创新知 • 阅读 20

2月23日，著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3。

该版本与Stable Diffusion 2相比，在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强，可对标闭源模型Midjourney。

Stable Diffusion 3的参数在8亿——80亿之间，也就是说Stable Diffusion 3可能是专为移动设备开发的，AI算力消耗将更低，推理速度却更快。

目前，Stable Diffusion 3支持申请使用，未来会扩大测试范围。

申请地址：https://stability.ai/stablediffusion3

stability.ai没有过多的介绍Stable Diffusion 3的技术内容，但指出其核心架构使用了Transformer和Flow FMatching（简称“FM”）。

Transformer大家都很熟悉了，ChatGPT、T5 、BERT等很多著名模型都是基于该架构开发的。

而FM是Meta AI和魏茨曼科学研究所在2022年10月发布的，一种全新高效建模、训练技术概念。

Flow Matching论文地址：https://arxiv.org/abs/2210.02747

Flow Matching简单介绍

目前，很多文生图模型使用的是CNF（连续正规化流动）训练方法，主要使用常微分方程对流动进行建模，实现从一种已知分布到目标分布的平滑映射。

但由于训练过程需要进行大量的微分方程模拟，会导致算力成本高、模型设计复杂、可解释性差等缺点。

FM则是放弃微分方程的直接模拟,而是通过回归固定条件概率轨迹来实现无模拟训练。研究人员设计了条件概率分布与向量场的概念,利用边缘分布的结合可以建立总体目标概率轨迹与向量场,从而消除了模拟过程对梯度计算的影响。

1）条件概率路径构建：FM需要给出一个目标概率路径,该路径从简单分布演变到逼近数据分布。然后利用条件概率路径构建了目标路径,这样每个样本有一个对应的条件路径。

2）变换层：构成FM的基本单元，每个变换层都是可逆的。这意味着从输入到输出的每一步映射都可以精确地反转，从而允许从目标分布反推到原始分布。

3）耦合层：将输入分成两部分，对其中一部分应用变换，而变换函数可以是任意的神经网络，其参数由另一部分决定，保证了变换的可逆性。

目前，FM技术已在图像生成与超分辨率、图像理解、图像修复与填充、条件图像生成、图像风格迁移与合成、视频处理等领域得到广泛应用。

Stable Diffusion 3案例展示

本次的发布页面也是由Stable Diffusion 3生成的，提示词：史诗般的动漫艺术风格，一位巫师站在夜间的山顶上，向黑暗的天空施放咒语，上面写着由彩色能量生成的“Stable Diffusion 3”文字

教室桌子上有一个红苹果，电影风格，背景的黑板上用粉笔写着“要么做大，要么回家”

一名宇航员骑着一只穿着蓬蓬裙的猪，撑着一把粉色的伞，猪旁边的地上有一只戴着高帽的知更鸟，角落里写着” Stable Diffusion “的字样。

一只变色龙，黑色背景，摄影风格。

一辆跑车的夜间照片，侧面写有“SD3”字样，汽车在赛道上高速行驶，巨大的路标上写着“更快”的文字。

波浪冲击苏格兰灯塔的鱼眼镜头照片，黑色波浪。

内容链接：https://www.hpaper.cn/16729.html

海南离岛免税消费人气旺多个免税店齐推新春促消费活动

上一篇 2024-02-23 上午9:06

56天产量破万，极氪007第10000辆量产下线

下一篇 2024-02-23 上午9:09

科创新知

阿里京东物流“拆墙”进行时：有商家火速换快递，末端快递员担心收入下降

本文来源：时代财经作者：林心林今年“双十一”，两大电商平台和物流商各自为阵的局面将正式终结。图片来源：图虫创意 10月16日，京东物流与淘天集团正式达成合作，京东物流将全面接入淘宝天猫平台，平台商家将能够选择京东物流作为服务商，目前双方对接系统已基本完成，消费者也可以在淘宝和天猫APP内查询京东物流轨迹。这意味着，淘宝与京东这一对电商竞对，将各自过去…

2024-10-17
23
科创新知

AI圈顶流捧场！黄仁勋苏姿丰都来了，联想亮AI Now智能体大招，连甩10多个重磅AI产品

刚刚，联想一场大会，把全球AI圈顶流聚齐了！黄仁勋苏姿丰接连登场、英特尔AMD史无前例首次合作、英特尔CEO现场掏出下一代CPU、扎克伯格剧透XR新品，还有联想智能体大招AI Now正式登场。昨晚，AI量大管饱，精彩镜头应接不暇。智东西西雅图10月15日现场报道，刚刚联想创新科技大会2024正式开幕，联想一口气发布了PC个人AI智能体、搭载英伟达新核弹…

2024-10-16
18
科创新知

AI攻占诺奖背后：新的技术革命成为社会进步发展的重要引擎

“超越人类智慧的AI可以用语言操纵我们，或许会试图说服我们不要关掉开关。” 今年3月，由ChatGPT掀起的AI（人工智能）技术革命背后的奠基性科学家、被誉为“AI教父”的杰弗里·辛顿（Geoffrey E. Hinton），曾对媒体提及他对AI“反噬人类”的担忧。如今，在他心中“危险和机遇并存”的AI，为他带来了诺贝尔物理学奖的荣誉。当地时间10月8日，…

2024-10-15
1.9K
科创新知

苹果自动驾驶汽车项目画上句号：加州测试许可被取消

IT之家 10 月 12 日消息，就在彭博社的马克・古尔曼报道苹果放弃了发布电动汽车的计划六个月后，据 macReports 报道，加州机动车辆管理局（DMV）取消了苹果的自动驾驶车辆测试许可证。据悉，DMV 于 9 月 25 日收到苹果的确认，同意取消该许可证，该许可证于 9 月 27 日被取消。这意味着苹果公司持续了十年之久的电动汽车项目被彻底终结，没…

2024-10-12
1.1K
科创新知

大UP质问平台为什么视频越来越糊，答案比问题要复杂得多

文｜王毓婵编辑｜乔芊 10月8日，在全网拥有超千万粉丝的视频创作者@影视飓风发布了一条视频，标题为《清晰度不如4年前！视频变糊是你的错觉吗？》。这条视频揭示了视频平台为降低流量费用支出，通过降低码率和调整编码格式压缩视频画质的现象。 “2024年，4K视频你应该已经司空见惯。各家平台争先恐后在画质上做文章，我们也在不断更新设备，提升节目的质量。但我们在平台…

2024-10-11
1.5K
科创新知

特斯拉“命运日”即将到来：Robotaxi能否帮马斯克“翻身”？

财联社10月10日讯（编辑刘蕊）不到24小时之后，特斯拉将成为全球瞩目的焦点：特斯拉将在加利福尼亚州伯班克华纳兄弟工作室举行“Robotaxi Day”活动。届时，众多投资者和分析师们将看到期待已久的自动驾驶出租车Cybercab及其他产品的发布。随着“Robotaxi Day”活动的逐步临近，特斯拉股价也在过去几周持续上涨，几乎抹平了年内跌幅——这也表…

2024-10-10
2.8K
科创新知

又发布两款新车的富士康还没在全新领域找到获胜之道

致力于在电动汽车领域开辟新增长曲线的富士康发布两款全新电动汽车，将其乘用车产品阵容扩充至MPV领域。 10月8日，在一年一度的鸿海科技日上，富士康推出MPV车型Model D和中型电动巴士Model U。该MPV新车强调宽敞的内部空间，轴距达到3.2米。在800V电子电气架构的支持下，预计WLTP续航里程约为660公里。富士康依然与意大利车身制造商宾尼法利…

2024-10-09
1.6K
科创新知

33亿增资，合肥为什么再次“抄底”蔚来？

作为中国第一家在美国上市的电动车企，蔚来一度面临崩溃的边缘。 2019年年底，蔚来的股价触及1.32美元的低点，市值距离高点蒸发80%以上。高瓴清空了蔚来股票，红杉也选择了减仓。当时的李斌四处奔走请客吃饭，想为蔚来寻求融资输血。一个故事是，一家国资的老总在席间直斥李斌”乱花钱”。所谓的乱花钱，是指当时的新能源车企几乎都依赖补贴…

2024-10-08
46
科创新知

跨国车企销量都跌了，为何仅欧美“狂”裁员？

自今年以来，欧美汽车企业掀起了一股裁员浪潮。福特、特斯拉、通用汽车、大众集团、Stellantis集团等跨国车企相继宣布裁员计划。车企本次裁员人数大多在千人以上，其中大众集团（正在与工会谈判中）和特斯拉更是超过万人规模。这股寒流已经蔓延至零部件供应链。芯片制造商英飞凌、充电设备制造商Blink Charging、瑞典电池制造商Northvolt等零部件企…

2024-09-30
31
科创新知

7.99万就能提车的Model Y，还顶得住新势力的围攻吗

9月27日，特斯拉上海超级工厂迎来第100万辆车下线。从一片泥洼地到变成全球电动汽车巨头最大的海外基地，特斯拉上海工厂在不到4年时间里实现了产能和制造工艺的双双飞跃。而随着特斯拉副总裁陶琳在社交媒体上写下“感谢每一位新老车主的爱和支持”的同时，这家电动车公司正在被它从前的一众门徒视为必须要跨越的门槛，9月集中上市的新车乐道L60、极氪7X等尤为雄心勃勃。…

2024-09-29
53
科创新知

逼退张大奕的退货率，让丰巢一年狂揽9个亿

9月19日，曾经的“淘宝女装第一人”张大奕用小号发微博称，她将无限期延迟十年老店“吾欢喜的衣橱”的上新，宣告了这个曾经最火的淘宝女装店将关店。她称闭店是因为女装毛利微薄支撑不了各项运营成本，以及，电商越来越高的退货率。就在张大奕宣布关店的三周前，丰巢刚刚向港交所提交招股书，寻求以250亿元的估值上市。招股书显示，连亏八年的丰巢终于在2024年前5个月有了7…

2024-09-27
981
科创新知

OpenAI高层再震荡：CTO官宣离职，Sora恐长期停滞？| 最前线

文｜袁滢靓编辑｜邓咏仪北京时间9月26日凌晨3点，OpenAI 首席技术官（CTO）Mira Murati在X上官宣辞职。那张成就了ChatGPT时代的四人合照，如今两个离职，一人休假，只剩下Altman一人扮演独角戏了。 △图源：X网友 @brewmarkets OpenAI的腥风血雨体质，也在另一方面体现了什么是“明星”公司。前脚GPT-4o高级语音…

2024-09-26
50
科创新知

TikTok Shop鏖战美区，内容电商的蛰伏与加速

TikTok Shop的内容电商，能给全球商家带来新一个增长奇迹吗？文 | 华商韬略梁梁跨境电商正在重新定义全球电商格局。过去五年，中国跨境电商规模增长超10倍，让数以千万计的中国商家因此扬帆出海，也成就了一张以核心电商平台为节点链接的全球商业网络。这是一张史无前例的商业大网，它已经而且还在加速改变全球贸易和消费的格局，并且这张网还在不断进化与分化…

2024-09-25
1.4K
科创新知

华为三折叠黄牛价雪崩：从加近十万到仅加四千，黄牛气懵了

正式发售不到48小时，华为三折叠屏手机Mate XT非凡大师黄牛价就崩了。 9月22日，很多数码博主在社交平台上发视频称，Mate XT三折叠手机价格雪崩，从加价六七万甚至十几万，暴跌至加价四千、两千。甚至到了“每小时一个价”、“你要买我肯定有货；但你要卖我打死不收”的地步。官方途径购买线上每天要“蹲点”抢‍‍‍‍‍‍‍‍线下无现货需排队几万人等待 ‍‍…

2024-09-24
2.2K
科创新知

马斯克终于“投降”，“我们的主权不容出售！”

【文/观察者网专栏作者蒂亚戈·诺加拉，翻译/ 陈佳芮】在无视巴西最高法院的命令三周之后，马斯克终于“投降”，作出重大让步。当地时间9月20日，在一份法庭文件中，社交平台X（原推特）公司的律师表示，X平台已遵守巴西最高法院的相关命令，希望法院能解除对其X平台在巴西境内的禁令。有意思的是，在这次“X事件”中，一度曾是削弱国家主权和民主机构国际干预堡垒的巴…

2024-09-23
7.5K
科创新知

李斌的“县县通”，蔚来的新未来

出品｜网易科技《态度》栏目作者｜定西这个中秋假期，李斌有点忙。为了推进充电县县通和换电县县通计划的落地，他来到该计划最难的地方之一新疆进行实地考察。时间紧迫。蔚来计划在2025年6月30日前，完成除台湾地区、香港特别行政区外，全国所有县级行政区充电桩全覆盖。今年10月前完成新疆14个地级行政区充电全覆盖，包框乌鲁木齐、克拉玛依、哈密、吐鲁番、昌吉、伊…

2024-09-20
1.3K
科创新知

小鹏回应MONA M03自动泊车撞上奥迪：不排除光线等因素致弱势场景

IT之家 9 月 18 日消息，近期一起“小鹏 MONA M03 自动泊车撞上奥迪汽车”的事故，引起了IT之家网友的关注。据每日经济新闻今天下午报道，小鹏汽车相关负责人就此事回应称，“公司售后同学已经联系上客户，在积极处理解决中。” 关于自动泊车状态下发生剐蹭的原因，该负责人表示，目前不排除因光线及其他因素导致的弱势场景，具体原因还要结合具体的数据进行分析。…

2024-09-18
3.6K
科创新知

华为三折叠，炸出570万「黄牛」

「核心提示」人人争当黄牛背后，是三折叠手机备受追捧。沉积的手机市场，太需要这样的“王炸”来唤醒了。作者 | 陈法善编辑 | 刘杨备货量100万台，发布四天就有近570万人预约，华为三折叠手机Mate XT注定是今年最难抢的手机。要知道，根据IDC的统计，2023年中国折叠屏手机总出货量约700.7万台。也就是说，华为这一个单品，就…

2024-09-14
1.1K
科创新知

比亚迪员工总数突破 90 万，技术研发人员近 11 万全球车企第一

IT之家 9 月 13 日消息，比亚迪集团品牌及公关处总经理李云飞今日在微博上透露，今天，比亚迪员工总数突破 90 万，是 5300 多家 A 股上市公司里员工人数最多的，比第二名还要多 40 多万人。李云飞还表示：“比亚迪 90 万员工中，技术研发人员近 11 万，是全球研发人员最多的车企。过去两年还招聘了近 5 万名优秀应届大学生，持续助力大学生就业。…

2024-09-13
547
科创新知

从Vertu到8848，奢侈品手机为何全军覆没

华为三折叠终于发布了，19999元起售。主要噱头是比折叠还多一折，但也引起了互联网的广泛争论。在争论之中，黄牛早已率先抢购。据网上消息，黄牛把三折叠已经炒到了一台65万。一台38万，有人为了提升销量，黄牛给出的利好是全国可飞。大家都知道这个溢价不可持续。可大家的疑惑点在于，华为三折叠的受众是谁？为何有种魔幻的吸引力？如果堆科技参数。我可以告诉…

2024-09-12
803

Stable Diffusion 3来啦！提示文本理解更好，图像质量更强

相关推荐