内部人担忧“危机人类生存”！OpenAI的神秘重大突破“Q*算法”究竟是什么？

来源:全天候科技 • 2023-11-24 上午9:20 • 科创新知 • 阅读 23

尽管OpenAI宫斗大戏告一段落，但仍留下了许多未接的谜题。其中最为关键的，就是现（前）CEO 奥特曼为何会被解雇。

OpenAI CTO Mira Murati此前在致员工的内部信件中提到了一个代号为“Q*”的项目。据她称，该项目为”董事会对奥特曼的一系列不满中的因素之一”。

据多家媒体猜测，Q*让OpenAI实现AGI的步伐大大提速，但奥特曼可能没有和董事会详细披露Q*的进展到底有多大，这也符合董事会在解雇奥特曼时所说的“在与董事会沟通时没有始终保持坦诚”。

就在被解雇之前，奥特曼还在公开活动中表示：

“在OpenAI的历史上，我们已经取得了4次突破，最近一次是在过去的几周里。当我们把无知的面纱撕下，把发现的前沿向前推进时，我就在房间里。”

所谓的第四次突破，指的可能就是Q*项目。

什么是 Q*？

什么是Q*？

Q*读作Q star，目前OpenAI内部没有任何关于Q*的详细信息流出。

据一些业内人士猜测，它可能是是机器学习算法Q-Learning（Q学习）的同义词，也许是OpenAI借助Q学习算法打造的新模型的代号，也许是一个相关的项目名称。

根据天风证券分析师孔蓉的说法：

Q学习是一种基于强化学习的算法，用来在马尔科夫决策过程中求解最优控制问题。它的目标是通过学习最优策略，使智能体在未知环境中做出最佳选择。

Q学习依据贝尔曼方程更新状态-动作对应的Q值，逼近最优值函数。智能体通过与环境交互，观察到新的状态和奖励，来更新执行各个动作的Q值。

所谓贝尔曼方程，也被称为动态规划方程，是指数学家理查德·贝尔曼提出的用于解决复杂多阶段问题的公式，通过求解该方程可以找到最优值函数和最优策略。

运行算法的人（或计算机）可以输入一个目标函数，例如“旅行时间最短、成本最低、利润最大、效用最大”等。然后，算法将决定采取何种最佳行动来实现预期结果。

简单来说，Q学习可以通过探索所有可能的路径，学习到通往预期奖励的最短路径（最短路线），通过试错找到更优化的路径，并随着时间的推移达到优化状态，每次都做出更好的决策。

据媒体报道，在奥特曼被解雇之前，OpenAI在内部对Q*进行了演示，显示Q*能够解决小学程度的数学问题。

虽然完成小学数学题听起来没什么出色之处，但科技博客PC Guide指出，OpenAI使用的Q*可能是指贝尔曼方程中的最优值函数。

换句话说，Q*可能代表OpenAI找到或接近了效率优化算法的最优解，实现了通往AGI的关键一步。

Q*会产生哪些后续影响？

目前，OpenAI还没有对关于Q*的一系列问题做出回应。

根据天风证券分析师孔蓉的观察，OpenAI近期的招聘进程表明其在进一步增强强化学习系统的决策能力。

OpenAI近期持续引入强化学习和决策算法研究人员。23年7月份新引进的研究员Noam Brown，开展多步推理和多智能体互动方面的研究。

Noam Brown 此前参与发表的工作将语言模型与规划和强化学习算法结合，大幅提升了AI在复杂策略游戏中的表现，开发出第一批在德扑无上限游戏中击败顶级玩家的AI。

OpenAI 近期于 5 月份发布的研究也表明，调整训练方式和引入更大规模的监督数据，将会显著提升强化学习系统的数学推理能力。OpenAI 引入针对过程的强化学习监督，进一步提升大模型在数据推理与计算的准确性。

据孔融推测，强化学习与决策算法进步或带来Q*大模型能力突破，GPT4 + 强化学习和决策算法，或能实现更强的AI Agent能力。

内容链接：https://www.hpaper.cn/13867.html

索尼FE 24-50mm F2.8 G镜头曝光价格或许低于万元

上一篇 2023-11-24 上午9:19

法国麦当劳推出 150-200kW 电动汽车充电器

下一篇 2023-11-24 上午9:21

科创新知

阿里京东物流“拆墙”进行时：有商家火速换快递，末端快递员担心收入下降

本文来源：时代财经作者：林心林今年“双十一”，两大电商平台和物流商各自为阵的局面将正式终结。图片来源：图虫创意 10月16日，京东物流与淘天集团正式达成合作，京东物流将全面接入淘宝天猫平台，平台商家将能够选择京东物流作为服务商，目前双方对接系统已基本完成，消费者也可以在淘宝和天猫APP内查询京东物流轨迹。这意味着，淘宝与京东这一对电商竞对，将各自过去…

2024-10-17
85
科创新知

AI圈顶流捧场！黄仁勋苏姿丰都来了，联想亮AI Now智能体大招，连甩10多个重磅AI产品

刚刚，联想一场大会，把全球AI圈顶流聚齐了！黄仁勋苏姿丰接连登场、英特尔AMD史无前例首次合作、英特尔CEO现场掏出下一代CPU、扎克伯格剧透XR新品，还有联想智能体大招AI Now正式登场。昨晚，AI量大管饱，精彩镜头应接不暇。智东西西雅图10月15日现场报道，刚刚联想创新科技大会2024正式开幕，联想一口气发布了PC个人AI智能体、搭载英伟达新核弹…

2024-10-16
87
科创新知

AI攻占诺奖背后：新的技术革命成为社会进步发展的重要引擎

“超越人类智慧的AI可以用语言操纵我们，或许会试图说服我们不要关掉开关。” 今年3月，由ChatGPT掀起的AI（人工智能）技术革命背后的奠基性科学家、被誉为“AI教父”的杰弗里·辛顿（Geoffrey E. Hinton），曾对媒体提及他对AI“反噬人类”的担忧。如今，在他心中“危险和机遇并存”的AI，为他带来了诺贝尔物理学奖的荣誉。当地时间10月8日，…

2024-10-15
2.0K
科创新知

苹果自动驾驶汽车项目画上句号：加州测试许可被取消

IT之家 10 月 12 日消息，就在彭博社的马克・古尔曼报道苹果放弃了发布电动汽车的计划六个月后，据 macReports 报道，加州机动车辆管理局（DMV）取消了苹果的自动驾驶车辆测试许可证。据悉，DMV 于 9 月 25 日收到苹果的确认，同意取消该许可证，该许可证于 9 月 27 日被取消。这意味着苹果公司持续了十年之久的电动汽车项目被彻底终结，没…

2024-10-12
1.2K
科创新知

大UP质问平台为什么视频越来越糊，答案比问题要复杂得多

文｜王毓婵编辑｜乔芊 10月8日，在全网拥有超千万粉丝的视频创作者@影视飓风发布了一条视频，标题为《清晰度不如4年前！视频变糊是你的错觉吗？》。这条视频揭示了视频平台为降低流量费用支出，通过降低码率和调整编码格式压缩视频画质的现象。 “2024年，4K视频你应该已经司空见惯。各家平台争先恐后在画质上做文章，我们也在不断更新设备，提升节目的质量。但我们在平台…

2024-10-11
1.6K
科创新知

特斯拉“命运日”即将到来：Robotaxi能否帮马斯克“翻身”？

财联社10月10日讯（编辑刘蕊）不到24小时之后，特斯拉将成为全球瞩目的焦点：特斯拉将在加利福尼亚州伯班克华纳兄弟工作室举行“Robotaxi Day”活动。届时，众多投资者和分析师们将看到期待已久的自动驾驶出租车Cybercab及其他产品的发布。随着“Robotaxi Day”活动的逐步临近，特斯拉股价也在过去几周持续上涨，几乎抹平了年内跌幅——这也表…

2024-10-10
2.8K
科创新知

又发布两款新车的富士康还没在全新领域找到获胜之道

致力于在电动汽车领域开辟新增长曲线的富士康发布两款全新电动汽车，将其乘用车产品阵容扩充至MPV领域。 10月8日，在一年一度的鸿海科技日上，富士康推出MPV车型Model D和中型电动巴士Model U。该MPV新车强调宽敞的内部空间，轴距达到3.2米。在800V电子电气架构的支持下，预计WLTP续航里程约为660公里。富士康依然与意大利车身制造商宾尼法利…

2024-10-09
1.7K
科创新知

33亿增资，合肥为什么再次“抄底”蔚来？

作为中国第一家在美国上市的电动车企，蔚来一度面临崩溃的边缘。 2019年年底，蔚来的股价触及1.32美元的低点，市值距离高点蒸发80%以上。高瓴清空了蔚来股票，红杉也选择了减仓。当时的李斌四处奔走请客吃饭，想为蔚来寻求融资输血。一个故事是，一家国资的老总在席间直斥李斌”乱花钱”。所谓的乱花钱，是指当时的新能源车企几乎都依赖补贴…

2024-10-08
111
科创新知

跨国车企销量都跌了，为何仅欧美“狂”裁员？

自今年以来，欧美汽车企业掀起了一股裁员浪潮。福特、特斯拉、通用汽车、大众集团、Stellantis集团等跨国车企相继宣布裁员计划。车企本次裁员人数大多在千人以上，其中大众集团（正在与工会谈判中）和特斯拉更是超过万人规模。这股寒流已经蔓延至零部件供应链。芯片制造商英飞凌、充电设备制造商Blink Charging、瑞典电池制造商Northvolt等零部件企…

2024-09-30
104
科创新知

7.99万就能提车的Model Y，还顶得住新势力的围攻吗

9月27日，特斯拉上海超级工厂迎来第100万辆车下线。从一片泥洼地到变成全球电动汽车巨头最大的海外基地，特斯拉上海工厂在不到4年时间里实现了产能和制造工艺的双双飞跃。而随着特斯拉副总裁陶琳在社交媒体上写下“感谢每一位新老车主的爱和支持”的同时，这家电动车公司正在被它从前的一众门徒视为必须要跨越的门槛，9月集中上市的新车乐道L60、极氪7X等尤为雄心勃勃。…

2024-09-29
119
科创新知

逼退张大奕的退货率，让丰巢一年狂揽9个亿

9月19日，曾经的“淘宝女装第一人”张大奕用小号发微博称，她将无限期延迟十年老店“吾欢喜的衣橱”的上新，宣告了这个曾经最火的淘宝女装店将关店。她称闭店是因为女装毛利微薄支撑不了各项运营成本，以及，电商越来越高的退货率。就在张大奕宣布关店的三周前，丰巢刚刚向港交所提交招股书，寻求以250亿元的估值上市。招股书显示，连亏八年的丰巢终于在2024年前5个月有了7…

2024-09-27
1.1K
科创新知

OpenAI高层再震荡：CTO官宣离职，Sora恐长期停滞？| 最前线

文｜袁滢靓编辑｜邓咏仪北京时间9月26日凌晨3点，OpenAI 首席技术官（CTO）Mira Murati在X上官宣辞职。那张成就了ChatGPT时代的四人合照，如今两个离职，一人休假，只剩下Altman一人扮演独角戏了。 △图源：X网友 @brewmarkets OpenAI的腥风血雨体质，也在另一方面体现了什么是“明星”公司。前脚GPT-4o高级语音…

2024-09-26
119
科创新知

TikTok Shop鏖战美区，内容电商的蛰伏与加速

TikTok Shop的内容电商，能给全球商家带来新一个增长奇迹吗？文 | 华商韬略梁梁跨境电商正在重新定义全球电商格局。过去五年，中国跨境电商规模增长超10倍，让数以千万计的中国商家因此扬帆出海，也成就了一张以核心电商平台为节点链接的全球商业网络。这是一张史无前例的商业大网，它已经而且还在加速改变全球贸易和消费的格局，并且这张网还在不断进化与分化…

2024-09-25
1.5K
科创新知

华为三折叠黄牛价雪崩：从加近十万到仅加四千，黄牛气懵了

正式发售不到48小时，华为三折叠屏手机Mate XT非凡大师黄牛价就崩了。 9月22日，很多数码博主在社交平台上发视频称，Mate XT三折叠手机价格雪崩，从加价六七万甚至十几万，暴跌至加价四千、两千。甚至到了“每小时一个价”、“你要买我肯定有货；但你要卖我打死不收”的地步。官方途径购买线上每天要“蹲点”抢‍‍‍‍‍‍‍‍线下无现货需排队几万人等待 ‍‍…

2024-09-24
2.3K
科创新知

马斯克终于“投降”，“我们的主权不容出售！”

【文/观察者网专栏作者蒂亚戈·诺加拉，翻译/ 陈佳芮】在无视巴西最高法院的命令三周之后，马斯克终于“投降”，作出重大让步。当地时间9月20日，在一份法庭文件中，社交平台X（原推特）公司的律师表示，X平台已遵守巴西最高法院的相关命令，希望法院能解除对其X平台在巴西境内的禁令。有意思的是，在这次“X事件”中，一度曾是削弱国家主权和民主机构国际干预堡垒的巴…

2024-09-23
7.5K
科创新知

李斌的“县县通”，蔚来的新未来

出品｜网易科技《态度》栏目作者｜定西这个中秋假期，李斌有点忙。为了推进充电县县通和换电县县通计划的落地，他来到该计划最难的地方之一新疆进行实地考察。时间紧迫。蔚来计划在2025年6月30日前，完成除台湾地区、香港特别行政区外，全国所有县级行政区充电桩全覆盖。今年10月前完成新疆14个地级行政区充电全覆盖，包框乌鲁木齐、克拉玛依、哈密、吐鲁番、昌吉、伊…

2024-09-20
1.4K
科创新知

小鹏回应MONA M03自动泊车撞上奥迪：不排除光线等因素致弱势场景

IT之家 9 月 18 日消息，近期一起“小鹏 MONA M03 自动泊车撞上奥迪汽车”的事故，引起了IT之家网友的关注。据每日经济新闻今天下午报道，小鹏汽车相关负责人就此事回应称，“公司售后同学已经联系上客户，在积极处理解决中。” 关于自动泊车状态下发生剐蹭的原因，该负责人表示，目前不排除因光线及其他因素导致的弱势场景，具体原因还要结合具体的数据进行分析。…

2024-09-18
3.6K
科创新知

华为三折叠，炸出570万「黄牛」

「核心提示」人人争当黄牛背后，是三折叠手机备受追捧。沉积的手机市场，太需要这样的“王炸”来唤醒了。作者 | 陈法善编辑 | 刘杨备货量100万台，发布四天就有近570万人预约，华为三折叠手机Mate XT注定是今年最难抢的手机。要知道，根据IDC的统计，2023年中国折叠屏手机总出货量约700.7万台。也就是说，华为这一个单品，就…

2024-09-14
1.2K
科创新知

比亚迪员工总数突破 90 万，技术研发人员近 11 万全球车企第一

IT之家 9 月 13 日消息，比亚迪集团品牌及公关处总经理李云飞今日在微博上透露，今天，比亚迪员工总数突破 90 万，是 5300 多家 A 股上市公司里员工人数最多的，比第二名还要多 40 多万人。李云飞还表示：“比亚迪 90 万员工中，技术研发人员近 11 万，是全球研发人员最多的车企。过去两年还招聘了近 5 万名优秀应届大学生，持续助力大学生就业。…

2024-09-13
624
科创新知

从Vertu到8848，奢侈品手机为何全军覆没

华为三折叠终于发布了，19999元起售。主要噱头是比折叠还多一折，但也引起了互联网的广泛争论。在争论之中，黄牛早已率先抢购。据网上消息，黄牛把三折叠已经炒到了一台65万。一台38万，有人为了提升销量，黄牛给出的利好是全国可飞。大家都知道这个溢价不可持续。可大家的疑惑点在于，华为三折叠的受众是谁？为何有种魔幻的吸引力？如果堆科技参数。我可以告诉…

2024-09-12
880

内部人担忧“危机人类生存”！OpenAI的神秘重大突破“Q*算法”究竟是什么？

相关推荐