Monday, December 08, 2025

AI产业热议:从投融资到技术突破

其他

产业新风向探讨、AI技术突破、企业动态及投融资摘要:

寻找产业新风向,与院士、企业家共话AI落地

我们见证了百模大战的硝烟逐渐散去,见证了参数规模从千亿卷向万亿,也见证了像DeepSeek这样的技术黑马如何以极致的性价比撕开市场的缺口。但当热度稍退,一个更尖锐、更现实的问题摆在了所有从业者面前:模型越来越强,但在各行各业的落地应用变得顺畅了吗?这不仅是资本市场的拷问,更是即将到来的新一年,中国AI产业必须跨越的“生死线”。站在新旧周期的交汇点上,我们有一个清晰的判断:中国AI产业正在经历一场从“炼大模型”到“炼大应用”的范式转移,谁能率先跑通商业闭环,谁能把AI变成像水和电一样廉价且易得的基础设施,谁就可能是下一个周期的赢家。从“仰望星空”到“下地干活”,过去的两三年,科技圈的聚光灯都在通用大模型上,仿佛只要参数规模足够大,一切商业问题都能迎刃而解。但进入2025年,风向标已悄然转向,单纯的技术可行性不再是行业的天花板,商业可行性成了所有企业必须守住的底线。通用的“锤子”已经很难敲好每一颗特殊的“钉子”,因此AI行业正在从“仰望星空”的技术浪漫主义,转向“下地干活”的商业实用主义。

来源: 36氪 阅读更多
寻找产业新风向,与院士、企业家共话AI落地

LLM强化学习不稳定之谜,被Qwen团队从「一阶近似」视角解开

如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。然而,主流 RL 算法(如 REINFORCE 与 GRPO)普遍采用基于 token 的优化目标。这种「奖励在序列级、优化在 token 级」的不匹配引发了对于它们理论健全性与训练稳定性的担忧,因此已经有研究尝试直接使用序列级优化目标。此外,token 级优化目标在混合专家(MoE)模型的 RL 训练中带来了新的挑战,比如 MoE 的动态专家路由机制可能破坏 token 级重要性采样比的有效性。由此引出的关键问题是:在什么条件下,用 token 级目标优化序列级奖励是合理的?有效程度又是怎样的?针对这些问题,阿里千问团队提出了一种针对 LLM 的全新 RL 公式化方法。核心洞察是:为了优化序列级奖励的期望值,可以使用一个替代(surrogate)token 级目标作为其一阶近似。这一近似在以下两种偏差都足够小的条件下才成立:训练与推理之间的数值差异用于采样响应的 rollout 策略与需要优化的目标策略之间的偏差。这一观点从原理上解释了多种 RL 稳定训练技巧的有效性,比如 1)重要性采样权重天然出现在基于该一阶近似的 token 级替代目标中;2)剪切(Clipping)机制通过限制策略变化幅度来抑制策略陈旧;3)在 MoE 中,路由重放(Routing Replay)方法通过在策略优化过程中固定专家路由,能够同时减少训练–推理差异与策略陈旧,从而提高训练稳定性。

来源: 机器之心 阅读更多
LLM强化学习不稳定之谜,被Qwen团队从「一阶近似」视角解开

为AI提供一副公平的脸谱:索尼AI带来更为公正的AI视觉新标杆

编辑丨&过去十多年里,AI 在图像识别、面部识别、姿态估计等领域飞速发展。从自动驾驶、智能监控,到社交媒体滤镜、增强现实,视觉 AI 几乎无处不在。但与此同时,人们也越来越意识到一个问题:许多视觉 AI 模型,在多样性等方面缺乏深度,并且持续传递着偏见。这些数据集损害了 AI 模型的公平性和准确性,并剥夺了利益相关者的权益。为此,索尼 AI 推出了公平的以人为本的图像基准 FHIBE,可作为许多以人为本的计算机视觉任务的公平性评估数据集,包括姿态估计、人员分割、人脸检测和验证,以及视觉问答。相关研究内容,以「Fair human-centric image dataset for ethical AI benchmarking」为题,发布在《Nature》。设计中的考量传统多数视觉数据集来源于网络爬虫和未经授权的图像采集,往往缺乏:数据主体同意与授权人口与地理多样性详尽结构化标签(肤色、发色、年龄、性别、自我认同等)环境 / 拍摄条件 / 器材 /背景 /姿态 /遮挡 等现实复杂因素这些不足不仅违背伦理,更使得模型对多数人群的表现不确定、容易引入偏见。更糟的是,在某些任务(如视觉问答、姿态估计、人像分割)上,缺乏适合的大规模公开基准集,导致开发者无法系统检测或纠正偏差。故而,评估模型和减轻偏见对于伦理人工智能的发展至关重要。FHIBE 数据集来自于 1,711 名主要受试者,包含 10,318 张共计 1,981 个独特个体的图像,每个主要主题平均有六张图像。这个数据集还具备自我报告的姿态和互动标注,囊括了各种身体、头部、互动姿态,与丰富的人体外观特征。此外,FHIBE 包含两个衍生人脸数据集,这两个数据集也同样包含所有标注。与现有数据集相比,FHIBE 作为唯一一个为人工智能评估和偏差缓解而收集的数据集,具有坚实的同意基础;相比其他基于同意的数据集,在诊断人工智能中的偏见方面具有更大的实用性。

来源: 机器之心 阅读更多
为AI提供一副公平的脸谱:索尼AI带来更为公正的AI视觉新标杆
热门开源项目(GitHub项目、工具推荐)

PasoDoble:大模型版类GAN训练法

大型语言模型(LLMs)虽然通过可验证奖励的强化学习(RLVR)取得了显著进展,但仍然在很大程度上依赖外部监督(例如人工标注的数据)。自博弈(self-play)提供了一种有前景的替代方案,使模型能够通过与自身反复对抗来学习,从而减少对外部监督的依赖。GAN 则提供了另一种更具吸引力的训练范式:通过对抗式地训练两个模型,其中一个模型专注于生成具有挑战性的任务或对抗样本,另一个模型则专注于解决这些任务。于是问题来了:LLM 是否也可以像 GAN 一样进行训练?我们的希望是,通过赋予每个模型不同的专门化角色,可以促进持续的竞争与共同进化,从而让它们能够解决单一模型可能从根本上无法胜任的任务。为解决这一难题,来自康奈尔大学的 NLP 团队提出了 PasoDoble,一个面向大语言模型的全新类 GAN 训练框架。PasoDoble 通过对抗式地训练两个几乎相同的模型:Proposer 用于生成带有标准答案的高难度问题,Solver 则尝试解决这些问题。我们进一步利用高质量的数学预训练语料,并引入离线训练范式,以缓解潜在的训练不稳定性。值得注意的是,PasoDoble 在整个训练过程中不依赖任何监督信号。论文提出了 PasoDoble 训练框架的详细方法,包括训练目标、优化算法和实验评估。该框架能够有效提升大语言模型的推理能力,尤其在解决复杂任务方面表现出色。通过 PasoDoble 训练的模型在多个基准测试上取得了优异成绩,验证了该方法的有效性。

来源: 机器之心 阅读更多
PasoDoble:大模型版类GAN训练法

CKDA:跨模态知识解耦与对齐的可见光-红外终身行人重识别方法

针对单模态专用知识获取与跨模态公共知识保留间的冲突,北京大学彭宇新教授团队提出了跨模态知识解耦与对齐的可见光-红外终身行人重识别方法 CKDA。CKDA 方法通过跨模态通用提示模块与单模态专用提示模块显式地解耦并净化不同模态通用与特定模态专用的鉴别性信息,从而避免二者间的相互干扰,并在一对彼此独立的模态内与模态间特征空间中分别对齐解耦后的新旧知识,实现跨模态知识的高效权衡。本文提出的 CKDA 方法在四个常用可见光-红外行人重识别数据集组成的终身行人重识别基准上均取得了当前最优的性能。CKDA 的核心思想是通过跨模态通用提示模块与单模态专用提示模块显式地解耦并净化不同模态通用与特定模态专用的鉴别性信息,从而避免二者间的相互干扰。CKDA 在多模态特征空间中构建了两个独立的特征表示子空间,一个用于跨模态公共知识的表示,另一个用于单模态专用知识的表示。在训练过程中,CKDA 通过跨模态通用提示模块和单模态专用提示模块分别净化和优化来自不同模态的特征。跨模态通用提示模块提取跨模态通用的特征,单模态专用提示模块提取特定模态专用的特征。在特征表示子空间中,CKDA 进行了两个独立的特征对齐,从而实现跨模态知识的高效权衡。这种跨模态知识解耦与对齐的方法不仅解决了单模态专用知识获取与跨模态公共知识保留间的冲突,还提高了不同类型模态之间知识的共享程度,从而提高了模型的泛化能力。

来源: 机器之心 阅读更多
CKDA:跨模态知识解耦与对齐的可见光-红外终身行人重识别方法
学术论文(最新研究、论文摘要)

检测情感动态轨迹:大语言模型情感支持的评估框架

近日,由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《检测情感动态轨迹:大语言模型情感支持的评估框架》论文,获 AAAI 2026 录用。研究背景情感支持是人类与人工智能交互的核心能力,现有的大语言模型(LLMs)评估往往依赖于简短、静态的对话,未能捕捉到情感支持的动态和长期性质。为了更好地评估 LLMs 的情感支持能力,团队提出了一套全新的、检测情感动态轨迹的评估框架(简称 ETrajEval)。ETrajEval 基于心理学理论构建了一个包含 328 个交互环境,以及环境中可能出现的影响人类情绪变化的因素。通过模拟真实的情感交互过程,ETrajEval 能够系统地评估 LLMs 在长期对话中提供情感支持的能力。ETrajEval 的核心贡献在于:1)提供了一个系统性的情感动态轨迹评估框架;2)通过实际场景模拟,评估 LLMs 在长期情感支持中的表现;3)为大语言模型情感支持的研究提供了新的视角和方法。

来源: 机器之心 阅读更多
检测情感动态轨迹:大语言模型情感支持的评估框架

AI合成研究初创公司Aaru获得1亿美元A轮融资

据消息来源称,这家一年前成立的研究模拟人群的AI公司正在进行多级估值轮融资。Aaru 由鼎晖投资领投,南京创投、金景资本、金固股份跟投,资金总额达数亿元。Aaru 将利用这笔资金在具身智能数据和硬件领域持续投入。Aaru 的核心团队包括创始人兼 CEO 喻超、CTO 曹俊亮和联席 CTO 丁琰,他们均毕业于知名高校并拥有丰富的产业经验和深厚的技术积累。Aaru 的产品矩阵涵盖了 LUS、MOS 系列人形机器人以及关键零部件,如机器人关节模组、视触觉模组等。Aaru 的 FastUMI 高效数据采集系统是其核心竞争力之一,能够高效地采集真实场景数据并构建具身智能基础设施,推动具身智能技术在多领域的规模化落地与商业化应用。Aaru 已经在家庭、物流、制造等高价值产业场景中取得显著成果,与国内外多家头部客户达成合作,并实现了大规模的商业化落地。

来源: TechCrunch 阅读更多
AI合成研究初创公司Aaru获得1亿美元A轮融资
技术趋势(技术突破、创新应用)

苹果资深高管正加速离职;5款百万抗癌药纳入首版商保目录

12月7日凌晨的最新爆料显示,美国苹果公司正在面临“后乔布斯时代”最严峻的人事动荡:资深高管正因各种原因加速离职。这4名高管均直接向首席执行官库克汇报,标志着消费电子巨头近十几年来罕见的高层震荡。背后的原因不难解释:苹果管理层以高度稳定著称,稳定了十几年后,这批老将要么已经迈入花甲之年,要么接近这个年龄段。与此同时,5款百万抗癌针纳入首版商保目录,这些药物包括替尔泊肽、国产ADC(抗体偶联药物)芦康沙妥珠单抗等。此次目录调整新增114种药品,其中50种为1类创新药。商保创新药目录则覆盖了5款国产抗癌药CAR-T(嵌合抗原受体T细胞免疫疗法)细胞药物、2款进口阿尔茨海默病药物及罕见病药物。如果自费使用CAR-T疗法,单次治疗费用超过百万元,纳入商保目录后将大大减轻患者的经济负担。

来源: 36氪 阅读更多
苹果资深高管正加速离职;5款百万抗癌药纳入首版商保目录

AI技术变革:从大模型到具身智能

从大模型到具身智能,AI正在经历一场深刻的技术变革。大模型以其强大的计算能力和泛化能力在自然语言处理等领域取得了显著成果,但它们仍然存在落地难题。具身智能则通过赋予机器人感知、决策和执行等能力,使其能够在复杂的真实环境中执行任务。具身智能技术的发展,不仅能够推动AI在工业、医疗、物流等领域的广泛应用,还能够进一步提升AI的智能化水平。具身智能机器人不仅能够执行高精度的工业任务,还能提供情感陪护等服务。在实际应用中,具身智能机器人已经展现出了广阔的应用前景,如智能制造、无人零售、医疗康养等多个场景。以灵生科技为例,该公司专注于打造新一代人形及具身智能机器人的通用大脑平台,基于完全自研的真实场景数采治理平台LDP和具身世界模型LWM,赋能人形机器人智能与泛化操作。灵生科技已经与国内外多个头部厂商和央企签约订单,展现了其在具身智能领域的技术实力和市场潜力。具身智能技术不仅能够提高生产效率,还能够提供更多人性化的服务,成为推动经济社会发展的重要力量。

来源: 36氪 阅读更多
AI技术变革:从大模型到具身智能
Views: 711Updated: Jan 22, 2026 02:55