SpaceX 的 Starship 成功与其 Super Heavy 助推器分离,并于周二晚上进入轨道,但随后开始旋转,并在印度洋不受控地重返地球。据 SpaceX 表示,他们已经清理了 Starship 降落区周围的空域。
这次第九次测试飞行既有成功之处也有失败之处,是今年以来最顺利的一次 Starship 测试,此前连续发生了两次爆炸。Starship 搭载在 Super Heavy 助推器上,于周二晚上从 SpaceX 位于德州南部的设施起飞。这也是首次使用经过飞行验证的 Super Heavy 助推器,该助推器曾在 Starship 第七次飞行测试中完成了发射和回收。
重型助推器成功分离后,Starship 进入太空。但在一次计划测试中,飞船未能打开侧面货舱舱口以部署模拟卫星。飞行后期,Starship 失去姿态控制,即无法正确调整自身姿态以进入大气层。
这次第九次飞行测试距离美国联邦航空管理局( FAA )批准 SpaceX 在今年早些时候连续爆炸之后进行 Starship 火箭系统测试飞行还不到一周时间。
今年一月,SpaceX 在 Starship 重型助推器下降过程中第二次捕捉到该助推器。Starship 成功与助推器分离并点火,顺利升至轨道,但不久后因异常现象而失控。Starship 的残骸坠落在波多黎各附近的空域,迫使 FAA 调整了该空域内数架飞机的航线。
在三月的另一项测试中,Super Heavy 助推器成功分离,并第三次被德州发射塔捕获。Starship 成功进入太空,但在飞行八分钟后,飞船失去了多个 Raptor 引擎,开始出现旋转现象。
由于这两次爆炸事件,FAA 根据 SpaceX 提供的最新安全分析扩大了美国及其他国家对该飞行的危险区域范围。在对第八次飞行测试中 Starship 故障事件进行调查后,SpaceX 对硬件进行了多项改进,以提高可靠性。
好文章,需要你的鼓励
这项来自新加坡国立大学等机构的研究引入了REASONMAP,一个用于评估多模态大语言模型细粒度视觉理解能力的基准测试。研究团队使用来自13个国家30个城市的高分辨率交通地图,构建了1,008个问答对,设计了两级评估框架测量答案的正确性和质量。对15个流行模型的评估揭示了一个意外发现:开源领域的基础模型表现优于推理型模型,而闭源模型则相反。研究还表明,当视觉输入被遮盖时,模型性能普遍下降,证明真正的细粒度视觉推理任务仍需要有效整合多模态信息。
Nvidia公布2026财年一季度业绩,营收441亿美元,同比增长69%;新AI超算与显卡产品陆续亮相,尽管出口管控对H20业务造成影响,但整体AI市场前景依然乐观。
Cerebras WSE 芯片拥有 40 亿晶体管,推理速度达到 NVIDIA 集群的约 2.5 倍,刷新了全球 AI 推理速度记录,为复杂 AI 代理应用提供高性能计算支持。
这项研究提出了"B-score",一种新指标用于检测大语言模型中的偏见。研究人员发现,当模型能看到自己之前对同一问题的回答时(多轮对话),它能够减少偏见并给出更平衡的答案。B-score计算单轮与多轮对话中答案概率的差异,无需外部标注即可识别有偏见的回答。实验证明,将B-score用于回答验证可显著提高准确率,在标准基准测试上平均提升2.9个百分点。这一发现不仅提供了实用工具,还表明大语言模型具有自我纠正能力。