微软已将NASA的Landsat和Sentinel-2协调数据集(HLS)通过其行星计算机平台在Azure上提供服务。
这似乎是Azure容量的绝佳应用——用户可以通过API或直接通过Azure存储访问全球环境数据的PB级信息。微软表示:"这种灵活的科学环境允许用户对数据提出问题,既可以构建应用程序,也可以在平台之上使用应用程序。"
HLS数据集是来自地球监测航天器的庞大数据档案,包括NASA的Landsat 8和9号卫星以及欧洲航天局的Sentinel-2卫星。对于研究气候变化、土地利用变化、农业应用等领域的研究人员来说,这是一个宝贵的工具。
Landsat 8卫星于2013年发射,现在已经有些老化。2021年Landsat 9加入其行列。名为Landsat Next的后续卫星是否会实现,取决于NASA科学项目的最终预算。欧洲航天局目前已发射了Sentinel-2A、B和C。Sentinel-2C于2024年进入轨道,Sentinel-2D将在未来几年发射。与2C结合,它将取代老化的Sentinel-2A和B航天器。
HLS项目是2016年卫星需求工作组的重要成果。据NASA介绍,Landsat可以在16天重访周期内收集30米空间分辨率的观测数据。Sentinel提供10到20米空间分辨率,重访周期为5天。通过HLS的结合,可以每2到3天获得30米空间分辨率的观测数据,卫星数据呈现为一个统一的集合。
NASA为HLS数据集提供资金。该机构目前受到美国政府停摆的影响,在包括大幅削减科学项目在内的预算提案最终确定之前,资金是否会继续提供尚不明确。微软没有回应关于是否可能介入填补任何资金缺口的问题。
考虑到大量计算资源用于AI应用,这似乎是Azure资源的良好用途。然而,微软还为研究人员提出了一些Copilot和AI建议。
微软建议研究人员可能希望使用Azure OpenAI服务"创建增强地球观测分析的智能应用程序"。
或者可以使用NASA地球Copilot原型和自然语言查询来生成地理空间数据的洞察。
微软列出了HLS数据和Azure AI可以使用的方式,包括土地分类和植被监测的自动化、森林砍伐趋势以及环境模式预测。
奇怪的是,作为研究主题,它没有提到专门用于AI应用数据处理的所有数据中心的环境影响。我们无法想象为什么会这样。
Q&A
Q1:HLS数据集包含什么内容?
A:HLS数据集是NASA的Landsat和Sentinel-2协调数据集,包含来自NASA的Landsat 8、9号卫星和欧洲航天局Sentinel-2卫星的地球监测数据,是研究气候变化、土地利用变化、农业应用等领域的重要工具。
Q2:微软Azure如何处理这些卫星数据?
A:微软通过其行星计算机平台在Azure上提供HLS数据集服务,用户可以通过API或直接通过Azure存储访问全球环境数据的PB级信息,还可以结合Azure AI服务进行数据分析和应用开发。
Q3:Landsat和Sentinel卫星的观测能力有什么区别?
A:Landsat可以在16天重访周期内收集30米空间分辨率的观测数据,而Sentinel提供10到20米空间分辨率,重访周期为5天。通过HLS的结合,可以每2到3天获得30米空间分辨率的观测数据。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。