据雷锋网AI科技评论了解,最近Facebook基于新的方法和数据源,开发并开源了一个目前为止最大的并行语料数据集 CCMatrix。这个数据集包含45亿并行语料(是WikiMatrix的近50倍),覆盖576种语言对。论文:https://arxiv.org/abs/1911.04944 数据集开源地址:https://github.com/facebookresearch/LASER/tree/master/tas...
隐私保护是机器学习领域的重要伦理问题之一,而差分隐私(DP)是行之有效的隐私保护手段。那么,如何方便地使用差分隐私来训练机器学习模型呢?近日,Facebook 开源了 Opacus 库,支持以这种方式训练 PyTorch 模型。近日,Facebook 开源了一个新型库 Opacus,它支持使用差分隐私来训练 PyTorch 模型,扩展性优于目前的 SO...
Polygames是一个开源的研究框架,其通过自演的方式来训练策略游戏中的深度学习代理。Polygames基于众所周知的零学习概念,使代理通过与环境的交互来控制环境,且无需预设任何训练。乍一看,Polygames似乎类似于Alpha Zero或ELF OpenGo等其他游戏学习框架,但FAIR堆栈在这个领域出了自己的一份力。对于初学者,Polygames支...
PyTorch的开源为全球AI研究者提供了一个统一的工具,这种开放的策略帮助Facebook聚集了开发者资源,让PyTorch成为深度学习领域的现象级选手。你在用PyTorch解决问题的同时,其实也在无形中帮Facebook打工,优化它的生态,这是一种双赢。 开源吸粉的操作学 开源项目的竞争核心是社区。PyTorch通过开源,不仅让开发者免费使用,还...
Ego 4D是Facebook在AI领域的一个长期项目,旨在增强AI从第一人称视角理解世界并与人类互动的能力,解决研究AI对以自我为中心的感知时面临的挑战。昨天,Facebook宣布开源Ego 4D(Egocentric 4D Perception)计划数据集,该计划是对第一人称或“以自我为中心”的视频进行分析,由两个主要部分组成:一个开放的以自我为...
目前时间序列分析以及建模的技术非常多,但相对散乱,本次 FaceBook 开源了 Kats,它是一款轻量级的、易于使用的、通用的时间序列分析框架,包括:预测、异常检测、多元分析和特征提取嵌入。 Kats 是第一个开发标准并连接时间序列分析各个领域的综合 Python 库,用户可以在这里探索其时间序列数据的基本特征,预测未来值,监视...
Facebook一直在与开源社区一起建立这样一个框架。今天,我们将第一个生产就绪(production-ready)的 Caffe2 开源,这是一个轻量级和模块化的深度学习框架,强调便携性,同时保持了可扩展性和性能。 我们致力于为社区提供高性能的机器学习工具,以便每个人都能创造智能应用和服务。Caffe2 提供了教学和示例,演示了用一台机器...
【新智元导读】昨天谷歌开源了TensorFlow自动文本摘要生成模型,今天 Facebook 宣布开源计算机视觉系统,称该系统能“从像素水平理解物体”,Facebook 希望开源能加速计算机视觉的发展。不过,Facebook 并没有在自家产品中使用这些工具,像这样落实到具体应用前就开源,跟通常所说的“开源”有些不同。对此,Facebook人工智能团队...
Facebook,作为全球领先的社交平台之一,其在技术领域的创新不仅体现在产品功能的实现上,也积极推动开源社区的发展。开源项目已经成为Facebook技术战略的重要组成部分,通过开源,Facebook不仅加速了技术进步,还帮助开发者社区共同进步,创造出更具影响力的工具和平台。
今日,Facebook 开源了适合大规模产品和服务的强化学习平台 Horizon,这是第一个使用强化学习在大规模生产环境中优化系统的开源端到端平台。Horizon 包含的工作流程和算法建立在开放的框架上(PyTorch 1.0、Caffe2、Spark),任何使用 RL 的人都可以访问 Horizon。去年,Facebook 内部已经广泛应用 Horizon,包括帮助...