视觉问答研究模块化框架 Pythia

BSD
Python
跨平台
Facebook
2019-05-22
xplanet

Pythia 是 Facebook 人工智能研究(Facebook AI Research,FAIR)的视觉问答研究模块化框架,它建立在 PyTorch 之上。

特性:

  • Model Zoo:最先进的视觉和语言模型的参考实现,包括 LoRRA(SoQ on VQA 和 TextVQA)、Pythia 模型(VQA 2018 挑战获胜者)和 BAN。
  • Multi-Tasking:支持多任务,允许同时训练多个数据集。
  • Datasets:包括对内置的各种数据集的支持,包括 VQA、VizWiz、TextVQA 和 VisualDialog。
  • Modules:为视觉和语言领域中的许多常用图层提供实现
  • Distributed:支持基于 DataParallel 和 DistributedDataParallel 的分布式培训。
  • Unopinionated:对于基于它构建的数据集和模型实现不受影响。
  • Customization:可自定义损失、指标、调度、优化器、张量板等等

Pythia 还可以作为视觉和语言数据集挑战的入门代码库(TextVQA 挑战、VQA 挑战)。

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

没有银弹-读《人月神话》重点摘录

作为软件工程的经典著作,《人月神话》的主要贡献是对软件开发过程的几个重要关键点,提出了独到的见解。 这几个关键内容就是: (1)提倡外科手术式的团队组织: [在软件开发组织上的过份民...

06/10 13:02
1
0

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部