txtai 4.6 发布,项目 2 周年

来源: OSCHINA
2022-08-17 07:44:49

txtai 4.6 已发布,这是 txtai 的第 25 个版本,发布于项目 2 周年纪念日之际txtai 4.6 是一个大型但向后兼容的版本,此版本在嵌入和工作流之间添加了更好的集成;还添加了许多重要的性能改进和错误修复。

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

具体更新内容包括:

New Features

  • 将转换工作流操作添加到应用程序(#281
  • 添加在应用程序中解析工作流的能力 ( #290 )
  • sql 查询语句中的 OFFSET(#293
  • 添加网页摘要图像生成 notebook(#299
  • 添加关于用 native code 运行 txtai 的 notebook(#304
  • 将 mmap 参数添加到 Faiss ( #308 )
  • 为文档添加索引指南(#312

Improvements

  • 更新 pipeline workflow notebook(#292
  • 更新 tabular notebook(#297
  • 降低 Pillow 库所需的版本以防止不必要的升级 ( #303 )
  • Embeddings vector batch 改进 ( #309 )
  • 对当前的 pickle 协议使用单个常量(#310
  • 将量化配置参数移动到 Faiss ( #311 )
  • 使用新的演示和图表更新文档(#313
  • 改善大查询限制下的嵌入性能 ( #318 )

Bug 修复

  • ModuleNotFoundError:没有名为“transformers.hf_api”的模块(#274
  • ONNX 和 Protobuf 的依赖性问题 ( #285 )
  • key 应该是 writable,而不是path(#287
  • 修复 mkdocstrings bug 对构建脚本的破坏性改变 ( #289 )
  • 在 Embeddings 中插入多种数据类型(文本、文档、对象)时的索引 id 同步问题(#294
  • 处理列表字段时 Tabular pipeline 抛出错误 ( #296 )
  • txtai 负载测试(#305
  • 将云配置添加到 application.upsert 方法 ( #306 )

详情可查看更新说明:https://github.com/neuml/txtai/releases/tag/v4.6.0

展开阅读全文
4 收藏
分享
0 评论
4 收藏
分享
返回顶部
顶部