txtai 5.0 发布,构建 AI 驱动的语义搜索应用

来源: OSCHINA
编辑:
2022-09-29 07:32:53

txtai 5.0 已发布,这是一个重要的新版本,增加了语义图,以及启用外部集成,还包含一些改进和错误修复。

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

新特性

  • 添加基于评分 (scoring-based) 的搜索 (#327)
  • 添加用于独立嵌入组件的 notebook 演示功能 (#328)
  • 添加 SQL 表达式列 (#338)
  • 添加语义图组件 (#339)
  • 添加可覆盖语义图的 notebook (#341)
  • 添加图文档 (#343)
  • 支持自定义 ann、数据库和图实例 (#344)

改进

  • 优化 embeddings.save 文档,提升可读性 (#325)
  • 修改嵌入搜索候选的默认逻辑 (#326)
  • 升级控制台,支持按条件导入库 (#333)
  • 升级 ANN 软件包,确保术语更加一致 (#334)
  • 应用程序支持非文本文档元素 (#335)
  • 升级工作流文档,用于记录生成器执行 (#336)
  • 升级 audio transcription notebook,确保包含 OpenAI Whisper 示例 (#345)

Bugfix

  • 在没有解析 token 的情况下调用 score.index 会导致错误 (#337)
  • 修复 transformers v4.22 中的 cached_path 错误 (#340)
  • 修复 docker 命令 "--it" (#346)
  • 修复在控制台加载压缩索引时出现的错误 (#347)

详情查看 Release Note

展开阅读全文
4 收藏
分享
1 评论
4 收藏
分享
返回顶部
顶部