nnU-Net - 深度学习图像分割软件框架
nnU-Net 是一种自配置的深度学习图像分割软件框架,由德国癌症研究中心(DKFZ)的医学图像计算部门与 Helmholtz Imaging 团队开发。它在 2021 年发表于《Nature ...
nnU-Net 是一种自配置的深度学习图像分割软件框架,由德国癌症研究中心(DKFZ)的医学图像计算部门与 Helmholtz Imaging 团队开发。它在 2021 年发表于《Nature ...
torch-molecule是分子发现机器学习项目,提供了预测模型、生成模型和表示模型的完整工具集。该项目旨在使分子AI模型的实现和部署更加便捷,提供了简洁的API设计和丰富的示例代码。 tor...
DeepChem是专注于化学和药物发现领域的深度学习库,旨在民主化深度学习在药物发现、材料科学和量子化学研究中的应用。该项目提供完整的工具链,包括分子性质预测、分子生成、分子对接等功能模块。 D...
RayAI 是一个构建在 Ray 之上的基础设施项目,专注于让 AI agent(多智能体系统)和工具并行执行更简单、更可靠。它使用 Ray 作为底层分布式计算引擎(即 Ray 提供任务调度、资...
ROCK n ROLL是阿里巴巴开源的强化学习组合框架。ROLL提供强大的训练引擎,ROCK则注入源源不断的环境燃料,给AI开发者提供完整极致的Agentic AI解决方案。 What's RO...
FlashAttention:具有 IO 感知能力的快速且内存高效的精确注意力机制 FlashAttention-2:更快的注意力机制,更好的并行性和工作划分 FlashAttention-3 ...
一个微型 Autograd 引擎。它基于动态构建的 DAG 实现反向传播(反向模式自动微分),并在其上构建一个小型神经网络库,并使用类似 PyTorch 的 API。两者都非常小巧,分别只有大约...
DeepSeek-OCR 是利用视觉模态压缩长文本上下文的新方法。 开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-...
Tile Language (TileLang) 是一种简洁的领域专用语言(DSL),旨在简化 GPU 和 NPU 等加速器上的算子编程,其核心设计理念是将复杂的硬件调度与开发者的算法逻辑解耦。...
Brush 是一个使用高斯分布的3D 重建引擎。它适用于多种系统:macOS/windows/linux、AMD/Nvidia/Intel显卡、Android以及浏览器。为此,它使用了 WebG...
HuMo 是统一 HCVG(Human-Centric Video Generation)框架。 Human-Centric Video Generation,即人体视频生成框架,支持文本、图像...
Mini-o3 是开源多模态模型,专为 “边看边想” 的视觉搜索任务设计。它通过强化学习将工具调用次数扩展到数十轮,在 VisualProbe、V* Bench、HR-Bench、MME-Rea...
Youtu-GraphRAG 是一个基于图Schema实现垂直统一的图增强推理范式,将GraphRAG框架精巧地集成为一个以智能体为核心的有机整体。实现了通过在图Schema上的最小化人为干预下...
uni-ai x 是一个开源、免费、全平台支持的原生 AI 聊天套件,基于 DCloud 的新一代跨平台原生框架 uni-app x 开发,支持 Android、iOS、鸿蒙、Web、微信小程序...
WALL-OSS 是端到端具身智能基础模型。 核心亮点 大规模真实数据训练:自采真机数据,覆盖多样化场景与任务,确保模型具备强泛化性; 创新架构设计:采用 “共享注意力 + 专家分流 (FFN)...
VAREdit 是指令引导编辑框架,将视觉自回归(VAR)架构引入图像编辑,精准地解决了扩散模型的固有顽疾。 VAREdit 将新颖的下一尺度预测范式引入指令引导的图像编辑框架,基于文本指令和量...
USO(Unified Style-Subject Optimized)是一个 “统一风格 - 主体” 定制生成框架,首次把 “风格驱动” 与 “主体驱动” 两类原本对立的图像生成任务合并到单一...
AudioStory 是 LLM 音频生成技术,它将大语言模型与文本‑音频系统结合,能够把复杂的叙事请求拆分为有顺序的子任务,保证场景转换和情感基调的一致性。 AudioStory 采用 “解耦...
AgentFly是基于记忆增强的在线强化学习框架,通过记忆库存储经验轨迹并利用神经案例选择策略实现LLM代理的持续适应能力,无需对底层LLM参数进行微调。 该方法将决策过程建模为记忆增强的马尔可...
Hunyuan-MT 系列模型是面向翻译场景的开源大模型,目前包含两个版本: Hunyuan-MT-7B:单模型版本,支持 33 种语言之间的双向翻译,覆盖中、英、日、法等主流语种以及藏、维、蒙...
没有更多内容
加载失败,请刷新页面