项目生态系统

探索我们的完整项目生态系统,包括核心开源项目和合作伙伴项目,共同推动数据中心 AI 技术的发展与创新

核心开源项目

我们的核心开源项目,为 DCAI 生态系统提供基础技术支撑

DataFlow logo

DataFlow

规模化训练数据构建与清洗系统,为 AI 训练与推理提供可靠数据供给。支持大规模数据流处理,具备高可用性和容错能力,专为机器学习工作负载优化。

数据准备数据智能体高性能数据处理
...
...
OriginHub MyScaleDB logo

OriginHub MyScaleDB

统一的结构化查询与向量检索数据库,融合 SQL 与向量,支持多模态数据统一管理与复杂查询。提供高性能向量搜索和传统关系型数据库功能。

实时分析AIDB4GenAI多模态SQL
...
...

合作伙伴项目

与优秀的合作伙伴共同构建 DCAI 生态系统,推动技术创新与发展

MinerU logo

MinerU

复杂版面表格公式高保真数据解析工具,提供高效的数据清洗和特征工程能力,用于解决科学文献中的符号转换问题,可将 PDF 文档转换为机器可读的 Markdown、JSON 等格式。

数据挖掘PDF 转换机器学习文档处理
...
...
Llama-Factory logo

Llama-Factory

多模型高效训练与便捷部署平台,支持 100 多种模型架构零代码 CLI 和 Web UI 微调。提供完整的模型训练工具链,支持多种优化算法和分布式训练。

LLM微调Web UI零代码
...
...
MemOS logo

MemOS

大模型持久记忆与统一调度引擎,它增强了模型的长期记忆能力。它允许模型存储、检索和管理信息,实现更多上下文感知、一致和个性化的交互。

LLM记忆操作系统个性化
...
...

参与开源贡献

加入我们的开源社区,共同构建下一代数据中心 AI 工具