AIVAULT. Available for select engagements · 2026开放承接 · 2026 / Portfolio · v1.0作品集 · v1.0 / EN · 中文 Durham → Hangzhou达勒姆 → 杭州
Profile   ·   Selected Work   ·   I — VII 作品集   ·   精选项目   ·   I — VII

AIVAULT.

AIVAULT.

An AI engineering studio — we build AI that actually ships. 一支 AI 工程团队 —— 做能真正落地AI

We work at the seam between research-grade models and production systems — from multi-agent pipelines to industrial computer vision deployed in the field.

我们在研究级模型生产级系统的接缝处工作 —— 从多 Agent 流水线,到真正部署在现场的工业计算机视觉。

Focus方向 Agents · RAG · CVAgents · RAG · 计算机视觉
Edge边端 Jetson · LiDAR
Shipping交付 Production systems生产级系统
Open合作 Select engagements精选合作
01 · About 01 · 关于 Who我们

We build end-to-end AI systems — models, orchestration, infrastructure, and the product surface on top. AIVAULT is a small, senior studio taking on select engagements for clients at home and abroad.

我们做端到端的 AI 系统 —— 模型、编排、基础设施,以及最上层的产品。AIVAULT 是一支精干、资深的工作室,常年为国内外客户承接精选项目。

Our practice spans multi-agent orchestration, retrieval-augmented generation, industrial computer vision, and generative-video production automation. We prefer work where the model has to survive contact with the real world — hardware, users, or both.

我们的实践横跨多 Agent 编排、检索增强生成、工业计算机视觉,以及生成式视频的生产自动化。我们偏好那些模型必须经受真实世界考验的工作 —— 面对硬件、面对用户,或两者兼有。

02 · Stack 02 · 技术栈 What做什么

Models & ML模型 & ML a

  • Framework for LLM apps — chains, agents, and tool use.构建 LLM 应用的框架 —— 链式调用、Agent 与工具调用。
  • Vector database for large-scale similarity search — the retrieval backbone for RAG.面向大规模相似度检索的向量数据库 —— RAG 的检索底座。
  • High-throughput LLM serving with paged attention — fast, batched inference.高吞吐 LLM 推理服务,基于 paged attention —— 快速、可批量。
  • Parameter-efficient fine-tuning — adapt a base model by training tiny adapters.参数高效微调 —— 只训练极小的适配器即可定制大模型。

Vision & Edge视觉 & 边端 b

  • Real-time object detection — the workhorse for person, vehicle and defect detection.实时目标检测 —— 人员、车辆、缺陷检测的主力。
  • Face-recognition embeddings via InsightFace — identity matching by cosine distance.基于 InsightFace 的人脸识别 embedding —— 按余弦距离做身份匹配。
  • 3D point-cloud sensing, paired with SLAM — mapping and positioning underground.三维点云感知,配合 SLAM —— 在井下建图与定位。
  • NVIDIA edge module — runs the perception stack on-device, no cloud round-trip.NVIDIA 边缘计算模组 —— 感知栈板载运行,无需上云。

Backend后端 c

  • Python async web framework — typed and fast, the default for serving models.Python 异步 Web 框架 —— 带类型、性能好,服务模型的默认选择。
  • Relational database — durable storage for users, billing and metadata.关系型数据库 —— 用户、计费与元数据的持久化存储。
  • In-memory store — caching, rate limiting and job queues.内存数据库 —— 缓存、限流与任务队列。
  • Containerized deployment — reproducible builds, on-prem or in the cloud.容器化部署 —— 可复现构建,本地或云端皆可。

Product产品 d

  • Frontend frameworks — the product surfaces users actually touch.前端框架 —— 用户真正接触的产品界面。
  • In-WeChat apps — reach China's users with no install.微信生态内的轻应用 —— 无需安装即可触达国内用户。
  • Generative-video APIs — text / image to short clips for the drama pipeline.生成式视频 API —— 文本 / 图像生成短片,用于短剧流水线。
  • Coordinating multiple LLM agents — planning, tools, and review loops.多 Agent 编排 —— 规划、工具调用与审核回路。
03 · Selected Work 03 · 精选项目 How怎么做
Featured精选 / RAG · Enterprise SaaSRAG · 企业级 SaaS / 2025 — 2026 / Live at线上 ragdc.aivault.asia

Multi-LLM RAG SaaS
— RAGDC

多 LLM RAG SaaS
—— RAGDC

Put your company's knowledge into AI — grounded Q&A with citations back to the exact file and page, image-text hybrid retrieval, six flagship models switchable per query, and seat + usage billing. Built on bge-m3, Milvus, and a pluggable multi-provider router.

把企业的知识装进 AI —— 带引用溯源(精确到文件和页码)的有据问答、图文混合检索、六个旗舰模型可逐次切换、按席位 + 用量计费。基于 bge-m3、Milvus 与可插拔的多 provider 路由。

RAG · Image-text retrieval · Multi-provider router · Citations · SaaS
RAG · 图文混检 · 多 provider 路由 · 引用溯源 · SaaS
Read the project查看项目
RAGDC landing — put your company knowledge into AI
03 Featured · Image 01 RAGDC landing · positioning + mockup · 16:9