
https://github.com/lpdswing/mineru-web
MinerU Web 是一个现代化的文档智能处理平台,基于先进的 AI 技术,提供文档解析、信息提取和智能分析功能。本项目采用前后端分离架构,结合容器化技术,为用户提供高效、可靠的文档处理解决方案。
# 克隆项目 git clone https://github.com/lpdswing/mineru-web.git cd mineru-web # 下载模型文件 # 更新为 2.0 模型 python download_models.py modelscope 或 python download_models.py huggingface # 复制环境变量模板 cp .env.example .env # 编辑 .env 文件,修改 MinIO 地址 MINIO_ENDPOINT=your-minio-address:9000 # 复制 mineru 配置文件模板 cp mineru.example.json mineru.json # 修改 endpoint "bucket_info": { "mds": [ "minioadmin", "minioadmin", "http://your-minio-address:9000" ] }, # 启动服务 docker-compose up -d # 参考以下网址安装 mc https://min.io/docs/minio/linux/reference/minio-mc.html # 添加 minio 的 alias mc alias set local http://localhost:9000 minioadmin minioadmin # 设置 mds 桶为 public mc anonymous set download local/mds
首页 - 展示系统概览和快速操作
文件管理 - 支持多种文档格式的上传和管理
文档预览 - 智能解析和展示文档内容
文件上次 - 批量上传
# 启动本地开发环境 docker-compose -f docker-compose.local.yml up -d mineru-web/ ├── backend/ # 后端服务 │ ├── app/ # 应用代码 │ ├── tests/ # 测试用例 │ └── Dockerfile # 后端 Docker 配置 ├── frontend/ # 前端应用 │ ├── src/ # 源代码 │ ├── public/ # 静态资源 │ └── Dockerfile # 前端 Docker 配置 ├── models/ # AI 模型文件 ├── magic-pdf.json # 模型配置文件 ├── docker-compose.yml # 生产环境配置 ├── docker-compose.local.yml # 开发环境配置 └── README.md # 项目文档 REDIS_HOST:Redis 服务器地址MINIO_ENDPOINT:MinIO 服务器地址DATABASE_URL:数据库连接 URL我们欢迎各种形式的贡献,包括但不限于:
本项目采用 AGPL-3.0 协议开源,详情请参见 LICENSE 文件。