深度学习与微调


  • brief introduction
  • Table of contents
  • Latest documents

    2、DeepSeek OCR 生产级vLLM本地部署

    1. 什么是 DeepSeek OCR? DeepSeek OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高 容量的专家混合语言模型解码。阶段一融合窗口化 SAM 视觉 Transformer、致密 CLIP-Large 编码器与 16× 卷积压缩器;阶段二使用 DeepSeek-3B-MoE 解码器(每个 Token 激活约 5.7 亿………

    李智 - Nov. 20, 2025, 5:20 p.m.


    1、算力服务器环境搭建

    算力服务器环境搭建 一、安装动态GPU监控库 ```python pip install nvitop 开始监控 nvitop ``` 二、魔塔社区 魔塔社区安装包 python pip install modelscope 魔塔社区模型下载脚本 ```python 模型下载(hg格式的) from modelscope import snapshot_download model_dir = ………

    李智 - Oct. 14, 2025, 1:46 p.m.



    李智