深度学习与微调


  • 简介
  • 目录大纲
  • 最新文档

    2、DeepSeek OCR 生产级vLLM本地部署

    1. 什么是 DeepSeek OCR? DeepSeek OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高 容量的专家混合语言模型解码。阶段一融合窗口化 SAM 视觉 Transformer、致密 CLIP-Large 编码器与 16× 卷积压缩器;阶段二使用 DeepSeek-3B-MoE 解码器(每个 Token 激活约 5.7 亿参……

    李智 - 2025年11月20日 17:20


    1、算力服务器环境搭建

    算力服务器环境搭建 一、安装动态GPU监控库 ```python pip install nvitop 开始监控 nvitop ``` 二、魔塔社区 魔塔社区安装包 python pip install modelscope 魔塔社区模型下载脚本 ```python 模型下载(hg格式的) from modelscope import snapshot_download model_dir = s……

    李智 - 2025年10月14日 13:46



    李智