2026-07-03 AI 开发日报(DEMO)

B站 AI 技术分享官 #1

大模型微调实战:用 LoRA 适配你的业务

手把手教你用 LoRA + QLoRA 在消费级显卡上微调 7B 大模型

  • LoRA 通过低秩矩阵近似全量更新,参数减少 99%
  • QLoRA 4-bit 量化让 7B 模型能跑在 24GB 显存
  • 推荐路径:LoRA → QLoRA → DPO/RLHF
详细解读
### 为什么需要 LoRA 全量微调 7B 模型需要约 60GB 显存,LoRA 把参数降到 16GB,速度提升 3 倍。 ### 实战代码 完整的 Colab 笔记本,从加载 Qwen-7B 到 LoRA 微调 3 epoch。
机器之心 #2

Anthropic 发布 Claude 3.5 Sonnet:性能逼近 GPT-4o,价格更低

性能更好,价格低 40%,开发者首选

  • HumanEval 92.0%,超越 GPT-4o 的 90.2%
  • API 价格仅 GPT-4o 的 60%
  • 新增 Artifacts 和 Computer Use 功能
详细解读
### 性能基准 MMLU、GPQA、HumanEval 全面超越 Claude 3 Opus。 ### 开发者体验 Artifacts 可在对话中生成可执行 HTML/SVG 组件。