← 返回首页

Qwen3.6-35B-A3B 越狱版来了!目前最强"无审查"开源模型?6G 显存都能跑,本地 AI 彻底自由了

发表日期:2026年5月25日分类:AI / 本地部署作者:零度解说

开源社区又迎来重磅更新!Qwen3.6-35B-A3B 越狱版正式发布,这个基于 Qwen3.6 架构的魔改版本移除了大部分内容限制,同时在性能上保持了极高的水准。

什么是 Qwen3.6-35B-A3B?

这是通义千问 Qwen3.6 系列的改进版本,采用 35B 参数规模搭配 A3B(Active 3 Billion)的混合专家架构(MoE)。它的一大特点是推理时只激活约 3B 参数,因此对显存的需求大大降低。

越狱版有什么不同?

  • 无审查内容生成:移除了大部分敏感词过滤和安全限制
  • 百万 Token 上下文:支持超长文本处理
  • 6GB 显存可运行:通过 4-bit 量化,普通消费级显卡都能跑
  • 性能不减:越狱版在标准测试中保持了原版 95% 以上的性能

本地部署教程

环境要求

  • 显卡:NVIDIA RTX 3060 12GB 或更高(6GB 显存可用 4-bit 量化版)
  • 内存:16GB+
  • 系统:Windows 10/11 或 Linux
  • 软件:Python 3.10+, CUDA 12.1+

步骤一:安装 Ollama

Ollama 是目前最方便的本地模型运行工具,到官网下载安装即可。

步骤二:下载模型

ollama pull qwen3.6-35b-a3b-jailbreak:latest

步骤三:运行模型

ollama run qwen3.6-35b-a3b-jailbreak

步骤四:使用 API 调用

curl http://localhost:11434/api/generate -d "{
  \"model\": \"qwen3.6-35b-a3b-jailbreak\",
  \"prompt\": \"你好,请介绍一下你自己\"
}"

实测效果

在实际测试中,Qwen3.6-35B-A3B 越狱版在代码生成、创意写作、复杂推理等方面表现出色。虽在某些任务上略逊于 GPT-4o,但作为一款可在本地运行的免费模型,其性价比极高。

注意事项

越狱版模型移除了安全限制,请合理使用,不要用于违法违规目的。建议在隔离环境中运行。

总结

Qwen3.6-35B-A3B 越狱版是目前最值得尝试的本地大模型之一。6GB 显存门槛让大多数玩家都能体验,无审查特性也为开发者和研究者提供了更多可能性。