Qwen3.6-35B-A3B Uncensored:越狱版开源模型来了
如果你一直关注本地大模型,应该已经发现:现在的开源模型不仅越来越聪明,甚至开始挑战很多闭源商业 AI。Qwen3.6-35B-A3B Uncensored HauhauCS Aggressive 是目前热度极高的越狱版开源模型,不仅无审查无限制,而且非常聪明。

什么是越狱版模型?
官方模型通常会加入大量安全限制:敏感内容拒答、某些问题无法回答、输出被过滤。而 Uncensored 版本则会尽可能移除这些限制。这个 Aggressive 版本是目前最激进的版本之一。

MoE 架构:35B 总参数,仅激活 3B
很多人看到 35B 第一反应是需要服务器才能跑。但实际上 Qwen3.6-35B-A3B 采用 MoE(专家混合架构),每次实际运行时只激活约 3B 参数,既拥有大模型的能力,又拥有小模型的速度。

本地部署教程
1. 模型下载
从 HuggingFace 下载,内含多种量化版本。

2. 安装 llama.cpp
从 GitHub 下载最新版,支持 N 卡、A 卡、I 卡及纯 CPU 运行。

3. 启动脚本
@echo off
chcp 65001 >nul
title Qwen3.6-35B-A3B Uncensored
echo 1. Q4_K_P (4090)
echo 2. Q4_K_M (稳定版)
echo 3. IQ4_NL (高压缩)
echo 4. IQ2_M (6G/8G 显卡)
set /p ch=选择:
if "%ch%"=="4" llama-server -m models\IQ2_M.gguf --mmproj models\mmproj-f16.gguf -ngl 999 -c 8192 --host 127.0.0.1 --port 8080


4. 对接 AI Agent
将模型对接 Hermes Agent 或 OpenClaw:API Base 填写 http://127.0.0.1:8080/v1


性能表现
在 Artificial Analysis 排行榜中 40B 以内开源模型属于第一梯队,尤其中文理解、代码能力、多模态视觉和长上下文能力表现突出。

多模态支持
支持多模态视觉识图:看图片、分析截图、OCR 识别、理解画面内容。配合 llama.cpp 可当作本地版 ChatGPT Vision 使用。

推荐量化版本
| 显卡 | 推荐量化 |
|---|---|
| RTX 4090 24G | Q4_K_P / Q4_K_M |
| 8G 显存 | IQ2_M / IQ3_M |
总结
Qwen3.6-35B-A3B 越狱版是目前最强的无审查开源模型之一,6G 显存即可运行,支持多模态、超长上下文、Agent 对接,真正实现本地 AI 自由。