Qwen3.6-35B-A3B 越狱版：目前最强无审查开源模型，6G 显存可跑

Qwen3.6-35B-A3B Uncensored：越狱版开源模型来了

如果你一直关注本地大模型，应该已经发现：现在的开源模型不仅越来越聪明，甚至开始挑战很多闭源商业 AI。Qwen3.6-35B-A3B Uncensored HauhauCS Aggressive 是目前热度极高的越狱版开源模型，不仅无审查无限制，而且非常聪明。

Qwen 越狱版

什么是越狱版模型？

官方模型通常会加入大量安全限制：敏感内容拒答、某些问题无法回答、输出被过滤。而 Uncensored 版本则会尽可能移除这些限制。这个 Aggressive 版本是目前最激进的版本之一。

越狱 vs 官方对比

MoE 架构：35B 总参数，仅激活 3B

很多人看到 35B 第一反应是需要服务器才能跑。但实际上 Qwen3.6-35B-A3B 采用 MoE（专家混合架构），每次实际运行时只激活约 3B 参数，既拥有大模型的能力，又拥有小模型的速度。

MoE 架构

本地部署教程

1. 模型下载

从 HuggingFace 下载，内含多种量化版本。

模型选择

2. 安装 llama.cpp

从 GitHub 下载最新版，支持 N 卡、A 卡、I 卡及纯 CPU 运行。

llama.cpp

3. 启动脚本

@echo off
chcp 65001 >nul
title Qwen3.6-35B-A3B Uncensored
echo 1. Q4_K_P (4090)
echo 2. Q4_K_M (稳定版)
echo 3. IQ4_NL (高压缩)
echo 4. IQ2_M (6G/8G 显卡)
set /p ch=选择:
if "%ch%"=="4" llama-server -m models\IQ2_M.gguf --mmproj models\mmproj-f16.gguf -ngl 999 -c 8192 --host 127.0.0.1 --port 8080

启动菜单

乱码解决

4. 对接 AI Agent

将模型对接 Hermes Agent 或 OpenClaw：API Base 填写 http://127.0.0.1:8080/v1

Agent 对接

配置界面

性能表现

在 Artificial Analysis 排行榜中 40B 以内开源模型属于第一梯队，尤其中文理解、代码能力、多模态视觉和长上下文能力表现突出。

排行榜

多模态支持

支持多模态视觉识图：看图片、分析截图、OCR 识别、理解画面内容。配合 llama.cpp 可当作本地版 ChatGPT Vision 使用。

多模态

显卡	推荐量化
RTX 4090 24G	Q4_K_P / Q4_K_M
8G 显存	IQ2_M / IQ3_M

总结

Qwen3.6-35B-A3B 越狱版是目前最强的无审查开源模型之一，6G 显存即可运行，支持多模态、超长上下文、Agent 对接，真正实现本地 AI 自由。

AI科技博客