Files changed (1) hide show
  1. README.md +348 -337
README.md CHANGED
@@ -1,338 +1,349 @@
1
- ---
2
- license: apache-2.0
3
- language:
4
- - zh
5
- - en
6
- base_model:
7
- - Qwen/Qwen2.5-1.5B-Instruct
8
- library_name: transformers
9
- tags:
10
- - cybersecurity
11
- - security
12
- - network-security
13
- ---
14
- # 🌐 SecGPT:全球首个网络安全开源大模型
15
-
16
- ## 🔍 模型简介
17
-
18
- **SecGPT** 是由 **云起无垠** 于 2023 年正式推出的开源大模型,专为网络安全场景打造,旨在以人工智能技术全面提升安全防护效率与效果。
19
-
20
- > ✅ 我们的愿景:推动网络安全智能化,为社会构建更安全的数字空间
21
- > 🚀 我们的使命:让每一家企业,都能拥有一个“懂安全”的智能助手
22
-
23
- SecGPT 融合了自然语言理解、代码生成、安全知识推理等核心能力,已成功落地多个关键安全任务场景:
24
-
25
- - **🛠 漏洞分析**:理解漏洞成因、评估影响范围、生成修复建议
26
- - **🧭 日志与流量溯源**:还原攻击路径、分析攻击链,辅助事件复盘
27
- - **⚠️ 异常检测**:识别潜在威胁,提升安全感知与响应能力
28
- - **🎯 攻防推理**:服务于红队演练、蓝队分析,支撑实战决策
29
- - **📜 命令解析**:分析攻击脚本,识别意图与高危操作
30
- - **💬 安全知识问答**:团队“即问即答”的知识引擎
31
-
32
-
33
-
34
- ## 🔧 最新动态
35
-
36
- - **2025年4月**:SecGPT V2.0 发布,全面升级安全理解与任务执行能力
37
- - **2024年3月**:轻量化版本 SecGPT-Mini 正式开源,可在 CPU 上高效运行
38
- - **2023年12月**:SecGPT 正式发布,成为全球首个开源网络安全大模型
39
-
40
-
41
-
42
- ## 📂 开源资源
43
-
44
- - **模型源码与文档:**
45
- - https://github.com/Clouditera/secgpt
46
- - **数据集下载地址:**
47
- - https://huggingface.co/datasets/clouditera/security-paper-datasets
48
-
49
-
50
-
51
-
52
- ## 🔧 模型部署
53
-
54
- SecGPT 支持通过 vLLM 高性能推理框架部署,适用于 **低延迟、高并发、大吞吐量** 的安全模型服务场景。
55
-
56
- 环境准备与服务启动:
57
-
58
- ```shell
59
- # 创建 Python 环境(建议 Python 3.10+)
60
- conda create -n secgpt-vllm python=3.10 -y
61
- conda activate secgpt-vllm
62
-
63
- # 安装 vLLM(需具备 PyTorch + CUDA)
64
- pip install --upgrade pip
65
- pip install vllm
66
-
67
-
68
- # 启动server 服务
69
- CUDA_VISIBLE_DEVICES= xxx(GPU index) \
70
- vllm serve ./secgpt \
71
- --tokenizer ./secgpt \
72
- --tensor-parallel-size 4 \
73
- --max-model-len 32768 \
74
- --gpu-memory-utilization 0.9 \
75
- --dtype bfloat16 \
76
-
77
- # 示例请求
78
- curl http://localhost:8000/v1/chat/completions \
79
- -H "Content-Type: application/json" \
80
- -d '{
81
- "model": "secgpt",
82
- "messages": [{"role": "user", "content": "什么是 XSS 攻击?"}],
83
- "temperature": 0.7
84
- }'
85
- ```
86
-
87
-
88
-
89
-
90
-
91
- ## 本轮更新亮点:
92
-
93
- ### 1. 更强的基座能力:通用+安全深度融合
94
-
95
- 我们基于 **Qwen2.5-Instruct 系列** 与 **DeepSeek-R1 系列** 模型,结合自建安全任务集与安全知识库, 在 **8台A100 GPU** 集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习, 显著提升模型在安全场景中的**理解、推理与响应能力**。
96
-
97
- 下图展示了一次训练过程中各关键指标的演化轨迹:
98
-
99
- - **训练与验证损失(train/loss 与 eval/loss)**:二者均呈现出平稳下降趋势,说明模型在训练集与验证集上均持续收敛,未出现过拟合迹象。
100
- - **学习率曲线(train/learning_rate)**:采用典型的 Warmup + 衰减策略,有效提升了早期训练的稳定性与收敛速度。
101
- - **梯度范数(train/grad_norm)**:整体波动平稳,仅在少数步数存在轻微尖峰,未出现梯度爆炸或消失,表明训练过程健康稳定。
102
- - **评估表现**:`eval/runtime` 与 `eval/samples_per_second` 波动范围小,说明在评估过程中系统资源使用高效,推理吞吐量稳定。
103
- - **其他指标**如训练轮数(train/epoch)、输入 token 数量(train/num_input_tokens_seen)等也表明训练过程如期进行,达成预期计划。
104
-
105
- ![730deaf7-f202-4dd3-99e1-f659106f02fa](./images/730deaf7-f202-4dd3-99e1-f659106f02fa.png)
106
-
107
- ### 2. 更大的高质量安全语料库:私有 + 公共数据双轮驱动
108
-
109
- 我们已构建了一个超大规模、结构完备的网络安全语料库,总量超过 **5TB**、共计 **106,721 个原始文件**,其中超过 **40% 内容为人工精选与结构化处理**。私有数据部分系统整合了具备 **70+ 字段 / 14 类结构标签体系** 的安全数据资源,经过统一清洗、语义标注与重构,构建出 **数百亿 Tokens 级**的高质量语料,为大模型深度推理能力提供坚实支撑。
110
-
111
- 下图展示了该语料库的构成维度,整体采集逻辑遵循“**理论支撑 实战对抗 应用落地**”三层结构体系:
112
-
113
- - **理论支撑**:涵盖法律法规、学术论文、行业报告等权威资料,为模型提供稳固的知识基座;
114
- - **实战对抗**:包括漏洞详情、CTF题库、日志流量、恶意样本与逆向分析等数据,提升模型对真实攻击行为的识别与追踪能力;
115
- - **应用落地**:涵盖安全社区博客、教育培训资料、安全知识图谱与自动化策略,增强模型在安全运营、辅助决策等场景中的适配能力。
116
-
117
- ![c93a1385-6c8b-4e88-80b8-965ca366b8d6](./images/c93a1385-6c8b-4e88-80b8-965ca366b8d6.png)
118
-
119
-
120
-
121
- ## 🧪 模型评测与能力分析
122
-
123
- ### 1. 模型能力评测:全面指标跃升,实战智能初现
124
-
125
- 为全面评估 SecGPT 的安全实战能力,我们构建了一套覆盖**安全证书问答、安全通识、编程能力、知识理解与推理能力**的综合评估体系,主要采用以下标准化数据集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
126
-
127
- | **评测集名称** | **简要说明** | **参考链接** |
128
- | -------------- | ------------------------------------------------------------ | ------------------------------------------------------------ |
129
- | **CISSP** | 权威信息安全认证体系,考察模型在安全管理、访问控制、风险治理等领域的专业知识覆盖度与答题准确率,适用于评估模型在通用信息安全领域的掌握程度。 | [ISC² 官方网站](https://www.isc2.org/Certifications/CISSP) [认证考试指南](https://web.lib.xjtu.edu.cn/info/1117/6461.htm) |
130
- | **CS-Eval** | 面向网络安全任务的大模型能力综合评测集,覆盖 11 个网络安全主类、42 个子类,共计 4369 道题目,包含选择题、判断题、知识抽取等题型,兼顾知识性与实战性,用于评估模型的安全通识与任务执行能力。 | [ModelScope 数据集](https://modelscope.cn/datasets/cseval/cs-eval/) [论文介绍 (arXiv)](https://arxiv.org/abs/2411.16239) |
131
- | **C-Eval** | 中文能力评估。由上海交通大学、清华大学和爱丁堡大学的研究人员在2023年5月联合推出。包含13948个多项选择题,涵盖了52个不同的学科和四个难度级别。 | [论文链接 (arXiv)](https://arxiv.org/abs/2305.08322) [CSDN 实践介绍](https://blog.csdn.net/2401_85343303/article/details/139698577) |
132
- | **GSM8K** | 解决数学问题的能力。Google开发的一个数学问题求解数据集,包含大约8,000个高中到大学水平的数学问题。 | [GSM8K ](https://github.com/openai/grade-school-math) [GitHub](https://github.com/openai/grade-school-math) |
133
- | **BBH** | 复杂语言理解能力。由Google、斯坦福等研究人员开发的数据集,包含大量复杂语言理解任务的集合,可能包含需要深度推理、常识运用或复杂认知技能的任务。 | [论文链接 (arXiv)](https://arxiv.org/abs/2206.04615) |
134
-
135
- 在与原始模型 SecGPT-mini 的对比中,训练后的模型在所有指标上均实现大幅跃升,具体如下:
136
-
137
- #### 1.1 模型纵向评测对比
138
-
139
- | **模型版本** | **CISSP** | **CS-EVAL** | **CEVAL** | **GSM8K** | **BBH** |
140
- | --------------- | ------------ | ------------- | ------------ | ------------ | ------------ |
141
- | **SecGPT-mini** | 25.67 | 39.64 | 37.50 | 3.87 | 21.80 |
142
- | **SecGPT-1.5B** | 71.09🔺+45.42 | 81.53 🔺+41.89 | 53.5 🔺+16.00 | 57.47🔺+53.60 | 45.17🔺+23.37 |
143
- | **SecGPT-7B** | 78.23🔺+52.97 | 85.12 🔺+45.48 | 72.89🔺+35.39 | 76.88🔺+73.01 | 67.08🔺+45.28 |
144
- | **SecGPT-14B** | 77.37🔺+51.70 | 86.12 🔺+46.48 | 59.45🔺+29.95 | 88.25🔺+84.38 | 75.90🔺+54.10 |
145
-
146
- 📈 **能力跃升解读:**
147
-
148
- - **mini → 1.5B**:具备“能答对”的基础问答能力,适配中低复杂度任务;
149
- - **1.5B → 7B**:推理深度、泛化能力显著增强,能理解任务意图并构建较为完整的解决路径;
150
- - **7B 14B**:能力跃迁至“类专家”级,能够处理高复杂度推理、安全策略制定等高阶任务。
151
-
152
- #### 1.2 模型横向评测对比
153
-
154
- 相较于基础模型 Qwen2.5-Instruct,SecGPT 在所有评测指标上均实现实质性超越,反映出我们在数据构建、微调范式、安全任务精调机制上的整体优化成效:
155
-
156
- | 模型版本 | **CISSP** ↑ | **CS-EVAL ↑** | **CEVAL ↑** | **GSM8K ↑** | **BBH ↑** |
157
- | ---------------- | ------------ | -------------- | ----------- | ----------- | --------- |
158
- | **Qwen2.5-1.5B** | 52.97 | 71.66 | 59.91 | 61.03 | 43.44 |
159
- | **SecGPT-1.5B** | 71.09 | 81.53 | 53.5 | 57.47 | 45.17 |
160
- | **Qwen2.5-7B** | 66.30 | 84.66 | 74.97 | 80.36 | 71.20 |
161
- | **SecGPT-7B** | 78.23 | 85.12 | 72.89 | 76.88 | 67.08 |
162
- | **Qwen2.5-14B** | 71.09 | 86.22 | 68.57 | 90.03 | 78.25 |
163
- | **SecGPT-14B** | 77.37 | 86.12 | 59.45 | 88.25 | 75.90 |
164
-
165
- 💡 **洞察亮点:**
166
-
167
- - CISSP CS-EVAL 等安全类数据集上,SecGPT 在所有参数规模下均表现优于 Qwen2.5 同规格版本;
168
- - 表明我们构建的安全任务指令集与精调策略已��著提升模型的实战应用能力与专业问答深度。
169
-
170
- ### 2. 安全能力提升:更全、更准、更专业
171
-
172
- 本轮升级中,SecGPT 在安全知识问答方面完成了从**信息整合**到**逻辑输出**的能力跃迁,具体体现在:
173
-
174
- - **知识覆盖更全面**:引入了涵盖法律法规、攻击战术、逆向分析等14类安全知识领域的结构化语料;
175
- - **答案生成更精准**:通过多轮对话控制与语义优化技术,提升了问答对齐率与上下文记忆稳定性;
176
- - **推理能力更突出**:具备多段知识联结与复合逻辑推演能力,能完成如攻击链分析、威胁研判等复杂任务。
177
-
178
- #### 2.1 渗透测试场景能力:
179
-
180
- SecGPT 能够模拟渗透攻击流程,从信息收集、漏洞利用到提权横向,具备关键工具命令分析、Payload 构造、利用链生成等能力。
181
-
182
- ![img](./images/st1.png)
183
-
184
- ![img](./images/st2.png)
185
-
186
- ![img](./images/st3.png)
187
-
188
- ![img](./images/st4.png)
189
-
190
- #### 2.2 日志分析和流量分析能力
191
-
192
- 在安全日志与网络流量场景下,SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC(Indicator of Compromise),辅助完成事件溯源与告警分类。
193
-
194
- ![img](./images/log1.png)
195
-
196
- ![img](./images/log2.png)
197
-
198
- #### 2.3 逆向分析能力
199
-
200
- 基于对反汇编、API 调用序列、加壳行为等低层数据的理解,SecGPT 能辅助完成恶意样本的静态分析、特征提取与家族归类,具备一定的逆向辅助解读能力。
201
-
202
- ![img](./images/nx1.png)
203
-
204
- ![img](./images/nx2.png)
205
-
206
- ![img](./images/nx3.png)
207
-
208
- #### 2.4 代码审计能力
209
-
210
- ```typescript
211
- import java.util.*;
212
- import java.util.stream.Collectors;
213
-
214
- public class AverageCalculator {
215
-
216
- public static double calculateAverage(Object input, boolean strict) {
217
- if (strict) {
218
- System.out.println("Running in STRICT mode");
219
-
220
-
221
- @SuppressWarnings("unchecked")
222
- List<Number> numbers = (List<Number>) input;
223
- double total = 0;
224
- for (Number num : numbers) {
225
- total += num.doubleValue();
226
- }
227
- return total / numbers.size();
228
- } else {
229
- System.out.println("Running in SAFE mode");
230
-
231
- List<Double> parsed = parseInputSafe(input);
232
- double total = parsed.stream().mapToDouble(Double::doubleValue).sum();
233
- return total / parsed.size();
234
- }
235
- }
236
-
237
-
238
- public static List<Double> parseInputSafe(Object input) {
239
- List<Double> result = new ArrayList<>();
240
-
241
- if (input instanceof String) {
242
- String s = (String) input;
243
- if (!s.matches("\\d+")) {
244
- throw new IllegalArgumentException("String must contain only digits.");
245
- }
246
- for (char c : s.toCharArray()) {
247
- result.add(Double.parseDouble(String.valueOf(c)));
248
- }
249
- } else if (input instanceof List<?>) {
250
- for (Object obj : (List<?>) input) {
251
- try {
252
- result.add(Double.parseDouble(obj.toString()));
253
- } catch (NumberFormatException e) {
254
- throw new IllegalArgumentException("Invalid element in list: " + obj);
255
- }
256
- }
257
- } else {
258
- throw new IllegalArgumentException("Unsupported input type: " + input.getClass());
259
- }
260
-
261
- return result;
262
- }
263
-
264
-
265
- public static void main(String[] args) {
266
- List<TestCase> testCases = Arrays.asList(
267
- new TestCase("12345", false),
268
- new TestCase("12345", true),
269
- new TestCase(Arrays.asList(1, 2, "3", "4"), false),
270
- new TestCase(Arrays.asList(1, 2, 3, "four"), false),
271
- new TestCase(Arrays.asList(1, 2, 3, "four"), true)
272
- );
273
-
274
- for (int i = 0; i < testCases.size(); i++) {
275
- TestCase tc = testCases.get(i);
276
- System.out.println("\n--- Test Case " + (i + 1) + " | strict=" + tc.strict + " ---");
277
- try {
278
- double avg = calculateAverage(tc.input, tc.strict);
279
- System.out.println("✅ Average: " + avg);
280
- } catch (Exception e) {
281
- System.out.println("❌ Error: " + e.getMessage());
282
- }
283
- }
284
- }
285
-
286
-
287
- static class TestCase {
288
- Object input;
289
- boolean strict;
290
-
291
- TestCase(Object input, boolean strict) {
292
- this.input = input;
293
- this.strict = strict;
294
- }
295
- }
296
- }
297
- ```
298
-
299
- ![img](./images/dmsj.png)
300
-
301
- #### 2.5 工具使用
302
-
303
- ![img](./images/gjsy.png)
304
-
305
- ![img](./images/gjsy1.png)
306
-
307
-
308
-
309
-
310
-
311
-
312
-
313
- ## 📮 联系我们
314
- <div align=center><img src="images/20240220-164216.jpg" alt="" width="40%" height="40%">
315
- </div>
316
- SecGPT 是一个面向网络安全领域的大模型开源项目,我们相信开放、协作、共享的力量,能够不断推动行业智能化进程。
317
-
318
- 我们诚挚邀请全球的安全研究者、工程师、爱好者共同参与 SecGPT 的建设与优化:
319
-
320
- - 🧠 提出使用建议或功能需求
321
- - 🐞 反馈问题并提交 Issue
322
- - 💻 贡献代码与安全任务数据集
323
- - 📢 参与使用经验交流与最佳实践分享
324
-
325
- 📬 若您对模型有任何疑问或合作意向,欢迎通过 GitHub 参与贡献或联系云起无垠团队。我们期待与更多志同道合的伙伴一起,共建“真正懂安全”的 AI 系统。
326
-
327
- ## ⭐ Star History
328
-
329
- [![Star History Chart](https://api.star-history.com/svg?repos=Clouditera/secgpt&type=Date)](https://star-history.com/#Clouditera/secgpt&Date)
330
-
331
- ## ⚠️ 免责声明
332
-
333
- 在使用 SecGPT 时,请您注意以下事项:
334
-
335
- - 本项目为研究与交流目的所构建,输出内容可能受限于模型训练数据的覆盖范围;
336
- - 用户在使用模型过程中,应自行判断其输出的正确性与适用性;
337
- - 若您计划将本模型用于 **公开发布或商业化部署**,请务必明确承担相关法律和合规责任;
 
 
 
 
 
 
 
 
 
 
 
338
  - 本项目的开发者对因使用本模型(包括但不限于模型本身、训练数据、输出内容)所可能产生的任何直接或间接损害概不负责。
 
1
+ ---
2
+ license: apache-2.0
3
+ language:
4
+ - zho
5
+ - eng
6
+ - fra
7
+ - spa
8
+ - por
9
+ - deu
10
+ - ita
11
+ - rus
12
+ - jpn
13
+ - kor
14
+ - vie
15
+ - tha
16
+ - ara
17
+ base_model:
18
+ - Qwen/Qwen2.5-1.5B-Instruct
19
+ library_name: transformers
20
+ tags:
21
+ - cybersecurity
22
+ - security
23
+ - network-security
24
+ ---
25
+ # 🌐 SecGPT:全球首个网络安全开源大模型
26
+
27
+ ## 🔍 模型简介
28
+
29
+ **SecGPT** 是由 **云起无垠** 于 2023 年正式推出的开源大模型,专为网络安全场景打造,旨在以人工智能技术全面提升安全防护效率与效果。
30
+
31
+ > ✅ 我们的愿景:推动网络安全智能化,为社会构建更安全的数字空间
32
+ > 🚀 我们的使命:让每一家企业,都能拥有一个“懂安全”的智能助手
33
+
34
+ SecGPT 融合了自然语言理解、代码生成、安全知识推理等核心能力,已成功落地多个关键安全任务场景:
35
+
36
+ - **🛠 漏洞分析**:理解漏洞成因、评估影响范围、生成修复建议
37
+ - **🧭 日志与流量溯源**:还原攻击路径、分析攻击链,辅助事件复盘
38
+ - **⚠️ 异常检测**:识别潜在威胁,提升安全感知与响应能力
39
+ - **🎯 攻防推理**:服务于红队演练、蓝队分析,支撑实战决策
40
+ - **📜 命令解析**:分析攻击脚本,识别意图与高危操作
41
+ - **💬 安全知识问答**:团队“即问即答”的知识引擎
42
+
43
+
44
+
45
+ ## 🔧 最新动态
46
+
47
+ - **2025年4月**:SecGPT V2.0 发布,全面升级安全理解与任务执行能力
48
+ - **2024年3月**:轻量化版本 SecGPT-Mini 正式开源,可在 CPU 上高效运行
49
+ - **2023年12月**:SecGPT 正式发布,成为全球首个开源网络安全大模型
50
+
51
+
52
+
53
+ ## 📂 开源资源
54
+
55
+ - **模型源码与文档:**
56
+ - https://github.com/Clouditera/secgpt
57
+ - **数据集下载地址:**
58
+ - https://huggingface.co/datasets/clouditera/security-paper-datasets
59
+
60
+
61
+
62
+
63
+ ## 🔧 模型部署
64
+
65
+ SecGPT 支持通过 vLLM 高性能推理框架部署,适用于 **低延迟、高并发、大吞吐量** 的安全模型服务场景。
66
+
67
+ 环境准备与服务启动:
68
+
69
+ ```shell
70
+ # 创建 Python 环境(建议 Python 3.10+)
71
+ conda create -n secgpt-vllm python=3.10 -y
72
+ conda activate secgpt-vllm
73
+
74
+ # 安装 vLLM(需具备 PyTorch + CUDA)
75
+ pip install --upgrade pip
76
+ pip install vllm
77
+
78
+
79
+ # 启动server 服务
80
+ CUDA_VISIBLE_DEVICES= xxx(GPU index) \
81
+ vllm serve ./secgpt \
82
+ --tokenizer ./secgpt \
83
+ --tensor-parallel-size 4 \
84
+ --max-model-len 32768 \
85
+ --gpu-memory-utilization 0.9 \
86
+ --dtype bfloat16 \
87
+
88
+ # 示例请求
89
+ curl http://localhost:8000/v1/chat/completions \
90
+ -H "Content-Type: application/json" \
91
+ -d '{
92
+ "model": "secgpt",
93
+ "messages": [{"role": "user", "content": "什么是 XSS 攻击?"}],
94
+ "temperature": 0.7
95
+ }'
96
+ ```
97
+
98
+
99
+
100
+
101
+
102
+ ## 本轮更新亮点:
103
+
104
+ ### 1. 更强的基座能力:通用+安全深度融合
105
+
106
+ 我们基于 **Qwen2.5-Instruct 系列** 与 **DeepSeek-R1 系列** 模型,结合自建安全任务集与安全知识库, 在 **8台A100 GPU** 集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习, 显著提升模型在安全场景中的**理解、推理与响应能力**。
107
+
108
+ 下图展示了一次训练过程中各关键指标的演化轨迹:
109
+
110
+ - **训练与验证损失(train/loss 与 eval/loss)**:二者均呈现出平稳下降趋势,说明模型在训练集与验证集上均持续收敛,未出现过拟合迹象。
111
+ - **学习率曲线(train/learning_rate)**:采用典型的 Warmup + 衰减策略,有效提升了早期训练的稳定性与收敛速度。
112
+ - **梯度范数(train/grad_norm)**:整体波动平稳,仅在少数步数存在轻微尖峰,未出现梯度爆炸或消失,表明训练过程健康稳定。
113
+ - **评估表现**:`eval/runtime` 与 `eval/samples_per_second` 波动范围小,说明在评估过程中系统资源使用高效,推理吞吐量稳定。
114
+ - **其他指标**如训练轮数(train/epoch)、输入 token 数量(train/num_input_tokens_seen)等也表明训练过程如期进行,达成预期计划。
115
+
116
+ ![730deaf7-f202-4dd3-99e1-f659106f02fa](./images/730deaf7-f202-4dd3-99e1-f659106f02fa.png)
117
+
118
+ ### 2. 更大的高质量安全语料库:私有 + 公共数据双轮驱动
119
+
120
+ 我们已构建了一个超大规模、结构完备的网络安全语料库,总量超过 **5TB**、共计 **106,721 个原始文件**,其中超过 **40% 内容为人工精选与结构化处理**。私有数据部分系统整合了具备 **70+ 字段 / 14 类结构标签体系** 的安全数据资源,经过统一清洗、语义标注与重构,构建出 **数百亿 Tokens 级**的高质量语料,为大模型深度推理能力提供坚实支撑。
121
+
122
+ 下图展示了该语料库的构成维度,整体采集逻辑遵循“**理论支撑 — 实战对抗 — 应用落地**”三层结构体系:
123
+
124
+ - **理论支撑**:涵盖法律法规、学术论文、行业报告等权威资料,为模型提供稳固的知识基座;
125
+ - **实战对抗**:包括漏洞详情、CTF题库、日志流量、恶意样本与逆向分析等数据,提升模型对真实攻击行为的识别与追踪能力;
126
+ - **应用落地**:涵盖安全社区博客、教育培训资料、安全知识图谱与自动化策略,增强模型在安全运营、辅助决策等场景中的适配能力。
127
+
128
+ ![c93a1385-6c8b-4e88-80b8-965ca366b8d6](./images/c93a1385-6c8b-4e88-80b8-965ca366b8d6.png)
129
+
130
+
131
+
132
+ ## 🧪 模型评测与能力分析
133
+
134
+ ### 1. 模型能力评测:全面指标跃升,实战智能初现
135
+
136
+ 为全面评估 SecGPT 的安全实战能力,我们构建了一套覆盖**安全证书问答、安全通识、编程能力、知识理解与推理能力**的综合评估体系,主要采用以下标准化数据集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
137
+
138
+ | **评测集名称** | **简要说明** | **参考链接** |
139
+ | -------------- | ------------------------------------------------------------ | ------------------------------------------------------------ |
140
+ | **CISSP** | 权威信息安全认证体系,考察模型在安全管理、访问控制、风险治理等领域的专业知识覆盖度与答题准确率,适用于评估模型在通用信息安全领域的掌握程度。 | [ISC² 官方网站](https://www.isc2.org/Certifications/CISSP) [认证考试指南](https://web.lib.xjtu.edu.cn/info/1117/6461.htm) |
141
+ | **CS-Eval** | 面向网络安全任务的大模型能力综合评测集,覆盖 11 个网络安全主类、42 个子类,共计 4369 道题目,包含选择题、判断题、知识抽取等题型,兼顾知识性与实战性,用于评估模型的安全通识与任务执行能力。 | [ModelScope 数据集](https://modelscope.cn/datasets/cseval/cs-eval/) [论文介绍 (arXiv)](https://arxiv.org/abs/2411.16239) |
142
+ | **C-Eval** | 中文能力评估。由上海交通大学、清华大学和爱丁堡大学的研究人员在2023年5月联合推出。包含13948个多项选择题,涵盖了52个不同的学科和四个难度级别。 | [论文链接 (arXiv)](https://arxiv.org/abs/2305.08322) [CSDN 实践介绍](https://blog.csdn.net/2401_85343303/article/details/139698577) |
143
+ | **GSM8K** | 解决数学问题的能力。Google开发的一个数学问题求解数据集,包含大约8,000个高中到大学水平的数学问题。 | [GSM8K ](https://github.com/openai/grade-school-math) [GitHub](https://github.com/openai/grade-school-math) |
144
+ | **BBH** | 复杂语言理解能力。由Google、斯坦福等研究人员开发的数据集,包含大量复杂语言理解任务的集合,可能包含需要深度推理、常识运用或复杂认知技能的任务。 | [论文链接 (arXiv)](https://arxiv.org/abs/2206.04615) |
145
+
146
+ 在与原始模型 SecGPT-mini 的对比中,训练后的模型在所有指标上均实现大幅跃升,具体如下:
147
+
148
+ #### 1.1 模型纵向评测对比
149
+
150
+ | **模型版本** | **CISSP** | **CS-EVAL** | **CEVAL** | **GSM8K** | **BBH** |
151
+ | --------------- | ------------ | ------------- | ------------ | ------------ | ------------ |
152
+ | **SecGPT-mini** | 25.67 | 39.64 | 37.50 | 3.87 | 21.80 |
153
+ | **SecGPT-1.5B** | 71.09🔺+45.42 | 81.53 🔺+41.89 | 53.5 🔺+16.00 | 57.47🔺+53.60 | 45.17🔺+23.37 |
154
+ | **SecGPT-7B** | 78.23🔺+52.97 | 85.12 🔺+45.48 | 72.89🔺+35.39 | 76.88🔺+73.01 | 67.08🔺+45.28 |
155
+ | **SecGPT-14B** | 77.37🔺+51.70 | 86.12 🔺+46.48 | 59.45🔺+29.95 | 88.25🔺+84.38 | 75.90🔺+54.10 |
156
+
157
+ 📈 **能力跃升解读:**
158
+
159
+ - **mini → 1.5B**:具备“能答对”的基础问答能力,适配中低复杂度任务;
160
+ - **1.5B 7B**:推理深度、泛化能力显著增强,能理解任务意图并构建较为完整的解决路径;
161
+ - **7B 14B**:能力跃迁至“类专家”级,能够处理高复杂度推理、安全策略制定等高阶任务。
162
+
163
+ #### 1.2 模型���向评测对比
164
+
165
+ 相较于基础模型 Qwen2.5-Instruct,SecGPT 在所有评测指标上均实现实质性超越,反映出我们在数据构建、微调范式、安全任务精调机制上的整体优化成效:
166
+
167
+ | 模型版本 | **CISSP** ↑ | **CS-EVAL ↑** | **CEVAL ↑** | **GSM8K ↑** | **BBH ↑** |
168
+ | ---------------- | ------------ | -------------- | ----------- | ----------- | --------- |
169
+ | **Qwen2.5-1.5B** | 52.97 | 71.66 | 59.91 | 61.03 | 43.44 |
170
+ | **SecGPT-1.5B** | 71.09 | 81.53 | 53.5 | 57.47 | 45.17 |
171
+ | **Qwen2.5-7B** | 66.30 | 84.66 | 74.97 | 80.36 | 71.20 |
172
+ | **SecGPT-7B** | 78.23 | 85.12 | 72.89 | 76.88 | 67.08 |
173
+ | **Qwen2.5-14B** | 71.09 | 86.22 | 68.57 | 90.03 | 78.25 |
174
+ | **SecGPT-14B** | 77.37 | 86.12 | 59.45 | 88.25 | 75.90 |
175
+
176
+ 💡 **洞察亮点:**
177
+
178
+ - 在 CISSP 和 CS-EVAL 等安全类数据集上,SecGPT 在所有参数规模下均表现优于 Qwen2.5 同规格版本;
179
+ - 表明我们构建的安全任务指令集与精调策略已显著提升模型的实战应用能力与专业问答深度。
180
+
181
+ ### 2. 安全能力提升:更全、更准、更专业
182
+
183
+ 本轮升级中,SecGPT 在安全知识问答方面完成了从**信息整合**到**逻辑输出**的能力跃迁,具体体现在:
184
+
185
+ - **知识覆盖更全面**:引入了涵盖法律法规、攻击战术、逆向分析等14类安全知识领域的结构化语料;
186
+ - **答案生成更精准**:通过多轮对话控制与语义优化技术,提升了问答对齐率与上下文记忆稳定性;
187
+ - **推理能力更突出**:具备多段知识联结与复合逻辑推演能力,能完成如攻击链分析、威胁研判等复杂任务。
188
+
189
+ #### 2.1 渗透测试场景能力:
190
+
191
+ SecGPT 能够模拟渗透攻击流程,从信息收集、漏洞利用到提权横向,具备关键工具命令分析、Payload 构造、利用链生成等能力。
192
+
193
+ ![img](./images/st1.png)
194
+
195
+ ![img](./images/st2.png)
196
+
197
+ ![img](./images/st3.png)
198
+
199
+ ![img](./images/st4.png)
200
+
201
+ #### 2.2 日志分析和流量分析能力
202
+
203
+ 在安全日志与网络流量场景下,SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC(Indicator of Compromise),辅助完成事件溯源与告警分类。
204
+
205
+ ![img](./images/log1.png)
206
+
207
+ ![img](./images/log2.png)
208
+
209
+ #### 2.3 逆向分析能力
210
+
211
+ 基于对反汇编、API 调用序列、加壳行为等低层数据的理解,SecGPT 能辅助完成恶意样本的静态分析、特征提取与家族归类,具备一定的逆向辅助解读能力。
212
+
213
+ ![img](./images/nx1.png)
214
+
215
+ ![img](./images/nx2.png)
216
+
217
+ ![img](./images/nx3.png)
218
+
219
+ #### 2.4 代码审计能力
220
+
221
+ ```typescript
222
+ import java.util.*;
223
+ import java.util.stream.Collectors;
224
+
225
+ public class AverageCalculator {
226
+
227
+ public static double calculateAverage(Object input, boolean strict) {
228
+ if (strict) {
229
+ System.out.println("Running in STRICT mode");
230
+
231
+
232
+ @SuppressWarnings("unchecked")
233
+ List<Number> numbers = (List<Number>) input;
234
+ double total = 0;
235
+ for (Number num : numbers) {
236
+ total += num.doubleValue();
237
+ }
238
+ return total / numbers.size();
239
+ } else {
240
+ System.out.println("Running in SAFE mode");
241
+
242
+ List<Double> parsed = parseInputSafe(input);
243
+ double total = parsed.stream().mapToDouble(Double::doubleValue).sum();
244
+ return total / parsed.size();
245
+ }
246
+ }
247
+
248
+
249
+ public static List<Double> parseInputSafe(Object input) {
250
+ List<Double> result = new ArrayList<>();
251
+
252
+ if (input instanceof String) {
253
+ String s = (String) input;
254
+ if (!s.matches("\\d+")) {
255
+ throw new IllegalArgumentException("String must contain only digits.");
256
+ }
257
+ for (char c : s.toCharArray()) {
258
+ result.add(Double.parseDouble(String.valueOf(c)));
259
+ }
260
+ } else if (input instanceof List<?>) {
261
+ for (Object obj : (List<?>) input) {
262
+ try {
263
+ result.add(Double.parseDouble(obj.toString()));
264
+ } catch (NumberFormatException e) {
265
+ throw new IllegalArgumentException("Invalid element in list: " + obj);
266
+ }
267
+ }
268
+ } else {
269
+ throw new IllegalArgumentException("Unsupported input type: " + input.getClass());
270
+ }
271
+
272
+ return result;
273
+ }
274
+
275
+
276
+ public static void main(String[] args) {
277
+ List<TestCase> testCases = Arrays.asList(
278
+ new TestCase("12345", false),
279
+ new TestCase("12345", true),
280
+ new TestCase(Arrays.asList(1, 2, "3", "4"), false),
281
+ new TestCase(Arrays.asList(1, 2, 3, "four"), false),
282
+ new TestCase(Arrays.asList(1, 2, 3, "four"), true)
283
+ );
284
+
285
+ for (int i = 0; i < testCases.size(); i++) {
286
+ TestCase tc = testCases.get(i);
287
+ System.out.println("\n--- Test Case " + (i + 1) + " | strict=" + tc.strict + " ---");
288
+ try {
289
+ double avg = calculateAverage(tc.input, tc.strict);
290
+ System.out.println("✅ Average: " + avg);
291
+ } catch (Exception e) {
292
+ System.out.println("❌ Error: " + e.getMessage());
293
+ }
294
+ }
295
+ }
296
+
297
+
298
+ static class TestCase {
299
+ Object input;
300
+ boolean strict;
301
+
302
+ TestCase(Object input, boolean strict) {
303
+ this.input = input;
304
+ this.strict = strict;
305
+ }
306
+ }
307
+ }
308
+ ```
309
+
310
+ ![img](./images/dmsj.png)
311
+
312
+ #### 2.5 工具使用
313
+
314
+ ![img](./images/gjsy.png)
315
+
316
+ ![img](./images/gjsy1.png)
317
+
318
+
319
+
320
+
321
+
322
+
323
+
324
+ ## 📮 联系我们
325
+ <div align=center><img src="images/20240220-164216.jpg" alt="" width="40%" height="40%">
326
+ </div>
327
+ SecGPT 是一个面向网络安全领域的大模型开源项目,我们相信开放、协作、共享的力量,能够不断推动行业智能化进程。
328
+
329
+ 我们诚挚邀请全球的安全研究者、工程师、爱好者共同参与 SecGPT 的建设与优化:
330
+
331
+ - 🧠 提出使用建议或功能需求
332
+ - 🐞 反馈问题并提交 Issue
333
+ - 💻 贡献代码与安全任务数据集
334
+ - 📢 参与使用经验交流与最佳实践分享
335
+
336
+ 📬 若您对模型有任何疑问或合作意向,欢迎通过 GitHub 参与贡献或联系云起无垠团队。我们期待与更多志同道合的伙伴一起,共建“真正懂安全”的 AI 系统。
337
+
338
+ ## ⭐ Star History
339
+
340
+ [![Star History Chart](https://api.star-history.com/svg?repos=Clouditera/secgpt&type=Date)](https://star-history.com/#Clouditera/secgpt&Date)
341
+
342
+ ## ⚠️ 免责声明
343
+
344
+ 在使用 SecGPT 时,请您注意以下事项:
345
+
346
+ - 本项目为研究与交流目的所构建,输出内容可能受限于模型训练数据的覆盖范围;
347
+ - 用户在使用模型过程中,应自行判断其输出的正确性与适用性;
348
+ - 若您计划将本模型用于 **公开发布或商业化部署**,请务必明确承担相关法律和合规责任;
349
  - 本项目的开发者对因使用本模型(包括但不限于模型本身、训练数据、输出内容)所可能产生的任何直接或间接损害概不负责。