安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活505

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

下下周过年了,我只有忙到飞起的感觉,没有过年的轻松

作者: 纪念8080    时间: 3 天前如题, 感觉各种事情要处理,单位的,家庭的。。。。。真心不想过年,不过年还稳定一点,事情还没那么多。。。其实关键问题是人闲不下来,过年是另一种忙碌。不能彻底...

刘备又出来演刘备了

作者: 千江雪    时间: 2025-1-11 10:51好像是三国志短片 演老年刘备都不用化妆了现实里二弟 三弟也走了 F5E73608-AB74-4CB1-9EDB-1D181EDEE3F9.j...

在湖南汉寿高铁站,可以打飞机回家!

作者: zxzx    时间: 前天 23:21Screenshot_2025-01-20-23-18-54-712_com.tencent.mm.jpg (900.76 KB, 下载次数: 0)下载...

低档鼠标只能用1年左键就不行了?

作者: 委座    时间: 3 天前两个逻辑的,一个小米的,都是这样,1年左右左键就不灵敏了?作者: toptry    时间: 3 天前WD-40喷一下 没有的话机油也行作者: hilllee   ...

推荐两部美剧

作者: 常想一二    时间: 前天 19:02暗夜情报员 比较典型的老套爆米花,节奏挺快待命警察 这个比较新颖,手持写实的拍摄手法刚看有点晕,没有华丽的特效紧张的枪战刺激的追逐,给人的感觉就是真实巡...