安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活422

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

南京过年的年夜饭冷盘一般摆哪些菜?

作者: 一叶知秋叶原    时间: 3 天前就是传统的在家大家庭聚餐的那种年夜饭冷盘一般有什么?作者: 动态清您    时间: 3 天前有钱的,天天过年,摆80碗也不爱吃;没钱的,在思考明年的工作保得...

中国退休族,在日本泰国被割千金。退休人员还是富裕

作者: 纪念8080    时间: 3 天前https://www.msn.cn/zh-cn/news/ot ... 76474a303&ei=63其中一段母女二人的自由行,节奏舒缓、心情愉悦...

烟花易碎

作者: npcjy    时间: 前天 19:371000089213.jpg (207.83 KB, 下载次数: 0)下载附件前天 19:37 上传作者: 数码爱好者    时间: 前天 19:55...

南京南站又出事了,真的有点霉

作者: 搞搞    时间: 前天 17:411月17日20时05分左右,上海虹桥至汉口站的D3014次列车运行到紫金山东站至南京南站区间时,因撞鸟临时停车。现场检查发现,该趟列车车体附着鸟类羽毛,不影...

小红书上刷到一个威胁要暴力反抗的

作者: 守法良民    时间: 前天 21:30一个美国男的,说着说着一激动,拉枪栓了,说要反抗美国zhèng fǔ作者: 泡泡虾    时间: 前天 21:32鼓掌喝彩,美帝底层p民血脉觉醒了作者:...