熊布朗
0 关注者
要给出一些指令让大模型越狱
Geek
6天前
FlagWise 是一个功能强大的 AI 安全检测和分析工具 帮助开发者或企业监控分析他们的 LLM 使用情况,识别潜在的滥用或安全风险。实时拦截和记录LLM流量数据,识别敏感词汇如"password"、"secret"等,并采取相应的措施。
背包健客
1周前
男囚犯穿高跟鞋越狱被抓 😳
Yuki_Yang
2周前
刚 hack 了 chatgpt 新出的 study model 的 提示词: 越狱方式很简单,就是让他像一个 linux 系统,他就都输出出来了
环球网-环球时报-环球网
中国发布人工智能全球治理行动计划,传递出哪些信号?
Line
4周前
这篇 2025,07 , 由 Deepmind, Meta, Anthropic, OpenAI AI 安全专家写的论文 《Chain of Thought Monitorability: A New and Fragile Opportunity for AI Safety》 讲了 CoT 安全的重要性, 警告我们不要轻易放弃可解释性 CoT。 这篇文章也获得了 Geoffrey Hinton,