时政
财经
科技
虚拟货币
其他
登录
#Personalization
关注
马东锡 NLP
2个月前
「 Black-box LLM Steering, Personalization 」 “我不要你觉得,我要我觉得。” 什么是真正的Personalization,我认为,不是 AI 通过我的数据,训练出 “它觉得” 的 “我”。而应该是我自己要主导决定的 “我觉得” 的 “我”。 如果说 persona vectors 和 AxBench 教会我直接修改开源模型的激活层做model steering,那么 ADVISOR MODELS 的出现,可以让我可以对所有模型下手,因为它直接面对闭源模型。 ADVISOR MODELS 通过RL只训练一个小模型,学习为每个输入撰写简短的建议以影响闭源模型, 可以实现用户端自己决定的personalizaiton和特定环境规则。 AxBench,persona vectors,ADVISOR MODELS 几乎提供了一整套实用的 LLM steering 工具包, 在封闭与开放两种场景中都能实现用户端自主的Personalization。 极具价值。 最后,与各位共勉。 我不要你觉得,我不要 openAI 觉得,我不要 Anthropic 觉得,我要 “我” 觉得。 因为只有我是我。
#LLM Steering
#Personalization
#ADVISOR MODELS
#用户自主
#模型干预
分享
评论 0
0
马东锡 NLP
2个月前
「 LLM, Personalization 」 记得 GPT-5 推出的时候,就已经感觉到,LLM 发展到今天,单纯的比拼 benchmark,已不再是所有的意义。而 模型如何理解用户,personalization 的能力越来越重要。 这周看到两篇很好的工作 PREFDISCO 和 PDR Bench,都是跟 personalization相关。 两篇论文中,Personalization 的定义已经远超风格微调。Personalization 不是换语气,而是让模型围绕用户的目标、偏好和约束来思考和行动。 良好的 personalization AI 需要做到: - 建立真实的用户模型 - 调整推理和研究过程 - 同时确保输出既对齐用户又事实正确 PREFDISCO 聚焦即时个性化 reasoning ;PDR Bench 研究长周期、多来源的 deep research。前者通过互动发现偏好,后者依靠档案和语境长期规划。 学到了! 期待更多围绕 personalization benchmark提出的新的方法。
#LLM
#Personalization
#用户模型
#偏好
#Benchmark
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞