时政
财经
科技
虚拟货币
其他
登录
#长上下文
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2天前
国产之光,跳票曝光?华为昇腾? 说好的长上下文呢?
#华为
#昇腾
#国产
#跳票
#长上下文
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
由LLM演化而来的AGI能力边界,终将不由参数规模决定,而由它在真实世界中“自我演化”的路径决定。 我们的语言根植于生存适应性的需要,所以其语义的丰富性受此约束,最终要回归到语用价值。 LLM用于人类社会活动中也受到类似约束每次激活的人格路径是单一的。语言有超模态的特性,因此LLM的演化多模态可能并不想我先前认为的那么重要,从沉寂半年多的deepseek最近获得关注的在长上下文突破方面的论文Native Sparse Attention: Hardware-Aligned and Natively,也许是下一个突破点。此前Anthorpic的ceo采访中也提到100M上下文窗口不是梦来看,ICL的能力可以做到几乎实时的权重更新影响输出,LLM的agentic行为可以进一步简化现在的各项工程方法。
#LLM
#AGI
#自我演化
#长上下文
#Agentic行为
分享
评论 0
0
orange.ai
1个月前
今天 MiniMax M1 发布并开源 特色是两个: 1M 输入,80k 输出的超长上下文,以及 Agentic Tool Use 能力。 官方正好列出了 M1 和 OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528 的各项对比。 Gemini 和 Claude 可以说是各领风骚。 MiniMax 和 DeepSeek 在开源模型里是头部了,比 Qwen3 要好一档
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 7 条信息
#MiniMax
#开源
#长上下文
#AI工具
#OpenAI
#Gemini
#Claude
#DeepSeek
#M1发布
#技术对比
分享
评论 0
0
宝玉
8个月前
Repo Prompt 这个工具挺实用的,它可以把你整个Repo的代码拼成一个XML文本,方便你发给像Gemini 2、Claude 3.5、o1 pro这样支持长上下文的模型。 当然你也可以只选择部分文件,目前只支持 Mac
#Repo
#工具
#Gemini 2
#Claude 3.5
#o1 Pro
#长上下文
#XML
#Mac
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞