时政
财经
科技
虚拟货币
其他
登录
#长上下文
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
18小时前
之前就判断deepseek下个版本会在长上下文上突破,估计有戏
深度学习模型升级引发AI能力大跃进,行业迎新变革· 95 条信息
#DeepSeek
#长上下文
#突破
#AI
#乐观
分享
评论 0
0
向阳乔木
1天前
Gemini的长上下文实在是牛逼。 丢给一个20万字的文档,上传提示词附件(比较复杂的专用提示词)。 精准重写章节,输入:用附件中的提示词重写1.1章节。 瞬间搞定,真的省心。
Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 519 条信息
#Gemini
#长上下文
#文档重写
#省心
#AI效率
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
国产之光,跳票曝光?华为昇腾? 说好的长上下文呢?
#华为
#昇腾
#国产
#跳票
#长上下文
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
由LLM演化而来的AGI能力边界,终将不由参数规模决定,而由它在真实世界中“自我演化”的路径决定。 我们的语言根植于生存适应性的需要,所以其语义的丰富性受此约束,最终要回归到语用价值。 LLM用于人类社会活动中也受到类似约束每次激活的人格路径是单一的。语言有超模态的特性,因此LLM的演化多模态可能并不想我先前认为的那么重要,从沉寂半年多的deepseek最近获得关注的在长上下文突破方面的论文Native Sparse Attention: Hardware-Aligned and Natively,也许是下一个突破点。此前Anthorpic的ceo采访中也提到100M上下文窗口不是梦来看,ICL的能力可以做到几乎实时的权重更新影响输出,LLM的agentic行为可以进一步简化现在的各项工程方法。
#LLM
#AGI
#自我演化
#长上下文
#Agentic行为
分享
评论 0
0
orange.ai
3个月前
今天 MiniMax M1 发布并开源 特色是两个: 1M 输入,80k 输出的超长上下文,以及 Agentic Tool Use 能力。 官方正好列出了 M1 和 OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528 的各项对比。 Gemini 和 Claude 可以说是各领风骚。 MiniMax 和 DeepSeek 在开源模型里是头部了,比 Qwen3 要好一档
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 10 条信息
#MiniMax
#开源
#长上下文
#AI工具
#OpenAI
#Gemini
#Claude
#DeepSeek
#M1发布
#技术对比
分享
评论 0
0
宝玉
9个月前
Repo Prompt 这个工具挺实用的,它可以把你整个Repo的代码拼成一个XML文本,方便你发给像Gemini 2、Claude 3.5、o1 pro这样支持长上下文的模型。 当然你也可以只选择部分文件,目前只支持 Mac
#Repo
#工具
#Gemini 2
#Claude 3.5
#o1 Pro
#长上下文
#XML
#Mac
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞