Gorden Sun
2周前
Reka Edge:开源最佳多模态小模型 7B大小,评分超过Qwen 3.5 9B,且更省token、速度更快。Reka的创始成员很多来自谷歌DeepMind,所以继承了很多Gemini的多模态经验。 模型:
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
根据DeepMind的研究(Akyürek et al., 2023),ICL等价于: ΔW = u · vᵀ (秩1矩阵) 其中: • u ∈ ℝᵈ:输⼊模式("问题"的编码) • v ∈ ℝᵈ:输出⽅向("期望答案"的⽅向)
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
6个月前
真相了,DeepMind