还是多模态的模型好，GPT-4o可以同时- news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

Crypto_Painter

2周前

基本上跑通了！现在我的 Agent 会每小时自动记录当前的K线形态，然后交给 Embedding 进行向量索引，由于这个多模态模型的图像识别真的很强… 所以目前后台反馈的样本案例与实际行情走的都有一种神似的感觉… 图中K线是2024年11月的某段行情… 最后尤其是在把交易量也纳入进去后，整体吻合度变得更好了。目前市价开了多单，2.6%止盈， 1.2%止损… 当然，如果他发现当前形态

Crypto_Painter

2周前

已经让小画师去尝试调用了，大致逻辑是将过去6年的历史K线进行分类，将一些明显的K线形态进行特征分类，并筛选对应K线形态后的价格波动。将这些样本转换为图片、并将同时间发生的新闻事件文本内容一同Embedding，未来应该还可以加入更多维度数据… 因为Embedding是多模态模型，所以过往那种将K线的高开低收转化为文本序列的模式并不能做到模糊对应，而这个Embedding 2则可以通过图像处理

Gorden Sun

3周前

Yuan3.0-Ultra：开源1TB多模态模型浪潮开源的模型，1010B总参数，68.8B激活参数，支持图片输入。模型：

howie.serious

3个月前

为什么 nano banana pro 的文字渲染和指令跟随，有如此大的进步？以配图为例，分别是大量汉字的 PPT 和知识漫画，这种级别的文字生成，背后的 why，是真正有趣的地方。 === 对于扩散模型（diffusion model），生成图片的本质是去噪（denoising）。模型学习的是图像在潜空间（latent space）里的概率分布，通过预测逐渐减去噪声，逐步让图像“显形”，

Andy Stewart

4个月前

女儿画完画，回家了 😘

还是多模态的模型好，GPT-4o可以同时兼顾绘画和语义。

相关新闻