Gorden Sun

Gorden Sun

0 关注者

4个月前

Thyme:像o3一样分析图片 视觉多模态模型,会分析用户需求,针对复杂问题写代码来辅助解决。例如识别非常小的区域内的文字,会写代码执行放大+裁剪的操作,然后再识别图像解决问题。跟OpenAI o3的操作类似。 项目地址: Github:

#Thyme #o3 #视觉多模态模型 #代码辅助 #图像识别

相关新闻

placeholder

我真的没有拼多多

1个月前

下班后,用v0两小时不到快速糊了一款表情识别器demo 百度最近新开源了一个多模态的模型,我测试了一下它的图像识别能力,非常强大,甚至对于面部表情都能很好的识别。 基于此模型,开发了一个表情识别特效网站,看看你能做出多少种表情来吧,欢迎大家试玩! 网址在评论区第一条 (使用的具体模型:ERNIE 4.5-VL-28B-A3B-Thinking)

placeholder

Andy Stewart

1个月前

懒猫相册基于AI大模型找相似重复照片太方便了

placeholder

XiaoPeng

2个月前

类似这种图,识别图上的标签,速度最快的模型是哪个?当然也要比较准确。

placeholder

Michael Anti

3个月前

我是多LLM一起用的,这几个月自己测试和排序的结果是,从聪明程度和质量上:o3 > kimi k2> Claude opus 4.1> doubao seed 1.6 > Gemini 2.5 pro = Grok 4。我的用途主要是思考、编程、知识等三个方面。资料查询方面 Gemini Deep Research 最好,各类 cc也能用。

placeholder

阿橡

4个月前

这个有点厉害的,只要点击照片,然后跟手机说“删掉塑料袋”。它就真的只把塑料袋删掉了……塑料袋里面装的东西还飘在空中…… 识别的过于精准了。 Google Pixel 10/Pro/Fold Impressions: Magnets!

© 2025 news.news. All rights reserved. 0.03102 秒. v1.0.46
我的评论