Gorden Sun

Gorden Sun

0 关注者

2个月前

Thyme:像o3一样分析图片 视觉多模态模型,会分析用户需求,针对复杂问题写代码来辅助解决。例如识别非常小的区域内的文字,会写代码执行放大+裁剪的操作,然后再识别图像解决问题。跟OpenAI o3的操作类似。 项目地址: Github:

#Thyme #o3 #视觉多模态模型 #代码辅助 #图像识别

相关新闻

placeholder

Andy Stewart

4小时前

懒猫相册基于AI大模型找相似重复照片太方便了

placeholder

XiaoPeng

4周前

类似这种图,识别图上的标签,速度最快的模型是哪个?当然也要比较准确。

placeholder

Michael Anti

2个月前

我是多LLM一起用的,这几个月自己测试和排序的结果是,从聪明程度和质量上:o3 > kimi k2> Claude opus 4.1> doubao seed 1.6 > Gemini 2.5 pro = Grok 4。我的用途主要是思考、编程、知识等三个方面。资料查询方面 Gemini Deep Research 最好,各类 cc也能用。

placeholder

阿橡

2个月前

这个有点厉害的,只要点击照片,然后跟手机说“删掉塑料袋”。它就真的只把塑料袋删掉了……塑料袋里面装的东西还飘在空中…… 识别的过于精准了。 Google Pixel 10/Pro/Fold Impressions: Magnets!

placeholder

meng shao

2个月前

[开源项目推荐] awesome-claude-code (10.8K ⭐️) : Github 著名 Awesome 系列之 cc,这个资源库专注于收集与 cc 相关的斜杠命令 (/)、CLAUDE. md 文件、命令行工具、其他工作流和指南等,提升用户在使用 cc 时的生产力、开发体验和社区协作效率。 核心内容 项目内容按照功能和用途进行了清晰的分类,涵盖了以下几个主要部分: 1. 工作流

© 2025 news.news. All rights reserved. 0.04927 秒. v1.0.46
我的评论