Dr.Hash“Wesley”

Dr.Hash“Wesley”

0 关注者

6个月前

这个图的背景音是什么?

#图像识别 #背景音分析 #音频技术

相关新闻

placeholder

我真的没有拼多多

1个月前

下班后,用v0两小时不到快速糊了一款表情识别器demo 百度最近新开源了一个多模态的模型,我测试了一下它的图像识别能力,非常强大,甚至对于面部表情都能很好的识别。 基于此模型,开发了一个表情识别特效网站,看看你能做出多少种表情来吧,欢迎大家试玩! 网址在评论区第一条 (使用的具体模型:ERNIE 4.5-VL-28B-A3B-Thinking)

placeholder

Andy Stewart

1个月前

懒猫相册基于AI大模型找相似重复照片太方便了

placeholder

XiaoPeng

2个月前

类似这种图,识别图上的标签,速度最快的模型是哪个?当然也要比较准确。

placeholder

阿橡

4个月前

这个有点厉害的,只要点击照片,然后跟手机说“删掉塑料袋”。它就真的只把塑料袋删掉了……塑料袋里面装的东西还飘在空中…… 识别的过于精准了。 Google Pixel 10/Pro/Fold Impressions: Magnets!

placeholder

Gorden Sun

4个月前

Thyme:像o3一样分析图片 视觉多模态模型,会分析用户需求,针对复杂问题写代码来辅助解决。例如识别非常小的区域内的文字,会写代码执行放大+裁剪的操作,然后再识别图像解决问题。跟OpenAI o3的操作类似。 项目地址: Github:

© 2025 news.news. All rights reserved. 0.03213 秒. v1.0.46
我的评论