#AIGC

深夜说一个最近的感想 其实也不算新,还是老生常谈的一个话题“做 infra 的人必须要去贴近业务,否则一切都是空中楼阁” 我介绍过很多次鄙司是 AIGC 头部玩家,主攻二次元赛道。 我们最近面临的一个问题是 Elasticsearch 带来的。 我们用户公开发布的 Artwork 和生成任务都是可以搜索的。 最近 Elasticsearch 频繁会出现部分 Data Node 被打满然后连锁搜索出现问题的情况。 那么我们需要去怎么样快速的解这个问题? 在进一步讨论之前我们需要思考在这个场景下,搜索这个操作的本质是什么? 我的看法是资产管理。在 AIGC 场景下,Prompt 毫无疑问是用户的核心资产,而对应的 Task 以及 Artwork 某种意义上算是资产的预览(or 属性) 那么有了这样一个推论后,我们便能清晰的知道,至少在目前的形态下,业务核心属性必然不能为了技术结果让步。 同时我们又有一个观察,我们用户公开发布的 Artwork 其的可见性和 Task 是不太一样的,Artwork 可公开检索,也会承担 SEO 的责任,而 Task 实际上仅用户可见。那么换句话讲,两者的数据的访问频率,资源需求都是不太一样的。 换句话说,我们对 ES 的 Index 存在了多租的需求。但是很遗憾,按照目前的 ES 的设计,是不具备多租的能力的。 虽然长远来说,优化查询会是一个必然的选项,但是在当下面对超高速发展的业务,拆分 Index 为不同的集群,按照 Index 不同的属性给不同的算力/磁盘,快速试错会成为我们的首选。 目前这项工作正在进行中,效果未知,但是整个思考博弈的过程其实是我前几年会很少考虑的。很多时候技术的最优解未必是业务的最优解。 最后的最后,再打一个广告。鄙司招人,ML Engineer,ML Data/Full Stack/Backend/Marketing 等职位虚位以待。如果你想一起做一些有趣的事情,欢迎 DM,帮你老板直达
这两天发了点AI小说的推,大家挺感兴趣,有些推油问在哪里看 因为AIGC在小说界的敏感度,我不会在网上公开,请大家不要问了 测试amazon kdp也有1个多月了,我就写点经验: 1. 目前还没收回成本(营销+publisher rocket软件),成本没算AI工具的订阅,因为写小说只是附带,本身就要订阅AI工具 2. 想赚快钱的不要玩AI小说。英文小说跟中文爽文完全不一样,要有长期运行的准备,因为amazon的销售极度依赖用户评论,需要时间,且小说反馈时间往往几周以上。amazon top榜上很多都是好多年前的作品 3. 同理,简单的AI生成绝对没用,必须加人工或流程化处理,因为用户评论很快打下去,谁也不会买 4. 最好别用API生成,成本巨大,一轮流程下来,一本小说API tokens需要几百刀。尽量用顶级LLM包月,便宜的LLM API质量差得远 5. 封面很重要,现在图片工具很多很好用,节省大量成本,reddit kdp用户有时请专业封面设计师弄一个封面就要几百刀,善用AI完全可省下巨额成本 6. 最重要还是故事,些许的一些AI小说前后不对应问题,读者倒还挺宽容,尽量按系列小说琢磨大纲,因为后期系列小说比单本更容易销售,有一些销售手段可以用上 7. 但是系列要控制好节奏,不可能一个笔名下一个月出十本,那是写在脸上纯AI生成了。 8. 所以还是长期思维,这是以季度+年为周期的business 9. 对小说没兴趣的别玩。不然自己都搞不清故事好不好看。我本身就喜欢看小说,小学毕业前就看过几百本古代章回体、评书、武侠,六年级的时候还写过上万字的武侠小说。