#数据分析

宝玉
1个月前
转译:科技就业寒冬来袭:最新数据令人不寒而栗 作者:Alistair Barr - Indeed最新报告显示,科技行业的招聘岗位锐减,其中数据和分析领域尤其惨淡。 - 与疫情前的招聘高峰相比,数据和分析领域的招聘岗位减少了40%。 - 越来越多的求职者以及生成式AI的兴起,让这个领域的竞争异常激烈。 Indeed是全球规模最大的招聘网站,最近发布了一年一度的就业市场报告,报告中的科技岗位数据 () 显得相当惨烈。其中数据和分析相关岗位的前景尤其不容乐观。 让我们先看看整个就业市场的情况。从Indeed的招聘岗位指数(Job Postings Index)图表中可以清晰看到,自2022年疫情后的招聘热潮之后,可招聘岗位数量便持续下滑: 图2: Indeed的整体招聘岗位趋势图(来源:Indeed) 深入分析后可以发现,科技行业的情况比其他行业更糟糕。在2022年,Indeed的科技岗位招聘指数一度突破200,但如今已经暴跌到67: 图3: Indeed的科技岗位招聘指数图(来源:Indeed) 在科技行业内部,数据和分析领域尤为突出。截至今年10月底,这一领域的招聘指数跌至60,是Indeed追踪的所有行业中最低的。这意味着与疫情爆发前相比,数据分析相关岗位减少了整整40%。 更令人担忧的是,求职者申请这类岗位的人数却还在不断增加。 数据分析相关岗位通常包括业务分析师、数据分析师、数据科学家和商业智能开发人员等职位。Indeed的数据表明,这个领域的供需严重失衡。过去几年,大量求职者接受了数据科学相关的培训,使市场上积累了大量技能型人才,但恰逢企业的招聘意愿冷却下来。 Indeed高级经济学家科里·斯塔勒(Cory Stahle)表示: > 「那些接受了数据科学培训的求职者很可能会继续寻找与自己技能匹配的岗位。因为转行往往代价很高、困难重重,而且耗时费力。」 数据分析岗位的收缩程度比其他类型的岗位更严重。一方面是疫情后企业曾大规模扩张招聘,另一方面是后续企业不再需要补充这么多人员了。 生成式AI(Generative AI)的兴起,让情况变得更加严峻,因为AI工具让人们即使没有受过正式的数据科学培训,也能更轻松地进行数据分析工作。 斯塔勒指出: > 「目前AI还无法完全取代这些岗位上的工作人员,但AI已经能够帮助企业和员工以更少的资源做更多的事情。」 对求职者来说,这意味着找工作将变得异常艰难。 斯塔勒警告道: > 「招聘岗位更少,求职者却更多,这表明目前市场竞争十分激烈。找到一份合适的工作可能需要更多时间,而且这些职位的薪资涨幅也会明显低于前几年。」 来源:
meng shao
2个月前
[论文解读] DeepAnalyze: Agentic LLM 助力自主数据科学 来自中国人民大学和清华大学团队的论文,提出 DeepAnalyze-8B 模型,基于 Agentic LLM 实现从原始数据到深度报告的自主数据科学,突破传统固定流程的局限。 核心贡献 · DeepAnalyze-8B:80亿参数开源模型,自主协调规划、数据理解、代码生成等任务,通过提示或微调支持数据问答、建模及开放研究。 · 课程式训练:从单一技能(推理、代码)到综合能力,结合强化学习解决反馈稀疏问题。 · 轨迹生成框架:通过多智能体交互和关键词引导,从数据集生成50万条高质量训练样本(DataScience-Instruct-500K,已开源)。 · 实现从数据清洗到报告生成的端到端流程。 方法概述 基于 DeepSeek-R1-0528- Qwen3-8B,模型通过五类行动标记(如⟨Analyze⟩规划、⟨Code⟩代码生成)循环优化输出。训练分两阶段: 1. 单一技能微调:监督学习提升推理、数据理解、代码能力,关键词优化增强表格处理。 2. 多技能训练:交互轨迹微调后,用.GRPO 强化学习,结合规则、准确性和 LLM 评分优化。 训练在 NVIDIA A800 GPU 上完成,支持 32K tokens 序列,轨迹从 Spider/BIRD 等数据集生成并过滤。 主要成果 在12个基准测试中,DeepAnalyze-8B 表现优异: · 完整流程(DataSciBench):成功率59.91%,完成率66.24%,接近GPT-4o(66.31%),数据准备(71.68%)和可视化(69.09%)领先。 · 分析/建模(DSBench):准确率30.04%,成功率90.63%,超GPT-4o智能体。 · 多步推理(DABStep):准确率38.88%,远超ReAct+GPT-4o(15.77%)。 · 深度研究(DABStep-Research):内容得分3.81/5,格式4.39/5,优于GPT-4o(3.05/5),案例中识别18-27%费用优化和35-42%欺诈降低潜力。 · 代码/表格问答:代码生成61.7%(超GPT-4-turbo 53.9%),表格问答64.47%(SOTA)。 消融实验显示课程训练提升23.54%,轨迹优化增4.57%。模型、代码、数据集已开源。 论文地址:
Y11
2个月前
在社交媒体营销这个领域,我见过不少企业栽跟头,其实很多时候,他们并非不懂“该做什么”,而是没避开那些“不该做的事”。 我发现这一点尤其关键。 很多企业主会花大量时间研究各种社交媒体指南,看别人怎么成功,怎么发内容、搞互动。但根据我的观察,真正决定营销效果的,往往是那些我们“不做什么”的选择。 首先,最常见的错误是“盲目跟风”。 看到别人做什么火,自己就马上模仿,完全不考虑自己的品牌定位和目标用户。 每个品牌都有自己的特色,硬搬别人的模式,只会让自己变得不伦不类,反而失去了自己的辨识度。 其次是“只发广告,不做互动”。有些企业把社交媒体当成了单向的广告投放渠道,只想着推销产品,却很少和用户交流。 用户是活生生的人,不是冰冷的消费机器,他们需要被尊重、被理解。 只有真诚地和用户互动,才能建立起信任,而信任,才是营销的基石。 再者,“内容没有价值”也很要命。 很多企业发的内容,要么是空洞的口号,要么是和用户毫不相关的信息。 用户刷社交媒体是为了获取价值,无论是知识、娱乐还是情感共鸣。 如果我们提供的内容对他们没用,他们自然会划走,而且是再也不会回来的那种。 还有一个容易犯的错误是“忽视数据”。 社交媒体平台提供了很多数据,比如阅读量、互动率、用户画像等等。但有些企业从不看这些数据,凭感觉发内容,凭感觉调整策略。 数据就像航海的罗盘,能告诉我们方向对不对,哪里需要调整。不看数据,就好比在大海里没有罗盘,很容易迷失方向。 最后,“缺乏耐心和坚持”也会导致失败。 社交媒体营销不是一蹴而就的事情,它需要时间积累,需要持续投入。有些企业一开始热情高涨,发了几天内容没效果就放弃了,这是非常可惜的。成功从来都不是偶然的,它需要我们一步一个脚印,不断优化和坚持。 其实,社交媒体营销的核心很简单,就是“以用户为中心”。我们要思考的是:我们能给用户带来什么?我们如何和用户建立连接?我们如何让用户记住我们?只要抓住了这几点,避开那些常见的“雷区”,成功就会离我们越来越近。 希望这些经验能给大家带来一些启发。营销之路没有捷径,但只要方向对了,方法得当,坚持下去,就一定能看到成果。