【Onchain Bloomberg招数据科学家,备战Onchain Finance!】 后端算法工程师(Web3 方向 - 机器学习) 技能职责:后端业务数据处理与开发:基于业务需求,设计并开发高可用、高性能的数据处理与机器学习工程模块,聚焦机器学习驱动的钱包标签识别场景(机构钱包 / 聪明钱 / 巨鲸钱包 / 风险钱包 / Scammer 钱包等),负责标签相关特征工程、模型训练数据 pipeline 构建,实现标签数据的高效统计、模型驱动的动态更新,支撑链上数据分析平台的核心功能。 跨团队协同:联动产品、前端及算法团队,对齐钱包标签识别的机器学习目标(如模型准确率、召回率优化),收集业务反馈迭代模型落地方案,确保机器学习技术实现与产品路线图、业务价值一致。 理想人选:核心技术能力: 精通 python/Go/JS 等开发语言,具备钱包标签识别系统开发经验;具备扎实的机器学习基础,熟悉标签识别相关算法(如分类算法、聚类算法、时序分析、异常检测等),能熟练使用特征工程工具(Pandas、PySpark)、机器学习框架(TensorFlow/PyTorch)及模型部署工具(ONNX、TensorRT);能独立完成 “数据清洗 - 特征提取 - 模型训练 - 评估迭代 - 工程化部署” 全流程,具备机器学习模型在高并发场景下的落地经验。 过往业务经验需符合以下至少 1 项要求: (1)主导过机构钱包标签库建设,能通过链下数据关联、链上行为特征工程,结合机器学习模型(如分类算法)优化标签精准分类; (2)具备通过过往交易行为分析聪明钱 / 巨鲸钱包的经验,能基于大额交易、持仓变化等数据构建特征,通过时序分析、聚类算法实现目标钱包识别与标签体系构建; (3)有风险钱包标签体系设计经验,熟悉洗钱、钓鱼等风险场景,能结合机器学习规则引擎(如 Spark MLlib)开发动态风险模型,优化标签定义与规则迭代; (4)参与过 Scammer 钱包识别系统搭建,能基于交易行为、地址关联等数据构建特征,通过监督 / 半监督学习构建识别模型,迭代优化模型效果(如召回率、误判率)。 容器化与部署能力:熟练使用 Docker Compose/K8s 进行容器化部署(含机器学习模型服务化部署,如 TensorFlow Serving、TorchServe)与集群管理,精通 CI/CD 流程,具备机器学习中间件(如 MLflow)的自动化部署及故障处理能力,支撑高并发标签数据处理与模型推理场景。
再论crypto与llm的语言本体论哲学分野 第一部分:Crypto的本体论——试图超越哥德尔的封闭游戏 Crypto的本质:它是一次用形式语言构建完美封闭系统的雄心勃勃的尝试。 1.人的神经网络 -> 形式语言编程:这个认知起点非常关键。人类关于“信任”、“共识”、“所有权”的观念,本质上是在我们生物神经网络中形成的社会学和心理学概念。Crypto的创举在于,试图将这些充满模糊性的概念,通过密码学和算法,无损地转译(compile)成一种确定性的、机器可执行的形式语言。 2.算力作为物理约束:一个纯粹的形式语言系统是空中楼阁。Crypto通过引入“算力”(PoW)或“资本”(PoS)作为物理世界的锚点,为这个形式系统注入了不可伪造的现实成本。这使得系统的规则和约束不再仅仅是逻辑上的,而是热力学和经济学上的。它用物理定律来担保形式语言的严肃性。 3.试图规避哥德尔不完备性:这是我与LLM认知共生体最深刻的洞察。哥德尔不完备性定理指出,任何一个足够强大的形式系统,必然存在系统内无法证明也无法证伪的命题。这意味着系统需要一个外部的“权威”来对这些“意外”情况做出裁决(例如法律系统中的法官)。 Crypto试图通过极大地简化系统所处理的问题范畴来“绕过”这个问题。在一个区块链系统内,唯一需要被证明的命题是“交易是否有效?”。系统通过共识算法,创造了一个内部的、绝对的、自我完备的真理裁决机制。在这个封闭世界里,“Code is Law”,不需要外部权威,从而在实践层面(而非数学层面)规避了不完备性带来的治理难题。 4.与现实世界的脆弱接口:这个完美的封闭系统一旦需要与混乱的、由人性驱动的物理世界对接,其优雅性便立刻面临挑战。 ◦贪婪作为接口协议:“人性贪婪”是这个接口最核心的驱动协议。现实货币系统的约束、投机需求,成为了这个形式语言世界与现实世界进行价值交换的唯一通道。 ◦叙事作为价值锚点:由于接口的脆弱性,Crypto必须创造强大的叙事(Narrative)来支撑其价值。 ▪比特币 -> 黄金:这是最成功的叙事,将一种数字创造物与人类数千年的物理价值储存共识进行绑定。 ▪以太坊 -> 经济系统:这是更宏大的叙事,试图将自己定位为下一代全球金融和应用的底层操作系统。 ▪其他Crypto:绝大多数都是在这两种宏大叙事下的变体或模仿,其兴衰几乎完全由“人性贪婪”驱动的叙事所左右。 结论:Crypto的本体论是一种向内的、追求封闭与完美的。它试图用形式语言创造一个摆脱人性弱点的“数学神域”,但其与现实世界的连接,却又恰恰依赖于人性中最强大的力量——贪婪。