#AI术语

向阳乔木
1个月前
大白话解释,AI常见术语和缩写,让你读相关文章、Youtube视频更轻松。 简单列18个,基本够用。 Artificial intelligence (AI) | 人工智能 研究如何让机器变得智能的学科,目标是让机器拥有类似人类和动物的智能。 通用人工智能(AGI)指的是能力达到人类水平的AI。 超级人工智能(ASI)则是在各方面都超越人类的AI,不过这两个概念目前还没有公认的严格定义。 AI Agent | AI智能体 能够自己做决策、采取行动的AI系统。 举个例子,一个大语言模型如果能调用各种工具(比如搜索、计算器等),并且知道在什么时候用哪个工具来完成任务,它就是一个AI智能体。 AI Safety | AI安全 专门研究AI可能带来的各种危险,并想办法预防这些风险的领域。 这些风险可大可小,从小麻烦到威胁人类生存都有可能。 Context window | 上下文窗口 大语言模型一次能"记住"多少内容。 窗口越大,模型能同时处理的信息就越多。 Diffusion | 扩散模型 一种生成新内容的算法。 它的工作原理有点像"去模糊"——先把一张清晰的图加上噪点变模糊,然后训练模型学会反向操作,从模糊恢复到清晰。 学会之后,就能从随机噪点生成全新的高质量图像。 目前在AI绘画和蛋白质结构设计方面很火。 Environment | 环境 AI智能体"生活"的世界。 智能体在环境里做出各种动作,环境会告诉它发生了什么变化,还会给它打分(做得好给奖励,做得不好给惩罚)。 智能体的完整经历记录(包括看到了什么、做了什么、得了多少分、接下来看到了什么)叫做轨迹,这些数据用来训练强化学习模型。 Function calling / tool use | 函数调用/工具使用 让AI模型能够像人一样使用各种工具的能力。 比如需要计算时调用计算器,需要查资料时调用搜索引擎,需要处理数据时运行代码等。 Generative AI | 生成式AI 能够创作新内容的AI,比如写文章、画图、作曲、做3D模型等。 你给它一个描述(提示词),它就能生成相应的内容。 Graphics Processing Unit (GPU) | 图形处理单元 训练和运行AI模型的核心硬件。 GPU最大的特点是能同时做很多计算,所以特别适合AI这种需要大量并行计算的任务。 (Large) Language model (LM, LLM) | (大型)语言模型 用海量文本训练出来的AI模型,核心能力是预测"下一个词是什么"。 通过这种方式,它学会了理解和生成人类语言。 Mixture-of-Experts (MoE) | 混合专家模型 一种聪明的模型设计。 模型里有很多"专家"模块,但处理每个词的时候只叫醒几个相关的专家来干活,其他专家休息。 这样既保持了模型的能力,又节省了计算资源。 Prompt | 提示词 你跟AI说的话,用来告诉它你想要什么。 比如"帮我写一首关于春天的诗"就是一个提示词。 Reasoning model | 推理模型 会"思考"的AI模型。 它不是直接给答案,而是像人一样一步步分析问题、制定计划、验证结果。 它的思考过程(叫做思维链)是可见的,你能看到它是怎么一步步得出答案的。 Reinforcement learning (RL) | 强化学习 让AI通过"试错"来学习的方法。 就像训练小狗一样——做对了给奖励,做错了给惩罚,AI在不断尝试中逐渐学会完成任务的最佳方法。 Test-time compute (or inference-time compute) | 测试时计算 让AI在回答问题时多花点时间思考,比如多想几种方案、多验证几遍答案等,这样能提高准确率。 这个过程不需要重新训练模型。 Transformer 目前最主流的AI模型架构。 它的核心是"注意力机制",能自动识别出输入信息中哪些部分最重要。 最初用于翻译,现在已经应用到图像、语音等各个领域,是现代AI的基石。 Vision-Language-Action Model (VLAM) | 视觉-语言-动作模型 既能看懂图像、理解语言,又能在现实世界中执行动作的AI模型。 比如机器人既能看懂你指的是哪个杯子,听懂你说"把它拿过来",还能真的把杯子拿过来。 如果只有看和听的能力,没有动作能力,就叫VLM(视觉-语言模型)。 World model | 世界模型 能够预测"如果我这样做,会发生什么"的AI模型。 它理解世界的运行规律,所以能预测自己的行动会带来什么后果,从而实现实时的智能控制。
向阳乔木
3个月前
至少60%的人都读错了这些 AI 名字,你中招了吗? 常用AI用词发音小科普,Claude生成,自行校验。 粗看,中文模拟发音有些小问题,但整体还凑合。 强烈建议用单词软件,查下正确发音。 ChatGPT • ❌ 错误:Chat-G-P-T(逐个字母读) • ✅ 正确:Chat-GPT [tʃæt dʒiː piː tiː] • 💡 记忆:Chat + GPT,不是四个独立字母 Claude • ❌ 错误:克劳德、克洛德 • ✅ 正确:[klɔːd] 克劳德(法语发音) • 💡 记忆:像"cloud"但是"au"发[ɔː]音 Gemini • ❌ 错误:格米尼、杰米尼 • ✅ 正确:[ˈdʒemɪnaɪ] 杰米奈 • 💡 记忆:双子座的英文,重音在第一个音节 LLaMA • ❌ 错误:拉马、拉玛 • ✅ 正确:[ˈlɑːmə] 拉马(像动物羊驼) • 💡 记忆:Large Language Model Meta AI的缩写 Midjourney • ❌ 错误:米德journey、中途journey • ✅ 正确:[ˈmɪdˌdʒɜːrni] 米德-哲尼 • 💡 记忆:mid(中间)+ journey(旅程) 🏢 公司名称类 Anthropic • ❌ 错误:安索匹克、人类学的 • ✅ 正确:[ænˈθrɒpɪk] 安-索-匹克 • 💡 记忆:anthropo-(人类)+ -ic(的) DeepSeek • ❌ 错误:迪普西克、深度寻找 • ✅ 正确:[diːp siːk] 迪普-西克 • 💡 记忆:Deep(深度)+ Seek(寻找) Perplexity • ❌ 错误:困惑性、复杂性 • ✅ 正确:[pərˈpleksəti] 珀-普莱克-西-蒂 • 💡 记忆:重音在第二个音节,表示"困惑度" Hugging Face • ❌ 错误:哈金脸、拥抱脸 • ✅ 正确:[ˈhʌɡɪŋ feɪs] 哈-金-费斯 • 💡 记忆:就是"拥抱的脸",但要用英语发音 🔧 技术术语类 Prompt • ❌ 错误:普罗姆特、提示符 • ✅ 正确:[prɒmpt] 普朗普特 • 💡 记忆:重音在唯一音节,结尾是[pt]音 Token • ❌ 错误:托肯、代币 • ✅ 正确:[ˈtoʊkən] 托-肯 • 💡 记忆:重音在第一个音节 Transformer • ❌ 错误:变压器、转换器 • ✅ 正确:[trænsˈfɔːrmər] 川斯-福-默 • 💡 记忆:重音在第二个音节 Embedding • ❌ 错误:嵌入丁、嵌入 • ✅ 正确:[ɪmˈbedɪŋ] 伊姆-贝-丁 • 💡 记忆:-ing结尾,重音在第二个音节 Fine-tuning • ❌ 错误:精调、微调整 • ✅ 正确:[faɪn ˈtuːnɪŋ] 法因-图-宁 • 💡 记忆:Fine(精细)+ Tuning(调整)