Skip to content

[AI高频词汇]

AI高频术语词典

本词典涵盖AI领域100+核心术语,按分类整理,包含简称、全称、IPA音标及通俗解释。
适用场景:学习参考、文档附录、团队培训


一、基础概念

简称全称全称读音(IPA)通俗解释
AIArtificial Intelligence/ˌɑːrtɪˈfɪʃəl ɪnˈtelɪdʒəns/让机器模仿人类智能的系统,能看、听、说、决策
AGIArtificial General Intelligence/ˌɑːrtɪˈfɪʃəl ˈdʒenrəl ɪnˈtelɪdʒəns/通用人工智能,在大多数认知任务上达到或超越人类水平的AI
ANIArtificial Narrow Intelligence/ˌɑːrtɪˈfɪʃəl ˈnæroʊ ɪnˈtelɪdʒəns/弱人工智能,只在特定任务上表现优秀(如下棋、识图)
MLMachine Learning/məˈʃiːn ˈlɜːrnɪŋ/机器学习,让机器通过数据自主学习,而非靠硬编码规则
DLDeep Learning/diːp ˈlɜːrnɪŋ/深度学习,使用多层神经网络的机器学习子集,擅长图像/语音
NLPNatural Language Processing/ˈnætʃərəl ˈlæŋɡwɪdʒ ˈprɑːsesɪŋ/自然语言处理,让计算机理解和生成人类语言的技术
NLUNatural Language Understanding/ˈnætʃərəl ˈlæŋɡwɪdʒ ˌʌndərˈstændɪŋ/自然语言理解,NLP的子领域,侧重理解语义和意图
NLGNatural Language Generation/ˈnætʃərəl ˈlæŋɡwɪdʒ ˌdʒenəˈreɪʃən/自然语言生成,NLP的子领域,侧重生成人类可读的文本
GenAIGenerative AI/ˈdʒenərətɪv eɪ aɪ/生成式AI,能创造新内容(文字/图片/音视频)的AI分支
CVComputer Vision/kəmˈpjuːtər ˈvɪʒən/计算机视觉,让机器理解和处理图像/视频的技术
DSData Science/ˈdeɪtə ˈsaɪəns/数据科学,从数据中提取洞察和知识的跨学科领域
DAData Analytics/ˈdeɪtə əˈnælətɪks/数据分析,检查、清洗和建模数据以发现有用信息

二、模型架构

简称全称全称读音(IPA)通俗解释
LLMLarge Language Model/lɑːrdʒ ˈlæŋɡwɪdʒ ˈmɑːdəl/大语言模型,ChatGPT等AI助手的核心技术
TransformerTransformer/trænsˈfɔːrmər/几乎所有现代大模型的基础架构,核心是「自注意力」机制
BERTBidirectional Encoder Representations from Transformers/ˌbaɪdɪˈrekʃənl ɪnˈkoʊdər ˌreprɪzenˈteɪʃənz frəm trænsˈfɔːrmərz/谷歌出品的双向编码器模型,擅长「理解」类任务
GPTGenerative Pre-trained Transformer/ˈdʒenərətɪv priː ˈtreɪnd trænsˈfɔːrmər/OpenAI的生成式模型系列,擅长「续写」和对话
MoEMixture of Experts/ˈmɪkstʃər əv ˈekspɜːrts/混合专家模型,只激活部分参数推理,效率更高
ANNArtificial Neural Network/ˌɑːrtɪˈfɪʃəl ˈnʊrəl ˈnetwɜːrk/人工神经网络,模拟生物神经元的计算结构
CNNConvolutional Neural Network/kənˈvɑːlʊʃənl ˈnʊrəl ˈnetwɜːrk/卷积神经网络,擅长处理图像数据的网络结构
RNNRecurrent Neural Network/rɪˈkɜːrənt ˈnʊrəl ˈnetwɜːrk/循环神经网络,擅长处理序列数据(如文本、时间序列)
GANGenerative Adversarial Network/ˈdʒenərətɪv ˌædvərˈseərɪəl ˈnetwɜːrk/生成对抗网络,生成器与判别器相互博弈来提升效果
VAEVariational Autoencoder/ˌveriˈeɪʃənl ˌɔːtoʊɪnˈkoʊdər/变分自编码器,用于生成和表示学习的生成模型
Diffusion ModelDiffusion Model/dɪˈfjuːʒən ˈmɑːdəl/扩散模型,通过「去噪」生成图像/视频的核心技术
Foundation ModelFoundation Model/faʊnˈdeɪʃən ˈmɑːdəl/基础模型,在大规模数据上预训练、可适配多种任务的模型
AgentAI Agent/eɪ aɪ ˈeɪdʒənt/AI智能体,能自主执行多步骤任务的AI系统

三、训练方法

简称全称全称读音(IPA)通俗解释
TrainingTraining/ˈtreɪnɪŋ/训练,让模型从数据中学习规律的过程
InferenceInference/ˈɪnfərəns/推理,使用训练好的模型对新数据进行预测的过程
SFTSupervised Fine-Tuning/ˈsuːpərvaɪzd ˈfaɪn ˈtuːnɪŋ/监督微调,用标注数据对预训练模型进行针对性优化
RLReinforcement Learning/ˌriːɪnˈfɔːrsmənt ˈlɜːrnɪŋ/强化学习,通过试错和奖励反馈来学习最优策略
RLHFReinforcement Learning from Human Feedback/ˌriːɪnˈfɔːrsmənt ˈlɜːrnɪŋ frəm ˈhjuːmən ˈfiːdbæk/人类反馈强化学习,让模型学习人类偏好,ChatGPT成功的关键
DPODirect Preference Optimization/dɪˈrekt ˈprefrəns ˌɑːptɪmaɪˈzeɪʃən/直接偏好优化,RLHF的简化替代方案
LoRALow-Rank Adaptation/loʊ ræŋk ˌædæpˈteɪʃən/低秩适应,极省显存的微调方法
RAGRetrieval-Augmented Generation/rɪˈtriːvəl ɔːɡˈmentɪd ˌdʒenəˈreɪʃən/检索增强生成,先搜资料库再回答,解决幻觉问题
CoTChain of Thought/tʃeɪn əv θɔːt/思维链,让模型分步推理,提高逻辑正确率
DistillationKnowledge Distillation/ˈnɑːlɪdʒ ˌdɪstɪˈleɪʃən/知识蒸馏,用大模型教小模型,实现模型轻量化
Instruction TuningInstruction Tuning/ɪnˈstrʌkʃən ˈtuːnɪŋ/指令微调,训练模型理解并遵循人类指令
Transfer LearningTransfer Learning/trænsˈfɜːr ˈlɜːrnɪŋ/迁移学习,将已学知识应用到新任务上
Self-Supervised LearningSelf-Supervised Learning/self ˈsuːpərvaɪzd ˈlɜːrnɪŋ/自监督学习,从数据自身构造监督信号进行学习
AutoMLAutomated Machine Learning/ˈɔːtəmeɪtɪd məˈʃiːn ˈlɜːrnɪŋ/自动化机器学习,自动完成模型选择和超参数调优

四、评估指标

简称全称全称读音(IPA)通俗解释
AccuracyAccuracy/ˈækjərəsi/准确率,分类正确的样本占总样本的比例
PrecisionPrecision/prɪˈsɪʒən/精确率,预测为正的样本中实际为正的比例
RecallRecall/rɪˈkɔːl/召回率,实际为正的样本中被正确预测的比例
F1 ScoreF1 Score/ef wʌn skɔːr/F1分数,精确率和召回率的调和平均数
BLEUBLEU/bluː/双语评估替补,机器翻译质量的自动评估指标
ROUGEROUGE/ruːʒ/面向召回,文本摘要质量的评估指标
BenchmarkBenchmark/ˈbentʃmɑːrk/基准测试,用于评估AI模型性能的标准任务和数据集
Cross-ValidationCross-Validation/krɔːs ˌvælɪˈdeɪʃən/交叉验证,将数据集分成多份轮流训练和验证
OverfittingOverfitting/ˌoʊvərˈfɪtɪŋ/过拟合,模型过度学习训练数据,在新数据上表现差
UnderfittingUnderfitting/ˌʌndərˈfɪtɪŋ/欠拟合,模型未能学习到数据中的规律

五、输入输出

简称全称全称读音(IPA)通俗解释
TokenToken/ˈtoʊkən/词元/标记,模型处理的最小文本单位
PromptPrompt/prɑːmpt/提示/指令,用户输入给模型的问题或描述
CompletionCompletion/kəmˈpliːʃən/补全/回答,模型输出的结果文本
ContextContext Window/ˈkɑːntekst ˈwɪndoʊ/上下文窗口,模型一次能处理的最大token数量
HallucinationHallucination/həˌluːsɪˈneɪʃən/幻觉,模型编造不存在的事实
EmbeddingEmbedding/ɪmˈbedɪŋ/嵌入/向量化,将文字/图像转为数学向量
ParametersParameters/pəˈræmɪtərz/参数,模型中可学习的权重,规模用B(十亿)表示
AttentionAttention Mechanism/əˈtenʃən ˈmekənɪzəm/注意力机制,让模型关注输入中的重要部分
CacheKV Cache/keɪʃ/键值缓存,存储中间计算结果以加速推理
LabelLabel/ˈleɪbəl/标签,监督学习中的正确答案(标注)
LogitsLogits/ˈloʊdʒɪts/逻辑值,模型最后一层输出的原始分数(未归一化)

六、数据结构

简称全称全称读音(IPA)通俗解释
Structured DataStructured Data/ˈstrʌktʃərd ˈdeɪtə/结构化数据,有固定格式的数据(如表格)
Unstructured DataUnstructured Data/ʌnˈstrʌktʃərd ˈdeɪtə/非结构化数据,无固定格式(如文本、图片、视频)
Semi-Structured DataSemi-Structured Data/ˈsemaɪ ˈstrʌktʃərd ˈdeɪtə/半结构化数据,介于两者之间(如JSON、XML)
DatasetDataset/ˈdeɪtəset/数据集,用于训练/评估的样本集合
Big DataBig Data/bɪɡ ˈdeɪtə/大数据,规模巨大、传统工具难以处理的数据集
Labeled DataLabeled Data/ˈleɪbəld ˈdeɪtə/标注数据,带有正确答案标签的数据
Unlabeled DataUnlabeled Data/ʌnˈleɪbəld ˈdeɪtə/无标注数据,未标记的原始数据

七、工程部署

简称全称全称读音(IPA)通俗解释
APIApplication Programming Interface/ˌæplɪˈkeɪʃən ˈproʊɡræmɪŋ ˈɪntərfeɪs/应用程序接口,让不同软件相互通信的协议
LLMOpsLarge Language Model Operations/lɑːrdʒ ˈlæŋɡwɪdʒ ˈmɑːdəl ɑːps/大语言模型运维,LLM的全生命周期管理
MLOpsMachine Learning Operations/məˈʃiːn ˈlɜːrnɪŋ ɑːps/机器学习运维,ML模型的开发、部署和维护流程
GPUGraphics Processing Unit/ˈɡræfɪks ˈprɑːsesɪŋ ˈjuːnɪt/图形处理器,AI训练的核心硬件(并行计算能力强)
TPUTensor Processing Unit/ˈtensər ˈprɑːsesɪŋ ˈjuːnɪt/张量处理器,谷歌专为AI设计的芯片
FPGAField-Programmable Gate Array/fiːld ˈproʊɡræməbəl ɡeɪt əˌreɪ/现场可编程门阵列,可重构的AI加速硬件
Cloud ComputingCloud Computing/klaʊd kəmˈpjuːtɪŋ/云计算,按需租用计算资源而非自建机房
Model HubModel Hub/ˈmɑːdəl hʌb/模型中心,共享预训练模型的平台(如Hugging Face)
Vector DatabaseVector Database/ˈvektər ˈdeɪtəbeɪs/向量数据库,存储和检索Embedding向量的数据库
QuantizationQuantization/ˌkwɑːntɪˈzeɪʃən/量化,将模型参数从高精度转为低精度以减小体积
PruningPruning/ˈpruːnɪŋ/剪枝,移除模型中不重要的连接以压缩模型

八、热门产品

简称全称全称读音(IPA)通俗解释
ChatGPTChatGPT/ˈtʃætˈdʒiːˈpiːˈtiː/OpenAI的对话AI产品,基于GPT架构
GPT-4oGPT-4 Omni/ˈdʒiː piː tiː fɔːr ˈɑːmni/GPT-4全能版,支持实时语音和图像理解
ClaudeClaude/klɔːd/Anthropic出品,长上下文、安全性高的模型
GeminiGemini/ˈdʒemɪnaɪ/Google多模态模型,原生支持文字/图像/视频
LlamaLlama/ˈlɑːmə/Meta开源模型系列,开源社区最流行
QwenQwen/tʃjuːˈen/阿里通义千问,中文能力强、开源
DeepSeekDeepSeek/diːp siːk/深度求索,高性价比、开源MoE架构
MistralMistral/ˈmɪstrəl/欧洲开源模型,「小体积强性能」著称
DALL-EDALL-E/ˈdɔːli/OpenAI的图片生成模型,文字遵从度高
SDStable Diffusion/ˈsteɪbəl dɪˈfjuːʒən/最流行的开源图片生成模型
SoraSora/ˈsɔːrə/OpenAI的视频生成模型(尚未全面开放)

九、风险与治理

简称全称全称读音(IPA)通俗解释
BiasBias/ˈbaɪəs/偏见,因训练数据问题导致的歧视性输出
Automation BiasAutomation Bias/ˌɔːtəˈmeɪʃən ˈbaɪəs/自动化偏见,人类过度相信AI输出而忽视自身判断
Model DriftModel Drift/ˈmɑːdəl drɪft/模型漂移,模型因环境变化而性能下降
Prompt InjectionPrompt Injection/prɑːmpt ɪnˈdʒekʃən/提示注入,黑客通过特殊指令操控AI输出
Data PoisoningData Poisoning/ˈdeɪtə ˈpɔɪzənɪŋ/数据投毒,攻击者在训练数据中注入恶意样本
JailbreakJailbreak/ˈdʒeɪlbreɪk/越狱,绕过AI的安全限制使其输出违规内容
XAIExplainable AI/ɪkˈspleɪnəbəl eɪ aɪ/可解释AI,让人理解AI的决策逻辑
GuardrailsGuardrails/ˈɡɑːrdreɪlz/护栏/安全围栏,限制AI输出的安全机制
AlignmentAlignment/əˈlaɪnmənt/对齐,确保AI行为符合人类价值观和意图
Black BoxBlack Box/blæk bɑːks/黑箱,内部推理过程不可见的系统
Responsible AIResponsible AI/rɪˈspɑːnsəbəl eɪ aɪ/负责任AI,确保AI有益、安全、合乎伦理的实践

十、开发工具

简称全称全称读音(IPA)通俗解释
PyTorchPyTorch/ˈpaɪtɔːrtʃ/Meta出品的主流深度学习框架,动态计算图
TensorFlowTensorFlow/ˈtensərfloʊ/Google出品的主流深度学习框架
Scikit-learnScikit-learn/ˈsaɪkɪt lɜːrn/Python经典机器学习库,适合传统ML算法
JupyterJupyter Notebook/ˈdʒuːpɪtər ˈnoʊtbʊk/交互式编程环境,数据科学常用
Google ColabGoogle Colab/ˈɡuːɡəl ˈkoʊlæb/谷歌免费云端GPU编程环境
Hugging FaceHugging Face/ˈhʌɡɪŋ feɪs/模型和数据集的共享平台,AI的「GitHub」
LangChainLangChain/læŋ tʃeɪn/用于构建LLM应用的开源框架(RAG、Agent等)

附录:发音速查表

常见难词音标读音要点
Transformer/trænsˈfɔːrmər/重音在 for,不是 trans
Reinforcement/ˌriːɪnˈfɔːrsmənt/rien 之间轻微停顿
Hallucination/həˌluːsɪˈneɪʃən/重音在 nei
Embedding/ɪmˈbedɪŋ/开头是 ɪm,不是 em
Quantization/ˌkwɑːntɪˈzeɪʃən/注意 kwan 的发音

📅 生成日期:2026年5月
📝 版本:v2.0

currentDiggType = 0;

posted @ 2026-05-14 11:57  疯狂的石头czx  阅读(26)  评论(0)    [收藏](javascript:void(0))  举报