词元中文名敲定，我国日均调用量突破140万亿次

14 2026-03-25

国家数据局近日在官方表述中将Token的中文译名正式确定为“词元”，这一举措标志着该术语在中文人工智能领域完成了标准化命名，在国务院新闻办公室举行的发布会上，局长刘烈宏披露，截至今年三月，我国日均词元调用规模已突破140万亿次，这一数值与2024年初的1000亿次基准相比，增幅超过一千倍；相较于2025年底的100万亿次，在短短一个季度内也实现了超过40%的增长。

关键指标跃升揭示产业加速态势

日均词元调用量的指数级攀升，直观反映了中国人工智能产业正步入高速发展通道，刘烈宏指出，应用场景的持续深化是核心驱动力——人工智能正从简单的对话交互，演进为能够自主决策与执行的智能体，这种能力跃迁显著增强了产业整体竞争力，当前备受关注的“词元出海”现象,便是竞争力外溢的明确标志。

从流量到词元：人工智能时代的新度量衡

在互联网时代，信息传输的核心度量标准是网络流量，进入人工智能主导的新阶段，词元正取代流量成为衡量信息处理规模的关键指标，无论是用户输入的一个提问、模型生成的一段答复，还是系统识别的一幅图像，其背后都是词元的消耗与计算过程，这一转变本质上体现了技术范式的更迭：从信息的连接与传递，转向信息的理解、重组与创造。

词元：拆解智能处理的最小信息单元

根据《人民日报》发布的科普文章《漫谈词元》以及苹果中国官网、央视新闻、中国计算机学会等权威机构的用法，词元被定义为“处理文本的最小数据单元”，它可被理解为人工智能大模型为高效处理数据而拆分出的“最小信息载体”，其具体形态可以是单个汉字、词语片段、标点符号或其他离散符号。

以一个简单句子为例：“我爱中国！”在模型处理时，可能被拆解为“我”、“爱”、“中国”、“！”四个独立的词元，这种拆分方式并非固定不变，不同模型会根据其训练语料和分词策略进行优化，目的是将非结构化的自然语言,转化为机器可高效运算的标准化序列。

命名统一背后的产业意义

术语的标准化与统一，是技术产业成熟与话语体系建立的重要基石。“词元”这一中文译名的官方认定，结束了此前“令牌”、“标记”等多种译法并存的混乱局面，为技术交流、政策制定、学术研究与商业合作提供了清晰、无歧义的概念框架，这不仅有利于国内产业生态的协同发展,也提升了中国在全球人工智能治理与技术标准讨论中的话语清晰度。

规模增长驱动基础设施与创新挑战

日均140万亿词元的调用规模，对算力基础设施、算法效率及数据供应链提出了前所未有的要求，巨大的消耗量既体现了应用需求的爆发，也预示着行业将面临成本优化、能耗管理及处理效能提升的持续挑战，词元经济的形成也催生了新的商业模式与技术创新的关注点，例如更高效的词元压缩技术、基于词元消耗的精细化服务计价体系,以及针对特定场景的低词元消耗模型研发等。

人工智能的深度发展已紧密围绕词元这一基本单元展开，其调用量不仅是一个衡量产业热力的数值，更是观察技术渗透程度、应用落地深度和产业生态活力的关键窗口，随着术语的统一与规模的持续扩张,以词元为核心的计算时代已全面开启。

获取最新行业动态与深度分析,欢迎持续锁定攻略蜂巢的相关资讯推送。