词元中文名敲定,我国日均调用量突破140万亿次
![]()
国家数据局近日在官方表述中将Token的中文译名正式确定为“词元”,这一举措标志着该术语在中文人工智能领域完成了标准化命名,在国务院新闻办公室举行的发布会上,局长刘烈宏披露,截至今年三月,我国日均词元调用规模已突破140万亿次,这一数值与2024年初的1000亿次基准相比,增幅超过一千倍;相较于2025年底的100万亿次,在短短一个季度内也实现了超过40%的增长。
关键指标跃升揭示产业加速态势
日均词元调用量的指数级攀升,直观反映了中国人工智能产业正步入高速发展通道,刘烈宏指出,应用场景的持续深化是核心驱动力——人工智能正从简单的对话交互,演进为能够自主决策与执行的智能体,这种能力跃迁显著增强了产业整体竞争力,当前备受关注的“词元出海”现象,便是竞争力外溢的明确标志。
从流量到词元:人工智能时代的新度量衡
在互联网时代,信息传输的核心度量标准是网络流量,进入人工智能主导的新阶段,词元正取代流量成为衡量信息处理规模的关键指标,无论是用户输入的一个提问、模型生成的一段答复,还是系统识别的一幅图像,其背后都是词元的消耗与计算过程,这一转变本质上体现了技术范式的更迭:从信息的连接与传递,转向信息的理解、重组与创造。
词元:拆解智能处理的最小信息单元
根据《人民日报》发布的科普文章《漫谈词元》以及苹果中国官网、央视新闻、中国计算机学会等权威机构的用法,词元被定义为“处理文本的最小数据单元”,它可被理解为人工智能大模型为高效处理数据而拆分出的“最小信息载体”,其具体形态可以是单个汉字、词语片段、标点符号或其他离散符号。
以一个简单句子为例:“我爱中国!”在模型处理时,可能被拆解为“我”、“爱”、“中国”、“!”四个独立的词元,这种拆分方式并非固定不变,不同模型会根据其训练语料和分词策略进行优化,目的是将非结构化的自然语言,转化为机器可高效运算的标准化序列。
命名统一背后的产业意义
术语的标准化与统一,是技术产业成熟与话语体系建立的重要基石。“词元”这一中文译名的官方认定,结束了此前“令牌”、“标记”等多种译法并存的混乱局面,为技术交流、政策制定、学术研究与商业合作提供了清晰、无歧义的概念框架,这不仅有利于国内产业生态的协同发展,也提升了中国在全球人工智能治理与技术标准讨论中的话语清晰度。
规模增长驱动基础设施与创新挑战
日均140万亿词元的调用规模,对算力基础设施、算法效率及数据供应链提出了前所未有的要求,巨大的消耗量既体现了应用需求的爆发,也预示着行业将面临成本优化、能耗管理及处理效能提升的持续挑战,词元经济的形成也催生了新的商业模式与技术创新的关注点,例如更高效的词元压缩技术、基于词元消耗的精细化服务计价体系,以及针对特定场景的低词元消耗模型研发等。
人工智能的深度发展已紧密围绕词元这一基本单元展开,其调用量不仅是一个衡量产业热力的数值,更是观察技术渗透程度、应用落地深度和产业生态活力的关键窗口,随着术语的统一与规模的持续扩张,以词元为核心的计算时代已全面开启。
获取最新行业动态与深度分析,欢迎持续锁定攻略蜂巢的相关资讯推送。