AI导读:

清华大学校务委员会副主任杨斌提议将AI时代核心度量单位“Token”译为“模元”,以更准确地反映其作为模型通用处理单元的本质,并促进公众对AI技术的理解。

清华大学校务委员会副主任、清华大学可持续社会价值研究院院长杨斌发文提议将“Token”这一定义AI时代的核心度量单位译为“模元”,用以区别于区块链、网络安全等其他场景中的Token译名。杨斌解释称,比如,“词元”被“词”字锁死在文本场景,无法适配多模态、物理AI的应用形态;“语元”囿于语言范畴,窄化了Token作为模型通用处理单元的本质;“义节”过度聚焦语义,忽略了Token纯特征、结构化处理的属性;而“托肯”“屯”等单纯音译,徒有其音、缺乏实义,普遍接受度低,还会加重非专业人群的理解负担。Token已经成为当前AI产业常用计量单位。